Retrieval Bench
قياس الاسترجاع ثنائي اللغة على مهام تحريرية حقيقية
لا نهتم بمن يتصدر leaderboard عام فقط، بل بمن يعيد المادة الصحيحة في بيئة نشر فيها عربي وإنجليزي ووسوم وسياقات مختلفة.
- اختبار اكتشاف المقالات المرتبطة عبر اللغتين
- قياس recall في بحث الموقع لا في benchmark معزول
- تحويل النتيجة إلى قرارات تحسين قابلة للتنفيذ