Benchmark Artifact

ميني benchmark للاسترجاع التحريري العربي-الإنجليزي

مجموعة عامة صغيرة من أزواج الاستعلام والهدف مبنية من تغطية DroidNexus الحية لاختبار الاسترجاع التحريري الثنائي اللغة والاكتشاف العابر للغات وترتيب البحث الحساس لسير العمل.

هذا الأصل يحول طبقة الاسترجاع في DroidNexus من زاوية تحليلية إلى dataset عام صغير يمكن تنزيله واستخدامه مباشرة في اختبارات الاسترجاع التحريري العربي-الإنجليزي.

هذا الأصل مصمم للفرق التي تريد تقييم سلوك البحث التحريري على كوربس ثنائي اللغة صغير قبل التوسع إلى خطوط استرجاع أكبر أو إلى نشر dataset كامل على Hugging Face.

بذرة أصل عام مبني للبحث الثنائي اللغة منشور الآن على Hugging Face

بطاقة الأصل

الحالات
10
الأهداف المعيارية
10
أنماط الاستعلام
عربي + إنجليزي + مختلط
التنسيقات
JSON + CSV
المستودع
wisam3272/droidnexus-arabic-english-editorial-retrieval-mini
التنزيلات
0
الإعجابات
1
آخر تحديث
28 مارس 2026

يتم جلب بيانات المستودع الحية وقت البناء من Hub API حتى تبقى بطاقة الأصل مرتبطة بالحالة الفعلية على Hugging Face.

الإطار المرجعي

dataset

DroidNexus public dataset

الـdataset العام على Hugging Face الذي يحول تحليل DroidNexus في الاسترجاع إلى benchmark قابل لإعادة الاستخدام.

collection

DroidNexus retrieval collection

الـcollection الحي على Hugging Face الذي يجمع الـdataset العام مع نماذج الخط الأساسي وأوراق التقييم في مسار استرجاع واحد قابل لإعادة الإنتاج.

model

BAAI/bge-m3

خط أساس متعدد اللغات لاختبارات dense وsparse وhybrid على نفس مجموعة الاستعلامات التحريرية.

model

ibm-granite/granite-embedding-107m-multilingual

مرجع embeddings صغير متعدد اللغات لاختبار ما إذا كانت طبقات الاسترجاع الأصغر تصمد داخل سير عمل تحريري ثنائي اللغة.

paper

CLIRudit

إشارة تقييم للاسترجاع العابر للغات تبقي benchmark مرتبطًا بالأدلة متعددة اللغات لا بالحدس المحلي للموقع فقط.

paper

mRobust04

إطار robustness للاسترجاع متعدد اللغات يساعد على إبقاء benchmark صادقًا عندما تتجاوز الاستعلامات صياغات الديمو النظيفة.

model

mistralai/Voxtral-Mini-4B-Realtime-2602

المسار العام التالي بعد الاسترجاع: تقييم الصوت التحريري عندما يصبح التفريغ الفوري قابلًا للقياس.

حالات benchmark

المواد المربوطة

الاسترجاع العربي-الإنجليزي في 2026: ماذا يجب أن تختبر قبل اختيار طبقة الـ Embeddings؟
مقال DevHub

الاسترجاع العربي-الإنجليزي في 2026: ماذا يجب أن تختبر قبل اختيار طبقة الـ Embeddings؟

اختيار موديل Embeddings للاسترجاع العربي-الإنجليزي ليس مشكلة leaderboard بل مشكلة pipeline كاملة. هذا الدليل يوضح ما الذي يجب اختباره قبل الوثوق بأي طبقة استرجاع في الإنتاج.

لماذا تفوز نماذج الاسترجاع الأصغر في خطوط التحرير الحقيقية خلال 2026
مقال DevHub

لماذا تفوز نماذج الاسترجاع الأصغر في خطوط التحرير الحقيقية خلال 2026

العروض الكبيرة تخطف الانتباه، لكن الاسترجاع في الإنتاج يكافئ الانضباط لا الضجيج. الأبحاث الحديثة وإشارات Hugging Face الحالية تقود إلى النتيجة نفسها: النماذج الأصغر متعددة اللغات مع أساس lexical قوي تتفوق غالبًا على المكدسات المتضخمة عندما يصل الأمر إلى الواقع.

بنية البحث الثنائية في 2026: سرعة الكلمات المفتاحية مع استدعاء دلالي بلا تعقيد تشغيلي
مقال DevHub

بنية البحث الثنائية في 2026: سرعة الكلمات المفتاحية مع استدعاء دلالي بلا تعقيد تشغيلي

البحث بالكلمات المفتاحية وحده لم يعد كافيًا لمنصة تقنية ثنائية اللغة. هذا المخطط يجمع بين Pagefind وMultilingual Embeddings حتى يبقى الاكتشاف بالإنجليزية والعربية سريعًا وذكيًا وقابلًا للإدارة.

مقال DevHub

مخطط DevHub: طبقة تحريرية ثنائية اللغة بالذكاء الاصطناعي من دون إبطاء الموقع

بناء منشور تقني عالمي بالعربية والإنجليزية لا يتطلب ترجمة فقط، بل يحتاج طبقة تحريرية ذكية للبحث والتفريغ والاكتشاف متعدد اللغات.

ترجمة المسودات العربية في 2026: لماذا اختيار الموديل نصف الحل فقط؟
مقال DevHub

ترجمة المسودات العربية في 2026: لماذا اختيار الموديل نصف الحل فقط؟

جودة ترجمة المسودات العربية لا تُحسم عبر BLEU أو حجم الموديل وحده. هذا الدليل يوضح كيف تختار بين خيارات الترجمة الحديثة ولماذا يهم انضباط ما بعد التحرير بقدر أهمية الموديل نفسه.

ترجمة المسودات محليًا أولًا في 2026: سير ثنائي اللغة أكثر أمانًا للفِرق التحريرية التقنية
مقال DevHub

ترجمة المسودات محليًا أولًا في 2026: سير ثنائي اللغة أكثر أمانًا للفِرق التحريرية التقنية

إرسال المسودات غير المنشورة إلى واجهات ترجمة خارجية قد يكون مريحًا، لكنه ليس دائمًا الخيار التحريري أو القانوني الأفضل. هذا السير يُبقي الترجمة أقرب إلى خط إنتاجك من دون التضحية بالسرعة.

التحويل من الصوت إلى النص بالعربية في 2026: توقّف عن ترتيب الأنظمة وفق WER فقط
مقال DevHub

التحويل من الصوت إلى النص بالعربية في 2026: توقّف عن ترتيب الأنظمة وفق WER فقط

جودة التحويل من الصوت إلى النص بالعربية لا يختصرها رقم خطأ واحد. هذا الدليل يوضح كيف نقيّم أنظمة التفريغ الصوتي لسير العمل التحريري الحقيقي، حيث يهم المتحدث والزمن والتكلفة البشرية بقدر أهمية التعرف الخام.

مراجعة Whisper large-v3: هل يصلح فعلًا كعمود ترجمة صوتية لغرفة أخبار عالمية؟

مراجعة Whisper large-v3: هل يصلح فعلًا كعمود ترجمة صوتية لغرفة أخبار عالمية؟

ما يزال Whisper large-v3 من أكثر قواعد التحويل من الصوت إلى النص فائدة لعمليات التحرير الثنائية اللغة، لكن القيمة الحقيقية في غرفة الأخبار لا تتحدد بالدقة الخام وحدها.

مراجعة Granite Embedding 107M Multilingual: هل هو المسترجع العملي للبحث التحريري العالمي؟

مراجعة Granite Embedding 107M Multilingual: هل هو المسترجع العملي للبحث التحريري العالمي؟

يبدو موديل IBM Granite 107M متعدد اللغات متواضعًا على الورق، لكن في الأنظمة التحريرية الحقيقية التي تهتم بالاسترجاع عبر اللغات وسهولة النشر والانضباط التشغيلي، قد تكون هذه الرصانة هي نقطة القوة نفسها.

أبحاث أمن MCP في 2026: على ماذا تتفق الأوراق الحديثة فعلًا؟

أبحاث أمن MCP في 2026: على ماذا تتفق الأوراق الحديثة فعلًا؟

النقاش حول MCP يتسارع، لكن الإشارة البحثية أوضح من الضجيج التسويقي بكثير. الأوراق الحديثة حول التدقيق والهجمات المنظومية والأدوات الخبيثة والتخفيفات المؤسسية تقود إلى الخلاصة نفسها: قابلية ربط الأدوات من دون سياسة منضبطة تعني هشاشة افتراضية.