Benchmark Artifact

ميني benchmark للاسترجاع التحريري العربي-الإنجليزي

مجموعة عامة صغيرة من أزواج الاستعلام والهدف مبنية من تغطية DroidNexus الحية لاختبار الاسترجاع التحريري الثنائي اللغة والاكتشاف العابر للغات وترتيب البحث الحساس لسير العمل.

هذا الأصل يحول طبقة الاسترجاع في DroidNexus من زاوية تحليلية إلى dataset عام صغير يمكن تنزيله واستخدامه مباشرة في اختبارات الاسترجاع التحريري العربي-الإنجليزي.

هذا الأصل مصمم للفرق التي تريد تقييم سلوك البحث التحريري على كوربس ثنائي اللغة صغير قبل التوسع إلى خطوط استرجاع أكبر أو إلى نشر dataset كامل على Hugging Face.

بذرة أصل عام مبني للبحث الثنائي اللغة منشور الآن على Hugging Face

بطاقة الأصل

الحالات: 10
الأهداف المعيارية: 10
أنماط الاستعلام: عربي + إنجليزي + مختلط
التنسيقات: JSON + CSV
المستودع: wisam3272/droidnexus-arabic-english-editorial-retrieval-mini

التنزيلات: 0
الإعجابات: 1
آخر تحديث: 28 مارس 2026

يتم جلب بيانات المستودع الحية وقت البناء من Hub API حتى تبقى بطاقة الأصل مرتبطة بالحالة الفعلية على Hugging Face.

الإطار المرجعي

dataset

DroidNexus public dataset

الـdataset العام على Hugging Face الذي يحول تحليل DroidNexus في الاسترجاع إلى benchmark قابل لإعادة الاستخدام.

collection

DroidNexus retrieval collection

Ø§Ù„Ù€collection Ø§Ù„ØÙŠ Ø¹Ù„Ù‰ Hugging Face Ø§Ù„Ø°ÙŠ ÙŠØ¬Ù…Ø¹ Ø§Ù„Ù€dataset Ø§Ù„Ø¹Ø§Ù… Ù…Ø¹ Ù†Ù…Ø§Ø°Ø¬ Ø§Ù„Ø®Ø· Ø§Ù„Ø£Ø³Ø§Ø³ÙŠ ÙˆØ£ÙˆØ±Ø§Ù‚ Ø§Ù„ØªÙ‚ÙŠÙŠÙ… ÙÙŠ Ù…Ø³Ø§Ø± Ø§Ø³ØªØ±Ø¬Ø§Ø¹ ÙˆØ§ØØ¯ Ù‚Ø§Ø¨Ù„ Ù„Ø¥Ø¹Ø§Ø¯Ø© Ø§Ù„Ø¥Ù†ØªØ§Ø¬.

model

BAAI/bge-m3

خط أساس متعدد اللغات لاختبارات dense وsparse وhybrid على نفس مجموعة الاستعلامات التحريرية.

model

ibm-granite/granite-embedding-107m-multilingual

مرجع embeddings صغير متعدد اللغات لاختبار ما إذا كانت طبقات الاسترجاع الأصغر تصمد داخل سير عمل تحريري ثنائي اللغة.

paper

CLIRudit

إشارة تقييم للاسترجاع العابر للغات تبقي benchmark مرتبطًا بالأدلة متعددة اللغات لا بالحدس المحلي للموقع فقط.

paper

mRobust04

إطار robustness للاسترجاع متعدد اللغات يساعد على إبقاء benchmark صادقًا عندما تتجاوز الاستعلامات صياغات الديمو النظيفة.

model

mistralai/Voxtral-Mini-4B-Realtime-2602

المسار العام التالي بعد الاسترجاع: تقييم الصوت التحريري عندما يصبح التفريغ الفوري قابلًا للقياس.

حالات benchmark

q01 ar

اختيار الموديل

أفضل طبقة embeddings للبحث العربي الإنجليزي

الهدف

الاسترجاع العربي-الإنجليزي في 2026: ماذا يجب أن تختبر قبل اختيار طبقة الـ Embeddings؟

الملاحظة: يستهدف benchmark الاسترجاع الذي يعامل اختيار الموديل كقرار pipeline لا كاختيار من leaderboard فقط.

q02 en

استرجاع بموديلات صغيرة

small multilingual retrieval model for editorial search

الهدف

لماذا تفوز نماذج الاسترجاع الأصغر في خطوط التحرير الحقيقية خلال 2026

الملاحظة: يفحص ما إذا كان استعلام الموديلات الصغيرة يجد مادة الاسترجاع التشغيلية بدل مادة عامة عن الـ embeddings.

q03 mixed

معمارية النظام

Arabic English search stack with BM25 and embeddings

الهدف

بنية البحث الثنائية في 2026: سرعة الكلمات المفتاحية مع استدعاء دلالي بلا تعقيد تشغيلي

الملاحظة: استعلام معماري مختلط اللغة يستهدف مقال المكدس الكامل لا مراجعة موديل منفرد.

q04 en

مخطط سير عمل

bilingual AI editorial stack for search translation transcription

الهدف

مخطط DevHub: طبقة تحريرية ثنائية اللغة بالذكاء الاصطناعي من دون إبطاء الموقع

الملاحظة: يختبر ما إذا كان الاستعلام المنظومي يصل إلى صفحة المخطط التي تربط الاسترجاع بالترجمة والتفريغ.

q05 ar

جودة مسودات الترجمة

ترجمة مسودات عربية مع الحفاظ على المصطلحات التقنية

الهدف

ترجمة المسودات العربية في 2026: لماذا اختيار الموديل نصف الحل فقط؟

الملاحظة: يركز على مسودات الترجمة الحساسة للمصطلحات بدل جودة الترجمة الآلية العامة.

q06 en

سياسة local-first

local first translation for unpublished drafts

الهدف

ترجمة المسودات محليًا أولًا في 2026: سير ثنائي اللغة أكثر أمانًا للفِرق التحريرية التقنية

الملاحظة: يقيم ما إذا كان القصد المرتبط بخصوصية الترجمة يصل إلى مادة السياسة المحلية أولًا.

q07 ar

تقييم الصوت

تقييم التفريغ الصوتي العربي مع المتحدثين والزمن

الهدف

التحويل من الصوت إلى النص بالعربية في 2026: توقّف عن ترتيب الأنظمة وفق WER فقط

الملاحظة: مصمم لإظهار إطار تقييم التفريغ الصوتي التحريري لا اسم موديل فقط.

q08 en

استدعاء مراجعة

Whisper large v3 newsroom review for transcription workflow

الهدف

مراجعة Whisper large-v3: هل يصلح فعلًا كعمود ترجمة صوتية لغرفة أخبار عالمية؟

الملاحظة: استعلام مراجعة مباشر يجب أن يصل إلى مراجعة Whisper الموجهة لغرف الأخبار.

q09 en

إشارة مراجعة مدمجة

Granite 107M multilingual review for editorial retrieval

الهدف

مراجعة Granite Embedding 107M Multilingual: هل هو المسترجع العملي للبحث التحريري العالمي؟

الملاحظة: يختبر قدرة الكوربس على إظهار مراجعة موديل مدمج عندما يكون الاستعلام تشغيليًا ومحدد العلامة.

q10 ar

بحث أمني

أمن MCP وحدود صلاحيات الأدوات والموافقات

الهدف

أبحاث أمن MCP في 2026: على ماذا تتفق الأوراق الحديثة فعلًا؟

الملاحظة: يضيف حالة استرجاع عابرة للمجالات حتى لا ينهار benchmark إلى استعلامات model cards فقط.

المواد المربوطة

مقال DevHub

الاسترجاع العربي-الإنجليزي في 2026: ماذا يجب أن تختبر قبل اختيار طبقة الـ Embeddings؟

اختيار موديل Embeddings للاسترجاع العربي-الإنجليزي ليس مشكلة leaderboard بل مشكلة pipeline كاملة. هذا الدليل يوضح ما الذي يجب اختباره قبل الوثوق بأي طبقة استرجاع في الإنتاج.

الاسترجاع Embeddings البحث متعدد اللغات سير التحرير Hugging Face

28 مارس 2026 • 5 دقائق قراءة

مقال DevHub

لماذا تفوز نماذج الاسترجاع الأصغر في خطوط التحرير الحقيقية خلال 2026

العروض الكبيرة تخطف الانتباه، لكن الاسترجاع في الإنتاج يكافئ الانضباط لا الضجيج. الأبحاث الحديثة وإشارات Hugging Face الحالية تقود إلى النتيجة نفسها: النماذج الأصغر متعددة اللغات مع أساس lexical قوي تتفوق غالبًا على المكدسات المتضخمة عندما يصل الأمر إلى الواقع.

الاسترجاع Embeddings BM25 متعدد اللغات سير التحرير

27 مارس 2026 • 3 دقائق قراءة

مقال DevHub

بنية البحث الثنائية في 2026: سرعة الكلمات المفتاحية مع استدعاء دلالي بلا تعقيد تشغيلي

البحث بالكلمات المفتاحية وحده لم يعد كافيًا لمنصة تقنية ثنائية اللغة. هذا المخطط يجمع بين Pagefind وMultilingual Embeddings حتى يبقى الاكتشاف بالإنجليزية والعربية سريعًا وذكيًا وقابلًا للإدارة.

Pagefind البحث متعدد اللغات Embeddings Astro سير التحرير

27 مارس 2026 • 3 دقائق قراءة

مقال DevHub

مخطط DevHub: طبقة تحريرية ثنائية اللغة بالذكاء الاصطناعي من دون إبطاء الموقع

بناء منشور تقني عالمي بالعربية والإنجليزية لا يتطلب ترجمة فقط، بل يحتاج طبقة تحريرية ذكية للبحث والتفريغ والاكتشاف متعدد اللغات.

DevHub Hugging Face الترجمة سير التحرير Embeddings تحويل الكلام إلى نص

27 مارس 2026 • 2 دقائق قراءة

مقال DevHub

ترجمة المسودات العربية في 2026: لماذا اختيار الموديل نصف الحل فقط؟

جودة ترجمة المسودات العربية لا تُحسم عبر BLEU أو حجم الموديل وحده. هذا الدليل يوضح كيف تختار بين خيارات الترجمة الحديثة ولماذا يهم انضباط ما بعد التحرير بقدر أهمية الموديل نفسه.

الترجمة متعدد اللغات سير التحرير Hugging Face NLLB

28 مارس 2026 • 4 دقائق قراءة

مقال DevHub

ترجمة المسودات محليًا أولًا في 2026: سير ثنائي اللغة أكثر أمانًا للفِرق التحريرية التقنية

إرسال المسودات غير المنشورة إلى واجهات ترجمة خارجية قد يكون مريحًا، لكنه ليس دائمًا الخيار التحريري أو القانوني الأفضل. هذا السير يُبقي الترجمة أقرب إلى خط إنتاجك من دون التضحية بالسرعة.

الترجمة متعدد اللغات Transformers.js NLLB سير التحرير

27 مارس 2026 • 3 دقائق قراءة

مقال DevHub

التحويل من الصوت إلى النص بالعربية في 2026: توقّف عن ترتيب الأنظمة وفق WER فقط

جودة التحويل من الصوت إلى النص بالعربية لا يختصرها رقم خطأ واحد. هذا الدليل يوضح كيف نقيّم أنظمة التفريغ الصوتي لسير العمل التحريري الحقيقي، حيث يهم المتحدث والزمن والتكلفة البشرية بقدر أهمية التعرف الخام.

تحويل الكلام إلى نص التفريغ الصوتي غرفة الأخبار Whisper Voxtral

28 مارس 2026 • 4 دقائق قراءة

مراجعة مراجعات العتاد والبرمجيات

مراجعة Whisper large-v3: هل يصلح فعلًا كعمود ترجمة صوتية لغرفة أخبار عالمية؟

ما يزال Whisper large-v3 من أكثر قواعد التحويل من الصوت إلى النص فائدة لعمليات التحرير الثنائية اللغة، لكن القيمة الحقيقية في غرفة الأخبار لا تتحدد بالدقة الخام وحدها.

Whisper التفريغ الصوتي تحويل الكلام إلى نص غرفة الأخبار

27 مارس 2026 • 4.6/5

مراجعة مراجعات العتاد والبرمجيات

مراجعة Granite Embedding 107M Multilingual: هل هو المسترجع العملي للبحث التحريري العالمي؟

يبدو موديل IBM Granite 107M متعدد اللغات متواضعًا على الورق، لكن في الأنظمة التحريرية الحقيقية التي تهتم بالاسترجاع عبر اللغات وسهولة النشر والانضباط التشغيلي، قد تكون هذه الرصانة هي نقطة القوة نفسها.

Granite Embeddings متعدد اللغات الاسترجاع سير التحرير

27 مارس 2026 • 4.5/5

مقال الذكاء الأمني

أبحاث أمن MCP في 2026: على ماذا تتفق الأوراق الحديثة فعلًا؟

النقاش حول MCP يتسارع، لكن الإشارة البحثية أوضح من الضجيج التسويقي بكثير. الأوراق الحديثة حول التدقيق والهجمات المنظومية والأدوات الخبيثة والتخفيفات المؤسسية تقود إلى الخلاصة نفسها: قابلية ربط الأدوات من دون سياسة منضبطة تعني هشاشة افتراضية.

MCP الأمن وكلاء الذكاء الاصطناعي Red Teaming حقن الأوامر صلاحيات الأدوات

28 مارس 2026 • 5 دقائق قراءة