DroidNexus Labs

طبقة البحث والقياس الأصلية وراء DroidNexus.

هنا نحول التغطية إلى أصول قابلة لإعادة الاستخدام: ملاحظات تقييم، ومقارنات قرار، وقياسات عملية للاسترجاع والترجمة والتفريغ الصوتي وأمن MCP بدل تكرار ما هو موجود في نتائج البحث.

زاوية تقييم أصلية سير عمل عربي + إنجليزي إشارات Hugging Face مع حكم تحريري

مسارات المختبر

أربع طبقات سلطة نبني فوقها المحتوى القادم

كل مسار هنا مصمم ليخرج بمحتوى أصلي يمكن الاستشهاد به: benchmark، failure analysis، أو decision page يفيد القارئ والفريق معًا.

Retrieval Bench

قياس الاسترجاع ثنائي اللغة على مهام تحريرية حقيقية

لا نهتم بمن يتصدر leaderboard عام فقط، بل بمن يعيد المادة الصحيحة في بيئة نشر فيها عربي وإنجليزي ووسوم وسياقات مختلفة.

  • اختبار اكتشاف المقالات المرتبطة عبر اللغتين
  • قياس recall في بحث الموقع لا في benchmark معزول
  • تحويل النتيجة إلى قرارات تحسين قابلة للتنفيذ
افتح المسار

Translation Bench

ترجمة تقيس عبء التحرير لا سرعة التوليد فقط

نقارن المسودات بحسب المصطلحات والانحراف الأسلوبي وزمن التصحيح البشري، لأن النشر الثنائي اللغة ينهار غالبًا في هذه الطبقة تحديدًا.

  • رصد drift في المصطلحات التقنية
  • قياس عبء المراجعة بعد الترجمة
  • تمييز المسودة المقبولة من النص القابل للنشر
افتح المسار

Speech Bench

تفريغ صوتي صالح للتحرير والاقتباس والبحث

نسأل سؤالًا أكثر نضجًا من WER: هل هذا transcript مفيد فعلًا في المقابلات والملاحظات والقصص السريعة داخل غرفة تحرير؟

  • اختبار قابلية الاقتباس والبحث
  • قياس جودة المادة المصدرية لا الدقة المجردة فقط
  • ربط الصوت بالتغطية بدل بقائه ملفًا معزولًا
افتح المسار

MCP Safety Desk

أمن MCP من طبقة البرومبت إلى حدود الموافقة البشرية

هذا المسار يجمع بين البحث والتحليل العملي: صلاحيات الأدوات، وصف الأدوات، حدود التفويض، وكيف تنكسر الحماية عند التطبيق.

  • فصل واضح بين البحث والممارسة التشغيلية
  • تجميع failure modes بدل الاكتفاء بالتحذيرات العامة
  • ربط الأوراق بقرارات تنفيذية داخل المنتجات
افتح المسار

معيار علني

متى تصبح مادة Labs قابلة للنشر فعلًا؟

  • نصرح بالمهمة والكوربس وزاوية التقييم قبل إعلان النتيجة.
  • نميّز بين إشارات المنظومة ونتائج الاختبار المستقل.
  • إذا كانت القابلية لإعادة الإنتاج ضعيفة، نقلل مستوى الثقة بدل تضخيم الاستنتاج.
  • النسخة العربية والإنجليزية تتفقان في القرار التحريري لا في الصياغة الحرفية.

المخرجات الحالية

مواد منشورة بالفعل تمثل روح Labs

هذه ليست مقالات عابرة، بل بداية مكتبة أصلية في القياس والتحليل المقارن وسير العمل الثنائي اللغة.

Signal Watchlist

ما الذي نراقبه الآن في Hugging Face

بيانات Hub حيّة وقت البناء، مرتبطة مباشرة بالمسارات التحريرية التي نقيسها ونكتب عنها داخل DroidNexus Labs.

الاسترجاع

بيانات حية
افتح المستودع

مرشح استرجاع قوي للاختبارات ثنائية اللغة

نراقبه لأنه يظل مرجعًا عمليًا في الاسترجاع متعدد اللغات، لا مجرد اسم مشهور في leaderboard.

BAAI/bge-m3

Sentence Similarity • Sentence Transformers • MIT

التنزيلات
15 مليون
الإعجابات
2.9 ألف
آخر تحديث
3 يوليو 2024

موديلات صغيرة

بيانات حية
افتح المستودع

اختبار حقيقي لطبقات Embeddings الصغيرة

هذا المسار مهم لنا لأن الكفاءة التشغيلية لا تقل أهمية عن جودة الاسترجاع في مواقع النشر السريعة.

ibm-granite/granite-embedding-107m-multilingual

Sentence Similarity • Transformers • APACHE-2.0

التنزيلات
34.2 ألف
الإعجابات
48
آخر تحديث
19 أغسطس 2025

الترجمة

بيانات حية
افتح المستودع

إشارة مهمة في مسار مسودات الترجمة

نراقبه من زاوية عبء المراجعة التحريرية وجودة المصطلحات، لا من زاوية الترجمة الخام فقط.

tencent/HY-MT1.5-1.8B

Translation • Transformers

التنزيلات
22.1 ألف
الإعجابات
591
آخر تحديث
1 يناير 2026

الصوت الفوري

بيانات حية
افتح المستودع

إشارة realtime تستحق القياس التحريري الجاد

نراقبه لأن السرعة وحدها لا تكفي، بل نريد معرفة متى يصبح التفريغ الفوري صالحًا فعلًا لغرف التحرير العربية.

mistralai/Voxtral-Mini-4B-Realtime-2602

Automatic Speech Recognition • Vllm • APACHE-2.0

التنزيلات
777.4 ألف
الإعجابات
750
آخر تحديث
11 مارس 2026

أصل منشور

أول benchmark asset عام من DroidNexus أصبح حيًا الآن.

ميني benchmark للاسترجاع التحريري العربي-الإنجليزي

نقلنا مسار الاسترجاع من مرحلة التغطية إلى أصل علني قابل للتنزيل والقياس وإعادة الاستخدام على Hugging Face، مع صفحة scorecard داخل Labs تربط benchmark بالمقالات نفسها.

هذا الأصل مصمم للفرق التي تريد تقييم سلوك البحث التحريري على كوربس ثنائي اللغة صغير قبل التوسع إلى خطوط استرجاع أكبر أو إلى نشر dataset كامل على Hugging Face.

بذرة أصل عام مبني للبحث الثنائي اللغة منشور الآن على Hugging Face

بطاقة الحالة

الحالة
منشور عام
الحالات
10
الأهداف المعيارية
10
أنماط الاستعلام
عربي + إنجليزي + مختلط
التنسيقات
JSON + CSV
المستودع
wisam3272/droidnexus-arabic-english-editorial-retrieval-mini
التنزيلات
0
الإعجابات
0
آخر تحديث
28 مارس 2026
جاهزية الـviewer
متاح
الـsplit
default/train
الصفوف
10
الأعمدة
8
حجم parquet
8.2 ألفB

الإطار المرجعي

مواد مرتبطة مباشرة

مقال

الاسترجاع العربي-الإنجليزي في 2026: ماذا يجب أن تختبر قبل اختيار طبقة الـ Embeddings؟

اختيار موديل Embeddings للاسترجاع العربي-الإنجليزي ليس مشكلة leaderboard بل مشكلة pipeline كاملة. هذا الدليل يوضح ما الذي يجب اختباره قبل الوثوق بأي طبقة استرجاع في الإنتاج.

مقال

لماذا تفوز نماذج الاسترجاع الأصغر في خطوط التحرير الحقيقية خلال 2026

العروض الكبيرة تخطف الانتباه، لكن الاسترجاع في الإنتاج يكافئ الانضباط لا الضجيج. الأبحاث الحديثة وإشارات Hugging Face الحالية تقود إلى النتيجة نفسها: النماذج الأصغر متعددة اللغات مع أساس lexical قوي تتفوق غالبًا على المكدسات المتضخمة عندما يصل الأمر إلى الواقع.

مقال

بنية البحث الثنائية في 2026: سرعة الكلمات المفتاحية مع استدعاء دلالي بلا تعقيد تشغيلي

البحث بالكلمات المفتاحية وحده لم يعد كافيًا لمنصة تقنية ثنائية اللغة. هذا المخطط يجمع بين Pagefind وMultilingual Embeddings حتى يبقى الاكتشاف بالإنجليزية والعربية سريعًا وذكيًا وقابلًا للإدارة.

مقال

مخطط DevHub: طبقة تحريرية ثنائية اللغة بالذكاء الاصطناعي من دون إبطاء الموقع

بناء منشور تقني عالمي بالعربية والإنجليزية لا يتطلب ترجمة فقط، بل يحتاج طبقة تحريرية ذكية للبحث والتفريغ والاكتشاف متعدد اللغات.

المخرجات الحالية

مواد منشورة بالفعل تمثل روح Labs

هذه ليست مقالات عابرة، بل بداية مكتبة أصلية في القياس والتحليل المقارن وسير العمل الثنائي اللغة.

الاسترجاع العربي-الإنجليزي في 2026: ماذا يجب أن تختبر قبل اختيار طبقة الـ Embeddings؟
مقال DevHub

الاسترجاع العربي-الإنجليزي في 2026: ماذا يجب أن تختبر قبل اختيار طبقة الـ Embeddings؟

اختيار موديل Embeddings للاسترجاع العربي-الإنجليزي ليس مشكلة leaderboard بل مشكلة pipeline كاملة. هذا الدليل يوضح ما الذي يجب اختباره قبل الوثوق بأي طبقة استرجاع في الإنتاج.

لماذا تفوز نماذج الاسترجاع الأصغر في خطوط التحرير الحقيقية خلال 2026
مقال DevHub

لماذا تفوز نماذج الاسترجاع الأصغر في خطوط التحرير الحقيقية خلال 2026

العروض الكبيرة تخطف الانتباه، لكن الاسترجاع في الإنتاج يكافئ الانضباط لا الضجيج. الأبحاث الحديثة وإشارات Hugging Face الحالية تقود إلى النتيجة نفسها: النماذج الأصغر متعددة اللغات مع أساس lexical قوي تتفوق غالبًا على المكدسات المتضخمة عندما يصل الأمر إلى الواقع.

ترجمة المسودات العربية في 2026: لماذا اختيار الموديل نصف الحل فقط؟
مقال DevHub

ترجمة المسودات العربية في 2026: لماذا اختيار الموديل نصف الحل فقط؟

جودة ترجمة المسودات العربية لا تُحسم عبر BLEU أو حجم الموديل وحده. هذا الدليل يوضح كيف تختار بين خيارات الترجمة الحديثة ولماذا يهم انضباط ما بعد التحرير بقدر أهمية الموديل نفسه.

التحويل من الصوت إلى النص بالعربية في 2026: توقّف عن ترتيب الأنظمة وفق WER فقط
مقال DevHub

التحويل من الصوت إلى النص بالعربية في 2026: توقّف عن ترتيب الأنظمة وفق WER فقط

جودة التحويل من الصوت إلى النص بالعربية لا يختصرها رقم خطأ واحد. هذا الدليل يوضح كيف نقيّم أنظمة التفريغ الصوتي لسير العمل التحريري الحقيقي، حيث يهم المتحدث والزمن والتكلفة البشرية بقدر أهمية التعرف الخام.

أبحاث أمن MCP في 2026: على ماذا تتفق الأوراق الحديثة فعلًا؟

أبحاث أمن MCP في 2026: على ماذا تتفق الأوراق الحديثة فعلًا؟

النقاش حول MCP يتسارع، لكن الإشارة البحثية أوضح من الضجيج التسويقي بكثير. الأوراق الحديثة حول التدقيق والهجمات المنظومية والأدوات الخبيثة والتخفيفات المؤسسية تقود إلى الخلاصة نفسها: قابلية ربط الأدوات من دون سياسة منضبطة تعني هشاشة افتراضية.