DroidNexus Labs

طبقة البحث والقياس الأصلية وراء DroidNexus.

هنا نحول التغطية إلى أصول قابلة لإعادة الاستخدام: ملاحظات تقييم، ومقارنات قرار، وقياسات عملية للاسترجاع والترجمة والتفريغ الصوتي وأمن MCP بدل تكرار ما هو موجود في نتائج البحث.

زاوية تقييم أصلية سير عمل عربي + إنجليزي إشارات Hugging Face مع حكم تحريري

استعرض المخرجات الحالية اقرأ المنهجية

معيار علني

متى تصبح مادة Labs قابلة للنشر فعلًا؟

أي مادة في Labs يجب أن تحمل إطار قرار واضحًا ودليلًا تشغيليًا يمكن الاستفادة منه لاحقًا. لا ننشر مقارنات شكلية ولا تلخيصات عامة تحت هذا الاسم.

خريطة الأصول

ما الذي سنبنيه بعد ذلك

Bench Notes

صفحات قرار مختصرة توضّح لماذا كان موديل أو workflow صالحًا أو غير صالح في سياق تحريري فعلي.

Reusable Eval Sets

مجموعات اختبار ثنائية اللغة صغيرة وقابلة للتحديث حتى نستطيع تتبع التطور بدل إعادة النقاش من الصفر كل مرة.

Hugging Face Artifacts

أول dataset benchmark عام صار منشورًا الآن، والخطوة التالية هي توسيعه إلى دفعات تقييم إضافية وربطه بمسار الصوت الفوري داخل Labs.

مسارات المختبر

أربع طبقات سلطة نبني فوقها المحتوى القادم

كل مسار هنا مصمم ليخرج بمحتوى أصلي يمكن الاستشهاد به: benchmark، failure analysis، أو decision page يفيد القارئ والفريق معًا.

Retrieval Bench

قياس الاسترجاع ثنائي اللغة على مهام تحريرية حقيقية

لا نهتم بمن يتصدر leaderboard عام فقط، بل بمن يعيد المادة الصحيحة في بيئة نشر فيها عربي وإنجليزي ووسوم وسياقات مختلفة.

اختبار اكتشاف المقالات المرتبطة عبر اللغتين
قياس recall في بحث الموقع لا في benchmark معزول
تحويل النتيجة إلى قرارات تحسين قابلة للتنفيذ

افتح المسار

Translation Bench

ترجمة تقيس عبء التحرير لا سرعة التوليد فقط

نقارن المسودات بحسب المصطلحات والانحراف الأسلوبي وزمن التصحيح البشري، لأن النشر الثنائي اللغة ينهار غالبًا في هذه الطبقة تحديدًا.

رصد drift في المصطلحات التقنية
قياس عبء المراجعة بعد الترجمة
تمييز المسودة المقبولة من النص القابل للنشر

افتح المسار

Speech Bench

تفريغ صوتي صالح للتحرير والاقتباس والبحث

نسأل سؤالًا أكثر نضجًا من WER: هل هذا transcript مفيد فعلًا في المقابلات والملاحظات والقصص السريعة داخل غرفة تحرير؟

اختبار قابلية الاقتباس والبحث
قياس جودة المادة المصدرية لا الدقة المجردة فقط
ربط الصوت بالتغطية بدل بقائه ملفًا معزولًا

افتح المسار

MCP Safety Desk

أمن MCP من طبقة البرومبت إلى حدود الموافقة البشرية

هذا المسار يجمع بين البحث والتحليل العملي: صلاحيات الأدوات، وصف الأدوات، حدود التفويض، وكيف تنكسر الحماية عند التطبيق.

فصل واضح بين البحث والممارسة التشغيلية
تجميع failure modes بدل الاكتفاء بالتحذيرات العامة
ربط الأوراق بقرارات تنفيذية داخل المنتجات

افتح المسار

معيار علني

متى تصبح مادة Labs قابلة للنشر فعلًا؟

نصرح بالمهمة والكوربس وزاوية التقييم قبل إعلان النتيجة.
نميّز بين إشارات المنظومة ونتائج الاختبار المستقل.
إذا كانت القابلية لإعادة الإنتاج ضعيفة، نقلل مستوى الثقة بدل تضخيم الاستنتاج.
النسخة العربية والإنجليزية تتفقان في القرار التحريري لا في الصياغة الحرفية.

المخرجات الحالية

مواد منشورة بالفعل تمثل روح Labs

هذه ليست مقالات عابرة، بل بداية مكتبة أصلية في القياس والتحليل المقارن وسير العمل الثنائي اللغة.

Signal Watchlist

ما الذي نراقبه الآن في Hugging Face

بيانات Hub حيّة وقت البناء، مرتبطة مباشرة بالمسارات التحريرية التي نقيسها ونكتب عنها داخل DroidNexus Labs.

الاسترجاع

بيانات حية

افتح المستودع

مرشح استرجاع قوي للاختبارات ثنائية اللغة

نراقبه لأنه يظل مرجعًا عمليًا في الاسترجاع متعدد اللغات، لا مجرد اسم مشهور في leaderboard.

BAAI/bge-m3

Sentence Similarity • Sentence Transformers • MIT

التنزيلات: 15 مليون
الإعجابات: 2.9 ألف
آخر تحديث: 3 يوليو 2024

اقرأ المادة المرتبطة

موديلات صغيرة

بيانات حية

افتح المستودع

اختبار حقيقي لطبقات Embeddings الصغيرة

هذا المسار مهم لنا لأن الكفاءة التشغيلية لا تقل أهمية عن جودة الاسترجاع في مواقع النشر السريعة.

ibm-granite/granite-embedding-107m-multilingual

Sentence Similarity • Transformers • APACHE-2.0

التنزيلات: 34.2 ألف
الإعجابات: 48
آخر تحديث: 19 أغسطس 2025

اقرأ المادة المرتبطة

الترجمة

بيانات حية

افتح المستودع

إشارة مهمة في مسار مسودات الترجمة

نراقبه من زاوية عبء المراجعة التحريرية وجودة المصطلحات، لا من زاوية الترجمة الخام فقط.

tencent/HY-MT1.5-1.8B

Translation • Transformers

التنزيلات: 22.1 ألف
الإعجابات: 591
آخر تحديث: 1 يناير 2026

اقرأ المادة المرتبطة

الصوت الفوري

بيانات حية

افتح المستودع

إشارة realtime تستحق القياس التحريري الجاد

نراقبه لأن السرعة وحدها لا تكفي، بل نريد معرفة متى يصبح التفريغ الفوري صالحًا فعلًا لغرف التحرير العربية.

mistralai/Voxtral-Mini-4B-Realtime-2602

Automatic Speech Recognition • Vllm • APACHE-2.0

التنزيلات: 777.4 ألف
الإعجابات: 750
آخر تحديث: 11 مارس 2026

اقرأ المادة المرتبطة

أصل منشور

أول benchmark asset عام من DroidNexus أصبح حيًا الآن.

ميني benchmark للاسترجاع التحريري العربي-الإنجليزي

نقلنا مسار الاسترجاع من مرحلة التغطية إلى أصل علني قابل للتنزيل والقياس وإعادة الاستخدام على Hugging Face، مع صفحة scorecard داخل Labs تربط benchmark بالمقالات نفسها.

هذا الأصل مصمم للفرق التي تريد تقييم سلوك البحث التحريري على كوربس ثنائي اللغة صغير قبل التوسع إلى خطوط استرجاع أكبر أو إلى نشر dataset كامل على Hugging Face.

بذرة أصل عام مبني للبحث الثنائي اللغة منشور الآن على Hugging Face

افتح صفحة الأصل Ø§ÙØªØ HF Collection افتح dataset على HF نزّل JSON نزّل CSV

بطاقة الحالة

الحالة: منشور عام
الحالات: 10
الأهداف المعيارية: 10
أنماط الاستعلام: عربي + إنجليزي + مختلط
التنسيقات: JSON + CSV
المستودع: wisam3272/droidnexus-arabic-english-editorial-retrieval-mini

التنزيلات: 0
الإعجابات: 0
آخر تحديث: 28 مارس 2026

جاهزية الـviewer: متاح
الـsplit: default/train
الصفوف: 10
الأعمدة: 8
حجم parquet: 8.2 ألفB

الإطار المرجعي

DroidNexus retrieval collection

Ø§Ù„Ù€collection Ø§Ù„ØÙŠ Ø¹Ù„Ù‰ Hugging Face Ø§Ù„Ø°ÙŠ ÙŠØ¬Ù…Ø¹ Ø§Ù„Ù€dataset Ø§Ù„Ø¹Ø§Ù… Ù…Ø¹ Ù†Ù…Ø§Ø°Ø¬ Ø§Ù„Ø®Ø· Ø§Ù„Ø£Ø³Ø§Ø³ÙŠ ÙˆØ£ÙˆØ±Ø§Ù‚ Ø§Ù„ØªÙ‚ÙŠÙŠÙ… ÙÙŠ Ù…Ø³Ø§Ø± Ø§Ø³ØªØ±Ø¬Ø§Ø¹ ÙˆØ§ØØ¯ Ù‚Ø§Ø¨Ù„ Ù„Ø¥Ø¹Ø§Ø¯Ø© Ø§Ù„Ø¥Ù†ØªØ§Ø¬.

BAAI/bge-m3

خط أساس متعدد اللغات لاختبارات dense وsparse وhybrid على نفس مجموعة الاستعلامات التحريرية.

ibm-granite/granite-embedding-107m-multilingual

مرجع embeddings صغير متعدد اللغات لاختبار ما إذا كانت طبقات الاسترجاع الأصغر تصمد داخل سير عمل تحريري ثنائي اللغة.

CLIRudit

إشارة تقييم للاسترجاع العابر للغات تبقي benchmark مرتبطًا بالأدلة متعددة اللغات لا بالحدس المحلي للموقع فقط.

mRobust04

إطار robustness للاسترجاع متعدد اللغات يساعد على إبقاء benchmark صادقًا عندما تتجاوز الاستعلامات صياغات الديمو النظيفة.

مواد مرتبطة مباشرة

مقال

الاسترجاع العربي-الإنجليزي في 2026: ماذا يجب أن تختبر قبل اختيار طبقة الـ Embeddings؟

اختيار موديل Embeddings للاسترجاع العربي-الإنجليزي ليس مشكلة leaderboard بل مشكلة pipeline كاملة. هذا الدليل يوضح ما الذي يجب اختباره قبل الوثوق بأي طبقة استرجاع في الإنتاج.

مقال

لماذا تفوز نماذج الاسترجاع الأصغر في خطوط التحرير الحقيقية خلال 2026

العروض الكبيرة تخطف الانتباه، لكن الاسترجاع في الإنتاج يكافئ الانضباط لا الضجيج. الأبحاث الحديثة وإشارات Hugging Face الحالية تقود إلى النتيجة نفسها: النماذج الأصغر متعددة اللغات مع أساس lexical قوي تتفوق غالبًا على المكدسات المتضخمة عندما يصل الأمر إلى الواقع.

مقال

بنية البحث الثنائية في 2026: سرعة الكلمات المفتاحية مع استدعاء دلالي بلا تعقيد تشغيلي

البحث بالكلمات المفتاحية وحده لم يعد كافيًا لمنصة تقنية ثنائية اللغة. هذا المخطط يجمع بين Pagefind وMultilingual Embeddings حتى يبقى الاكتشاف بالإنجليزية والعربية سريعًا وذكيًا وقابلًا للإدارة.

مقال

مخطط DevHub: طبقة تحريرية ثنائية اللغة بالذكاء الاصطناعي من دون إبطاء الموقع

بناء منشور تقني عالمي بالعربية والإنجليزية لا يتطلب ترجمة فقط، بل يحتاج طبقة تحريرية ذكية للبحث والتفريغ والاكتشاف متعدد اللغات.

المخرجات الحالية

مواد منشورة بالفعل تمثل روح Labs

هذه ليست مقالات عابرة، بل بداية مكتبة أصلية في القياس والتحليل المقارن وسير العمل الثنائي اللغة.

مقال DevHub

الاسترجاع العربي-الإنجليزي في 2026: ماذا يجب أن تختبر قبل اختيار طبقة الـ Embeddings؟

28 مارس 2026 • 5 دقائق قراءة

مقال DevHub

لماذا تفوز نماذج الاسترجاع الأصغر في خطوط التحرير الحقيقية خلال 2026

الاسترجاع Embeddings BM25 متعدد اللغات سير التحرير

27 مارس 2026 • 3 دقائق قراءة

مقال DevHub

ترجمة المسودات العربية في 2026: لماذا اختيار الموديل نصف الحل فقط؟

جودة ترجمة المسودات العربية لا تُحسم عبر BLEU أو حجم الموديل وحده. هذا الدليل يوضح كيف تختار بين خيارات الترجمة الحديثة ولماذا يهم انضباط ما بعد التحرير بقدر أهمية الموديل نفسه.

الترجمة متعدد اللغات سير التحرير Hugging Face NLLB

28 مارس 2026 • 4 دقائق قراءة

مقال DevHub

التحويل من الصوت إلى النص بالعربية في 2026: توقّف عن ترتيب الأنظمة وفق WER فقط

جودة التحويل من الصوت إلى النص بالعربية لا يختصرها رقم خطأ واحد. هذا الدليل يوضح كيف نقيّم أنظمة التفريغ الصوتي لسير العمل التحريري الحقيقي، حيث يهم المتحدث والزمن والتكلفة البشرية بقدر أهمية التعرف الخام.

تحويل الكلام إلى نص التفريغ الصوتي غرفة الأخبار Whisper Voxtral

28 مارس 2026 • 4 دقائق قراءة

مقال الذكاء الأمني

أبحاث أمن MCP في 2026: على ماذا تتفق الأوراق الحديثة فعلًا؟

النقاش حول MCP يتسارع، لكن الإشارة البحثية أوضح من الضجيج التسويقي بكثير. الأوراق الحديثة حول التدقيق والهجمات المنظومية والأدوات الخبيثة والتخفيفات المؤسسية تقود إلى الخلاصة نفسها: قابلية ربط الأدوات من دون سياسة منضبطة تعني هشاشة افتراضية.

MCP الأمن وكلاء الذكاء الاصطناعي Red Teaming حقن الأوامر صلاحيات الأدوات

28 مارس 2026 • 5 دقائق قراءة