كثير من الفرق تتعامل مع ترجمة المسودات العربية كما لو أنها قرار موديل واحد.

وهذا غير صحيح.

الموديل الأساسي مهم طبعًا، لكن بمجرد أن تنتقل من جمل العرض إلى مسودات تحريرية حقيقية، تبدأ الأسئلة الأصعب من مكان آخر:

  • هل يحافظ النظام على المصطلحات؟
  • كم إصلاحًا بشريًا يترك خلفه؟
  • هل يبقي البنية والتنسيق تحت السيطرة؟
  • ما كلفة جولة التصحيح بعد الترجمة؟

هذه الأسئلة هي التي تقرر ما إذا كان سير الترجمة سريعًا أم مجرد مصدر ضوضاء.

عائلتان من الموديلات تقولان لنا شيئين مختلفين

السطح الحالي على Hugging Face مفيد لأن الموديلات تكشف افتراضات workflow مختلفة.

  • tencent/HY-MT1.5-1.8B يركز على الترجمة المتبادلة عبر 33 لغة مع 5 تنوعات لهجية أو إثنية، ويجعل terminology intervention وcontextual translation وformatted translation عناصر أساسية لا إضافات تجميلية.
  • facebook/nllb-200-3.3B يمثل الخط البحثي الأوسع للترجمة متعددة اللغات: تغطية لغوية واسعة وإرثًا قويًا في benchmarks، مع تصريح واضح جدًا بأنه موديل بحثي لا نظام جاهزًا لترجمة الوثائق في الإنتاج.

وهذا الفرق مهم من اللحظة الأولى. عائلة موديلات تقول لك إنها تهتم بالتحكم وبسيناريوهات النشر. والعائلة الأخرى تقول لك إنها أصل بحثي جاد مع caveats واضحة تخص الإنتاج والوثائق الطويلة.

البحث يكرر التحذير نفسه: لا تخلط بين جودة الترجمة وكلفة التحرير

هناك إشارتان بحثيتان مهمتان جدًا هنا.

  • DivEMT أوضحت أن post-editing أسرع غالبًا من الترجمة من الصفر، لكن مقدار المكسب يختلف بقوة بين الأنظمة واللغات.
  • Enhancing Text Editing for Grammatical Error Correction: Arabic as a Case Study تضيف من الجهة العربية فكرة مكملة: أساليب text-editing الفعالة يمكن أن تجعل التصحيح العربي أكثر عملية وأسرع بكثير.

وهذه هي الخلاصة التحريرية الحقيقية. سير الترجمة الأفضل ليس فقط ما ينتج نصًا أجمل خامًا، بل ما يقلل عدد ونوع التدخلات التي يضطر المحرر البشري إلى تنفيذها بعد ذلك.

وفي العربية تصبح هذه النقطة أثقل، لأن طبقة الإصلاح لا تتوقف عند grammar فقط. المحرر غالبًا يصلح:

  • انجراف المصطلح
  • إيقاع الجملة
  • عادات الترقيم
  • بنية العناوين
  • الإشارات المختلطة إلى المنتجات والواجهات

ولهذا فاختيار الموديل ليس إلا نصف الحل.

ما الذي سأقيّمه قبل اختيار أي نظام ترجمة مسودات؟

في النشر العربي التقني، سأقيّم كل مرشح على خمسة محاور:

  1. ثبات المصطلحات
  2. استقرار البنية
  3. حساسية السياق
  4. زمن الإصلاح البشري
  5. صدق الموديل مع مجاله

ثبات المصطلحات يعني: هل يحافظ النظام على أسماء الـ APIs والمنتجات والقاموس التحريري أم يذيبها في paraphrasing مربك؟

واستقرار البنية يعني: هل تبقى bullets والعناوين والجداول والتأكيدات النصية سليمة، أم تتحول كل مرة إلى مهمة تنظيف إضافية؟

وحساسية السياق تعني: هل يظل الموديل متماسكًا عندما تعتمد الفقرة على ما قبلها، أم يترجم كل سطر في عزلة؟

أما زمن الإصلاح البشري فهو المقياس الذي تهرب منه فرق كثيرة لأنه فوضوي. وهذا هو سبب أهميته. إذا كان نظام ما ينتج جملًا أجمل قليلًا لكنه يستهلك وقتًا أطول في الإصلاح، فقد يكون الخيار التحريري الأسوأ.

أما صدق الموديل مع مجاله فهو نقطة يبرز فيها NLLB-200 بقيمة مفيدة جدًا: بطاقته تقول بوضوح إنه موديل بحثي، وليس للنشر الإنتاجي أو لترجمة الوثائق، وأن الإدخالات الطويلة قد تضعف الجودة. هذه ليست نقطة ضعف. هذه حقيقة نافعة.

الـ workflow الأفضل هو: موديل + طبقة ما بعد تحرير

وهنا تضيع الفرصة المهنية على كثير من الفرق.

النمط الصحي غالبًا هو:

  1. إنتاج مسودة مضبوطة
  2. تمريرها عبر طبقة post-edit أو text-editing خفيفة
  3. تسليمها لمحرر ثنائي اللغة يضبط النبرة والدقة

وهذا أفضل بكثير من مطالبة موديل واحد ضخم بأن يتصرف كخط تحرير كامل.

مقتطف شيفرة

ts

    export async function translateDraft(markdown: string) {
  const draft = await translate(markdown, {
    model: "tencent/HY-MT1.5-1.8B",
    mode: "formatted",
  });

  const corrected = await postEditArabic(draft);
  return handoffToEditor(corrected);
}

  

المقصود هنا ليس أن HY-MT1.5 هو الجواب دائمًا، بل أن الطبقة كلها يجب أن تُقاس كسلسلة، لا كلقطة وحيدة.

كيف يدخل هذا في مكدس DroidNexus؟

سبق أن قلنا في ترجمة المسودات محليًا أولًا إن الترجمة يجب أن تبقى قريبة من خط إنتاجك لا أن تُرمى في مكان غامض خارج السيطرة.

هذه القطعة تضيف فوق ذلك طبقة اختيار الموديل نفسه.

إذا كان الموديل يمنحك تحكمًا أفضل في المصطلحات، وتنسيقًا أنظف، وزمن إصلاح أقل، فهو يستحق مكانه في المكدس. وإذا كان يفوز في benchmark لكنه يضاعف عبء التحرير، فهو يدّعي الكفاءة أكثر مما يحققها.

الخلاصة

جودة ترجمة المسودات العربية في 2026 ليست مسابقة بين موديلات منفصلة، بل مشكلة تصميم workflow كامل.

اختر الموديل بعناية، نعم. لكن احكم عليه بحجم عبء الإصلاح الذي يخلقه، وبقدرته على حفظ المصطلح، وبمدى احترامه للبنية. في النشر الحقيقي، هذه العوامل أهم من أي رقم لامع إذا تُرك وحيدًا.