تكنولوجيا: لغة غير متوقعة تتفوق على الإنجليزية والصينية في اختبارات الذكاء الاصطناعي وفق دراسة أكاديمية جديدة

كتب هذا الموضوع سلطان القحطاني - أظهرت دراسة متعددة اللغات حديثة نتائج غير متوقعة حول أداء نماذج الذكاء الاصطناعي عند التعامل مع المستندات الطويلة.

فقد قدّم باحثون في ورقة COLM 2025 معيار OneRuler، الذي اختبر 26 لغة في مهام الاسترجاع والدمج، ليكشف أن اللغة البولندية تفوقت بوضوح عندما امتدت النوافذ السياقية إلى 64 ألف رمز وما بعدها.

وفقًا للرسم البياني الوارد في الصفحة 6، سجلت البولندية متوسط دقة بلغ 88% في سياقات طويلة، بينما تراجعت الإنجليزية إلى المركز السادس، وجاءت الصينية ضمن أضعف أربع لغات.

وتشير النتائج إلى أن الفجوة ليست مرتبطة بحجم بيانات التدريب، بل بكفاءة التقسيم النصي وفروقات الأنظمة الكتابية. فقد برزت اللغات اللاتينية مثل البولندية والفرنسية والإسبانية، في حين انخفض أداء لغات ذات أنظمة معقدة مثل الصينية والكورية والتاميلية، خصوصًا مع توسع طول السلسلة.

كما توضح الدراسة أن اتساع السياق يزيد التفاوت بين اللغات؛ إذ ارتفع الفارق بين الأداء الأعلى والأدنى من 11% عند 8 آلاف رمز إلى 34% عند 128 ألف رمز.

وبيّنت التجارب أيضًا مدى حساسية النماذج للتعليمات، حيث تراجعت دقة الإنجليزية بنسبة 32% عند 128 ألف رمز بمجرد السماح للنموذج بالإجابة “none” عند غياب النص المطلوب.

تشير هذه النتائج إلى أن تقييم القدرات السياقية الطويلة لا يمكن الاعتماد فيه على الإنجليزية وحدها، وأن تجاهل تأثيرات الكتابة والتقسيم النصي قد يؤدي إلى استنتاجات مضللة.

فكلما أصبحت المستندات أطول، زاد تأثير الهياكل اللغوية على أداء النماذج، وتضاءلت سيطرة الإنجليزية في الاختبارات التقليدية.

المصدر

أخبار متعلقة :