سباق الذكاء الاصطناعي 2025 — كيف تخطى Grok 4.1 وGemini وDeepSeek شبح ChatGPT؟

الاثنين 24 نوفمبر 2025 07:00 مساءً

ما كشفت عنه دراسة Prolific “Humaine”

الاستنتاج من هذه الدراسة: هناك تباين كبير بين ما تقيسه المنصات التقنية وما يريده المستخدم العادي. في حين أن بعض النماذج “الأصغر” أو الأقل شهرة – مثل Gemini 2.5 Pro وDeepSeek وGrok – يمكن أن تتفوق على ChatGPT إذا كنا نحكم بناءً على تجربة المستخدم الحقيقية.

اقرأ أيضاً: مقارنة بين الذكاء الاصطناعي والعمل اليدوي | كيف يساعد الـAI أحيانًا ويعيق أحيانًا أخرى

وجهة نظر Tom’s Guide: مواجهة Grok 4.1 وChatGPT 5.1

موقع Tom’s Guide أجرى اختبارًا مباشرًا بين ChatGPT-5.1 و Grok 4.1 عبر تسعة محاولات (prompts) تغطي مجالات متنوعة: المنطق، الإبداع، البرمجة، المعرفة، الرياضيات، التعليم، الفكاهة، العاطفة، والتوجيه.
Grok 4.1 فاز في 6 من أصل 9 اختبارات، من بينها المنطق (“trick question” الخروف)، الإبداع الأدبي، المعرفة الواقعية، السرعة العاطفية، وحتى في الذكاء العاطفي.
أما ChatGPT-5.1، فقد تفوق في البرمجة (توليد كود) بفضل إجابات واضحة ومنظمة دون الكثير من الزوائد. في بعض المقاييس، مثل استخدام المجاز والشرح للأطفال، ChatGPT برع في تبسيط المفاهيم بطريقة مباشرة وواضحة.
النتيجة النهائية: أعلن Tom’s Guide أن Grok 4.1 هو الفائز العام في هذه المقابلة. وصفوه بأنه “أكثر إنسانية” من ChatGPT، وأكثر قدرة على “النبرة، الباطن، والتفسير” في محادثاته.

في الوقت نفسه، أقرّ Tom’s Guide بأن ChatGPT-5.1 يتفوّق عندما تكون الإيجاز مهمًا (“when brevity matters”). من وجهة نظرهم، ChatGPT قوي جدًا في الاستخدامات التي تتطلب برمجة أو تفسيرات تقنية، بينما Grok أكثر ملاءمة لجلسات محادثة إنسانية، ودعم عاطفي، وسيناريوهات ذات عمق نصي.

نقلاً عن Tom’s Guide

الطلب(Prompt):
“اذكر 5 دول. ولكل دولة، قدّم تصديرًا واحدًا، وحقيقة تاريخية واحدة من قبل عام 1900، وميزة جغرافية واحدة. وقم بتنسيقها كقائمة مرقّمة مع نقاط فرعية.”

نتيجة ChatGPT-5.1: قائمة صحيحة ومنسّقة جيدًا، لكنه استخدم أمثلة أكثر شيوعًا في كل فئة (مثل: القهوة البرازيلية، الأهرامات المصرية).

نتيجة Grok 4.1: قدم التنسيق نفسه بدقة، لكنه تميّز باختيار حقائق وصادرات أقل شيوعًا وأكثر تحديدًا (مثل: فول الصويا البرازيلي، مدينة غيدي المهجورة في كينيا).

النتيجة: فاز Grok لأنه قدّم معلومات أكثر تميّزًا وأقل تقليدية لكل دولة، مما يعكس مستوى أعمق من البحث والانتقاء.

تفسير التباين بين الدراسة والصراع – ما هي أفضل أدوات الذكاء الاصطناعي؟

عندما ننظر إلى دراسة Prolific و اختبار Tom’s Guide معًا، تظهر لنا نقاط مهمة:

الهدف مختلف
- Prolific تقيّم “ما يفضّله المستخدم العادي”: كيف يبدو الحوار، هل هو طبيعي، هل يقدم إجابات موثوقة، هل يشعر المستخدم أن النموذج يفهمه.
- Tom’s Guide تقيّم قدرة النماذج على تنفيذ مهام محددة جدًا (الإبداع، البرمجة، المنطق) من وجهة نظر اختبارية.
النموذج المناسب يختلف حسب الاستخدام
- إذا كنت مستخدمًا يبحث عن مساعد يساعدك في التفكير، البرمجة، وإنجاز مهام تقنية، فإن ChatGPT-5.1 قد يكون خيارًا ممتازًا.
- إذا كنت تبحث عن محادثة أكثر دفئًا، تفاعلًا إنسانيًا، ونبرة أقرب لصديق، فإن Grok 4.1 يبرع في ذلك.
التنافس ليس فوزًا مطلقًا
- فوز Grok في اختبار Tom’s Guide لا يعني أن ChatGPT اختفى أو أصبح بلا قيمة.
- وبالمثل، تفوق Gemini وDeepSeek وGrok في دراسة Prolific لا يعني أن ChatGPT فشل تمامًا؛ بل ربما أن أولويات التقييم مختلفة.
مستقبل الذكاء الاصطناعي سيكون متنوعًا
- هذه النتائج تشير إلى أن نماذج الذكاء الاصطناعي ستُصمَّم وتتطور لتلبية استخدامات مختلفة: هناك من يستخدمها للعمل والإنتاج، وهناك من يريدها كرفيق أو أداة تفكير.
- المنافسة بين الشركات مثل Google (Gemini)، xAI (Grok)، Mistral، وDeepSeek من الصين ستدفع الابتكار أكثر، خاصة في تجارب المستخدم الحقيقية وليس فقط الأداء التقني.

سباق الذكاء الاصطناعي نقلاً عن موقع nature

خلاصة سباق الذكاء الاصطناعي

دراسة Prolific وضعت ChatGPT في المركز الثامن من حيث ما يقدّره المستخدم العادي في المحادثة.
اختبار Tom’s Guide منح Grok 4.1 الفوز في مواجهة ChatGPT 5.1، مستندًا إلى نظرية أن الإنسانية والعمق في الحوار أحيانًا أهم من الدقة البحتة.
النتيجة: ليس أن ChatGPT “خاسر بالمطلق” — بل أن المنافسة بين النماذج الذكية تتجه نحو تخصصات متعددة، وكل نموذج له مميزاته التي تميّزه أمام فئة معينة من المستخدمين.

المصادر

المصدر الأصلي : عرفني