كتب هذا الموضوع سلطان القحطاني - لم يدم تباهي شركة Tesla بأن شريحة AI5 المستقبلية الخاصة بها ستتمكن من تشغيل عمليات الاستدلال بتكلفة أرخص عشر مرات من معمارية Blackwell التابعة لشركة Nvidia طويلاً، حيث أعلنت Nvidia عن منصة Rubin AI الحسابية للجيل القادم التي تقدم خفضاً مماثلاً بمقدار عشرة أضعاف في التكاليف لكل رمز (token)، وتهدف هذه المعمارية الجديدة أخيراً لمجاراة استراتيجية الصين في تشغيل استدلال الذكاء الاصطناعي بتكاليف أقل بكثير مقارنة بنسخة Blackwell الحالية.
وكما أشارت الشائعات، تم بناء منصة Nvidia Rubin حول ستة أنظمة فرعية للمعالجة تعمل بتناغم تام تشمل معالج Vera CPU ووحدة معالجة الرسومات الجديدة Nvidia Rubin GPU ومحول NVLink 6 Switch من الجيل الثالث، بالإضافة إلى ConnectX-9 SuperNIC و BlueField-4 DPU ومحول Spectrum-6 Ethernet Switch، ويتم تصنيع هذه الرقائق باستخدام تقنيات متقدمة من مسابك TSMC مع تقديم تحسينات في الواجهات تهدف إلى تقليل تكاليف الرموز ومدة التدريب بشكل جذري، ويسمح هذا “التصميم المشترك” عبر الرقائق الست الجديدة بتدريب النماذج باستخدام ربع عدد وحدات معالجة الرسومات التي كانت مطلوبة في منصة Nvidia Blackwell الحالية مما يقلل التكلفة لكل رمز بمقدار عشر مرات.
وقد أشاد Elon Musk بمنصة Nvidia Rubin واصفاً إياها بأنها “محرك صاروخي للذكاء الاصطناعي” سيمكن من نشر نماذج الحافة (edge models) على نطاق واسع، مشيراً إلى أن هذا الانخفاض الموعود في التكلفة يطابق ما يعد به لكمبيوتر AI5 القادم من Tesla والذي لن يدخل مرحلة الإنتاج الضخم قبل العام المقبل، وتأتي هذه الخطوة من Nvidia لتعالج أخيراً مسألة تكاليف تشغيل النماذج بجانب الأداء، خاصة في ظل المنافسة مع الصين التي تفتخر بأسعار الرموز المنخفضة التي تحققها عبر نماذج مفتوحة المصدر مثل DeepSeek وربط سلاسل من وحدات معالجة الرسومات متوسطة المدى مثل Huawei 910C.
ولعل الجزء الأكثر إثارة للاهتمام في منصة Rubin هو معالج Nvidia Vera CPU الجديد المصمم هندسياً لحركة البيانات والاستدلال الوكيلي (agentic reasoning) عبر الأنظمة المسرعة مع دعم كامل للحوسبة السرية، حيث يمكن إقرانه بوحدة معالجة رسومات من Nvidia أو العمل كمعالج مستقل لتشغيل التحليلات والخدمات السحابية والتنسيق والتخزين وأحمال الحوسبة عالية الأداء (HPC) مع توافق كامل مع معمارية Arm، وتتضمن مواصفات هذا المعالج 88 نواة مخصصة وعرض نطاق ترددي للذاكرة يبلغ 1.2 TB/s من نوع LPDDR5X مع استهلاك طاقة اقتصادي للغاية، كما يعمل تكامل واجهة الاتصال NVLink-C2C على تشغيل الوصول المتزامن للذاكرة بين وحدة المعالجة المركزية ووحدة معالجة الرسومات كجزء من ميزات التحسين التي تجعل منصة Rubin أكثر كفاءة بشكل هائل مقارنة بسابقتها القائمة على Blackwell.
المصدر:
