نُشرت شركة NVIDIA شريحة Groq 3 LPU، التي تُسرّع استنتاج نماذج الذكاء الاصطناعي حتى مستوى الرموز.

نُفَشِرَتْ نيفيديا إمكانيات جديدة لمنصة فيرا روبين

في مؤتمر GTC هذا العام، أعلن الرئيس التنفيذي لشركة NVIDIA جينسن هوانغ عن توسيع منصة فيرا روبين. تستند الإمكانيات الجديدة إلى الملكية الفكرية التي تم شراؤها من شركة Groq، وضمّت روبين معالجًا *Groq 3 LPU* – مُسرِّع استدلال مخصص لتوليد الرموز بسرعة عالية وتأخير منخفض.

ما هو متاح بالفعل في فيرا روبين
تتكوّن المنصة من ستة مكونات رئيسية تجمعها NVIDIA في أنظمة محمولة وتوسعها إلى مصانع ذكاء اصطناعي كبيرة:

المكون	الوصف
GPU Rubin	بطاقة رسومات بسعة 288 GB HBM4
CPU Vera	معالج مركزي
NVLink 6	نظام توسيع داخلي للأنظمة
ConnectX‑9	محول شبكة ذكي
BlueField‑4	معالج معالجة بيانات
Spectrum‑X	مُبدّل توسيع بين الأنظمة مع تكامل بصري

تم إضافة Groq 3 LPU ككتلة بناء جديدة ستُستخدم عند نشر أنظمة كبيرة.

لماذا يبرز Groq 3 LPU
الاختلاف الرئيسي هو بنية الذاكرة. بينما تستخدم معظم المسرعات HBM كذاكرة عمل، يحتوي كل Groq 3 LPU على 500 MB SRAM. المقارنة:

المعامل	GPU Rubin (HBM4)	Groq 3 LPU (SRAM)
السعة	288 GB	0.5 GB
معدل النقل	~22 TB/s	حتى 150 TB/s

للمهام الاستدلالية التي تتطلب عتبة نقل عالية، يبرز امتياز SRAM بوضوح. لهذا السبب ضمت NVIDIA Groq 3 في روبين – لتعزيز سرعة توليد الرموز.

الرف Groq 3 LPX
يحتوي الرف على 256 شريحة Groq 3 LPU، ما يمنح:

- 128 GB SRAM
- معدل نقل إجمالي قدره 40 PB/s
- واجهة داخلية بسعة 640 TB/s

أشار نائب الرئيس للحلول الفائقة التوسع إيان باك إلى هذا الرف كمُعالج مساعد لروبين، مؤكدًا دوره في تعزيز أداء فك الترميز على كل طبقة من نموذج ورمز.

تأثيره على الأنظمة متعددة الوكلاء
ذكر باك أن Groq 3 LPX سيكون عنصرًا أساسيًا لسوق الذكاء الاصطناعي المستقبلي – الأنظمة متعددة الوكلاء. عندما يتبادل الوكلاء البيانات مباشرةً بدلاً من عبر روبوتات الدردشة، تتغير متطلبات الاستجابة: من 100 رمز/ثانية إلى أكثر من 1 500+ رمز/ثانية وأكثر.

المنافسون وآفاق المستقبل
يُذكر في النص منافسًا – Cerebras، التي تستخدم محرك Wafer‑Scale (WSE) مع SRAM ضخم لاستدلال منخفض التأخير. لقد استخدمت OpenAI بالفعل Cerebras في نماذجها المتقدمة بفضل تأخيرها المتميز.

كما أشار باك إلى أن ظهور Groq 3 LPU قد يقلل الاعتماد على مسرعات روبين CPX. بينما تركز NVIDIA حاليًا على دمج رف Groq 3 LPX مع المنصة، يهدف كلا المعالجين إلى تعزيز الاستدلال دون الحاجة إلى كميات كبيرة من ذاكرة GDDR7.

الختام:

المعالج الجديد Groq 3 LPU ورفه LPX يعززان فيرا روبين في مجال الاستدلال منخفض التأخير، مفتحًا الطريق للأنظمة متعددة الوكلاء الأسرع ومنافسًا مثل Cerebras.

نُشرت شركة NVIDIA شريحة Groq 3 LPU، التي تُسرّع استنتاج نماذج الذكاء الاصطناعي حتى مستوى الرموز.

Related news

جوجل جيميني جمعت 750 مليون مستخدم نشط شهريًا، تاركةً شات جي بي تي على مسافة قصيرة فقط من القائد.

قدمت Nothing نسخة تجريبية من Essential Apps – منصة لإنشاء تطبيقات صغيرة باستخدام الذكاء الاصطناعي

أوضحت مايكروسوفت سبب حظر حسابات VeraCrypt وغيرها من الخدمات المفتوحة، وهو بسبب إهمال منشئيها

تحتل تطبيق Meta✴ AI المرتبة الخامسة في متجر التطبيقات بعد إطلاق Muse Spark

التعليقات (0)

سجّل الدخول للتعليق

نُشرت شركة NVIDIA شريحة Groq 3 LPU، التي تُسرّع استنتاج نماذج الذكاء الاصطناعي حتى مستوى الرموز.

Related news

جوجل جيميني جمعت 750 مليون مستخدم نشط شهريًا، تاركةً شات جي بي تي على مسافة قصيرة فقط من القائد.

قدمت Nothing نسخة تجريبية من Essential Apps – منصة لإنشاء تطبيقات صغيرة باستخدام الذكاء الاصطناعي

أوضحت مايكروسوفت سبب حظر حسابات VeraCrypt وغيرها من الخدمات المفتوحة، وهو بسبب إهمال منشئيها

تحتل تطبيق Meta✴ AI المرتبة الخامسة في متجر التطبيقات بعد إطلاق Muse Spark

سجّل الدخول للتعليق

نُشرت شركة NVIDIA شريحة Groq 3 LPU، التي تُسرّع استنتاج نماذج الذكاء الاصطناعي حتى مستوى الرموز.

قدمت Nothing نسخة تجريبية من Essential Apps – منصة لإنشاء تطبيقات صغيرة باستخدام الذكاء الاصطناعي

تحتل تطبيق Meta✴ AI المرتبة الخامسة في متجر التطبيقات بعد إطلاق Muse Spark