نُشرت شركة NVIDIA شريحة Groq 3 LPU، التي تُسرّع استنتاج نماذج الذكاء الاصطناعي حتى مستوى الرموز.

نُشرت شركة NVIDIA شريحة Groq 3 LPU، التي تُسرّع استنتاج نماذج الذكاء الاصطناعي حتى مستوى الرموز.

11 software

نُفَشِرَتْ نيفيديا إمكانيات جديدة لمنصة فيرا روبين

في مؤتمر GTC هذا العام، أعلن الرئيس التنفيذي لشركة NVIDIA جينسن هوانغ عن توسيع منصة فيرا روبين. تستند الإمكانيات الجديدة إلى الملكية الفكرية التي تم شراؤها من شركة Groq، وضمّت روبين معالجًا *Groq 3 LPU* – مُسرِّع استدلال مخصص لتوليد الرموز بسرعة عالية وتأخير منخفض.

ما هو متاح بالفعل في فيرا روبين
تتكوّن المنصة من ستة مكونات رئيسية تجمعها NVIDIA في أنظمة محمولة وتوسعها إلى مصانع ذكاء اصطناعي كبيرة:

المكونالوصف
GPU Rubinبطاقة رسومات بسعة 288 GB HBM4
CPU Veraمعالج مركزي
NVLink 6نظام توسيع داخلي للأنظمة
ConnectX‑9محول شبكة ذكي
BlueField‑4معالج معالجة بيانات
Spectrum‑Xمُبدّل توسيع بين الأنظمة مع تكامل بصري

تم إضافة Groq 3 LPU ككتلة بناء جديدة ستُستخدم عند نشر أنظمة كبيرة.

لماذا يبرز Groq 3 LPU
الاختلاف الرئيسي هو بنية الذاكرة. بينما تستخدم معظم المسرعات HBM كذاكرة عمل، يحتوي كل Groq 3 LPU على 500 MB SRAM. المقارنة:

المعاملGPU Rubin (HBM4)Groq 3 LPU (SRAM)
السعة288 GB0.5 GB
معدل النقل~22 TB/sحتى 150 TB/s

للمهام الاستدلالية التي تتطلب عتبة نقل عالية، يبرز امتياز SRAM بوضوح. لهذا السبب ضمت NVIDIA Groq 3 في روبين – لتعزيز سرعة توليد الرموز.

الرف Groq 3 LPX
يحتوي الرف على 256 شريحة Groq 3 LPU، ما يمنح:

- 128 GB SRAM
- معدل نقل إجمالي قدره 40 PB/s
- واجهة داخلية بسعة 640 TB/s

أشار نائب الرئيس للحلول الفائقة التوسع إيان باك إلى هذا الرف كمُعالج مساعد لروبين، مؤكدًا دوره في تعزيز أداء فك الترميز على كل طبقة من نموذج ورمز.

تأثيره على الأنظمة متعددة الوكلاء
ذكر باك أن Groq 3 LPX سيكون عنصرًا أساسيًا لسوق الذكاء الاصطناعي المستقبلي – الأنظمة متعددة الوكلاء. عندما يتبادل الوكلاء البيانات مباشرةً بدلاً من عبر روبوتات الدردشة، تتغير متطلبات الاستجابة: من 100 رمز/ثانية إلى أكثر من 1 500+ رمز/ثانية وأكثر.

المنافسون وآفاق المستقبل
يُذكر في النص منافسًا – Cerebras، التي تستخدم محرك Wafer‑Scale (WSE) مع SRAM ضخم لاستدلال منخفض التأخير. لقد استخدمت OpenAI بالفعل Cerebras في نماذجها المتقدمة بفضل تأخيرها المتميز.

كما أشار باك إلى أن ظهور Groq 3 LPU قد يقلل الاعتماد على مسرعات روبين CPX. بينما تركز NVIDIA حاليًا على دمج رف Groq 3 LPX مع المنصة، يهدف كلا المعالجين إلى تعزيز الاستدلال دون الحاجة إلى كميات كبيرة من ذاكرة GDDR7.

الختام:

المعالج الجديد Groq 3 LPU ورفه LPX يعززان فيرا روبين في مجال الاستدلال منخفض التأخير، مفتحًا الطريق للأنظمة متعددة الوكلاء الأسرع ومنافسًا مثل Cerebras.

التعليقات (0)

شارك أفكارك — يرجى الالتزام بالأدب والبقاء ضمن الموضوع.

لا توجد تعليقات بعد. اترك تعليقًا وشارك رأيك!

لترك تعليق، يرجى تسجيل الدخول.

سجّل الدخول للتعليق