أشارت شركة نفيديا إلى أن تحسينات في بنية بلاكويل أدت إلى خفض تكلفة استنتاج الشبكات العصبية بمعدل عشرة أضعاف، وتُعزى هذه النتيجة ليس فقط إلى الأجهزة.

أشارت شركة نفيديا إلى أن تحسينات في بنية بلاكويل أدت إلى خفض تكلفة استنتاج الشبكات العصبية بمعدل عشرة أضعاف، وتُعزى هذه النتيجة ليس فقط إلى الأجهزة.

7 hardware

تقليل تكلفة الاستدلال على بنية Nvidia Blackwell

تتيح معالجات Nvidia Blackwell الجديدة تقليل سعر تشغيل أنظمة الذكاء الاصطناعي المدربة بمقدار 4–10 مرات. هذه بيانات نشرتها شركة Nvidia نفسها. ومع ذلك، بدون تحسينات برمجية وبنية تحتية مرافقة، لا يمكن تحقيق هذا الارتفاع.

كيف تم تحقيق خفض كبير في التكاليف
المؤشر ما ساعده البنية المعمارية Blackwell المتسارع النماذج الكود المفتوح المصدر (MoE, NVFP4 وغيرها) المنصات Baseten, DeepInfra, Fireworks AI, Together AI مجموعات البرمجيات خطوط الأنابيب المحسّنة للانخفاض الدقة
* يضاعف الترجمة إلى Blackwell الكفاءة مقارنةً بالجيل السابق من المعالجات.
* استخدام صيغ منخفضة الدقة (مثل NVFP4) يقلل المصاريف بشكل إضافي.

أمثلة عملية
الشركة المهمة النتيجة Sully.ai الرعاية الصحية، نماذج مفتوحة في Baseten 90 % توفير الاستدلال (تقليل عشرة أضعاف)، 65 % تقليل وقت الاستجابة. أتمتة الكود والسجلات الطبية وفرت 30 مليون دقيقة عمل. Latitude (AI Dungeon) الألعاب، نماذج MoE في DeepInfra تكلفة الاستدلال لملف واحد من المليون رمز انخفضت من 0,20$ إلى 0,05$: أولاً على MoE (حتى 0,10$)، ثم على NVFP4. Sentient Foundation محادثة الوكيل Fireworks AI زادت الكفاءة الاقتصادية بنسبة 25–50٪. معالجة المنصة 5,6 مليون طلب في الأسبوع دون زيادة التأخير. Decagon دعم العملاء الصوتي Together AI انخفضت تكلفة الطلب ست مرات بفضل مكدس متعدد النماذج على Blackwell. وقت الاستجابة <400 مللي ثانية حتى مع آلاف الرموز.

لماذا خصائص عبء العمل مهمة
* توليد نماذج تفكيرية ينتج المزيد من الرموز، مما يتطلب معالجات أقوى.
* تستخدم المنصات *خدمة غير مجمعة*: سياق تحضيري منفصل وتوليد رموز لمعالجة سلاسل طويلة بكفاءة.
* عند أحجام كبيرة للتوليد يمكن تحقيق زيادة كفاءة حتى 10 مرات؛ عند الأحجام الصغيرة—حتى 4 مرات فقط.

بدائل Blackwell
الترجمة إلى معالجات AMD Instinct MI300، Google TPU، Groq أو Cerebras تقلل أيضًا التكاليف. النقطة الأساسية هي اختيار مزيج الأجهزة والبرمجيات والنماذج المناسب للعبء المحدد، وليس مجرد استخدام Blackwell.

الخلاصة:
يتم تقليل تكلفة الاستدلال من خلال نهج شامل: القوة المادية (Blackwell)، النماذج المفتوحة المصدر، مجموعات البرمجيات المحسّنة والتوزيع الصحيح للمهمات. هذا يتيح للشركات توفير حتى عشرة أضعاف في الرعاية الصحية والألعاب والذكاء الاصطناعي الوكيل ودعم الصوت دون فقدان الجودة أو السرعة.

التعليقات (0)

شارك أفكارك — يرجى الالتزام بالأدب والبقاء ضمن الموضوع.

لا توجد تعليقات بعد. اترك تعليقًا وشارك رأيك!

لترك تعليق، يرجى تسجيل الدخول.

سجّل الدخول للتعليق