أصدرت مايكروسوفت ثلاث نماذج داخلية جديدة للذكاء الاصطناعي لإنشاء النص والكلام والرسومات
تطلق شركة مايكروسوفت للذكاء الاصطناعي ثلاث نماذج متعددة الوسائط جديدة
في إطار جهود تعزيز موقعها في مجال الذكاء الاصطناعي، أعلنت وحدة البحث التابعة لمايكروسوفت للذكاء الاصطناعي عن إطلاق ثلاثة نماذج مملوكة قادرة على توليد النص والصوت والرسومات. جاء هذا القرار استجابةً للمنافسة مع مختبرات الذكاء الاصطناعي الرائدة.
| النموذج | الغرض | المؤشرات الرئيسية |
|---|---|---|
| MAI‑Transcribe‑1 | تحويل الكلام إلى نص | 25 لغة، سرعة 2,5× أسرع من Azure Fast |
| MAI‑Voice‑1 | إنشاء مسار صوتي | دقيقة في ثانية واحدة، ضبط الأصوات |
| MAI‑Image‑2 | توليد صور وفقًا للنص |
تم تطوير المشروع بواسطة فريق MAI Superintelligence – وحدة أبحاث أساسية في مجال أنظمة الذكاء الاصطناعي المتقدمة. انضم الرئيس التنفيذي مصطفى سليمان (Mustafa Suleyman) إلى الفريق في نوفمبر 2025.
الفعالية الاقتصادية
ركز المطورون بشدة على خفض تكلفة الحوسبة مقارنةً بالمقابلات من Google وOpenAI:
| الخدمة | السعر |
|---|---|
| فك تشفير النص | 0,36 دولار/ساعة |
| توليد الصوت | 22 دولارًا لكل مليون رمز |
| معالجة الصور | 5 دولارات لكل مليون رمز إدخال؛ 33 دولارًا لتوليد مليون رمز إخراج |
تم نشر النماذج بالفعل على منصة Microsoft Foundry. تتوفر خدمات الترجمة وتوليد الصوت في MAI Playground.
الشراكة مع OpenAI
على الرغم من التطوير الفعال للحلول الخاصة، أكد مصطفى سليمان الالتزام بالتعاون مع OpenAI: استثمرت مايكروسوفت أكثر من 13 مليار دولار. ستستمر الشركة في استخدام نماذج OpenAI في منتجاتها وفقًا لعقد طويل الأمد، مستخدمة استراتيجية تنويع مشابهة للعمل مع الرقائق الدقيقة.
بهذا الشكل، تعزز مايكروسوفت للذكاء الاصطناعي موقعها في سوق الذكاء الاصطناعي من خلال تقديم حلول متعددة الوسائط سريعة واقتصادية مع الحفاظ على علاقات وثيقة مع الشركاء الرئيسيين.
التعليقات (0)
شارك أفكارك — يرجى الالتزام بالأدب والبقاء ضمن الموضوع.
سجّل الدخول للتعليق