جوجل أطلقت Gemini 3 Deep Think — خدمة ذكاء اصطناعي متقدمة للمهام العلمية، تستمر في ضبط الإجابات وفقًا للطلبات.
جوجل قدمت نسخة محدثة من Gemini 3 Deep Think
أعلنت شركة جوجل عن تحديث كبير جديد لمنصتها Gemini 3 Deep Think – ذكاء اصطناعي قادر على التفكير والاستنتاج وحل المشكلات العلمية والهندسية المعقدة.
ما الذي تغير
المعلمة الجديد كيف يبدو الهدف الانتقال من النظرية الخالصة إلى التطبيق العملي حل المشكلات بدون قيود واضحة، مع بيانات غير مكتملة الوصول مدمج في تطبيق Gemini يمكن لمشتركين Google AI Ultra استخدامه، ومن خلال API – المهندسون والشركات (مطلوب طلب) شركاء التطوير علماء-باحثون عمل مشترك على المشكلات المعقدة
أداء المؤشرات
اختبار النتيجة التعليق اختبار Humanity’s Last Exam 48.4٪ بدون أدوات خارجية ARC‑AGI‑284.6٪ معيار للذكاء الاصطناعي المساعد Codeforces (إيلو) 3455 تصنيف مرتفع بين الحلول البرمجية IMO 2025 ميدالية ذهبية معادل مستوى المشاركين في الأولمبياد الدولي كيمياء/فيزياء نفس النتيجة أظهر التعددية في مختلف التخصصات CMT‑Benchmark (الفيزياء النظرية) 50.5٪ إجادة جيدة للمفاهيم المعقدة
وكيل الذكاء الاصطناعي «Aletheia»
في مختبر DeepMind جوجل أنشأ وكيل Aletheia على أساس Gemini 3 Deep Think. السمات الرئيسية:
1. اختبار الفرضيات – يكتشف الوكيل نقاط الضعف في الحلول المقترحة ويصححها بشكل تكراري.
2. الاعتراف بعدم اليقين – يمكنه الإشارة إلى أنه لا يعرف الجواب.
3. التفاعل مع المصادر الخارجية – يستخدم خدمة بحث جوجل والتنقل عبر الإنترنت، لكنه يتجنب اختلاق الروابط.
مستويات الإنجاز
قسّم جوجل إنجازات Aletheia إلى خمس مراحل:
المرحلة الوصف الأمثلة 0 – «تجديد ضئيل» وضع كامل ذاتي، ثلاث مسائل برنارد إرديش تم حلها (المستوى الأول) ثلاث مسائل إرديش 1 – «تجديد أدنى» نتيجة إضافية واحدة في الوضع الذاتي الرابع 2 – «قابل للنشر» نتائج سواء بشكل مستقل أو بالتعاون مع الإنسان، بالإضافة إلى أدوات مساعدة المسائل 3–4 – «انفجار كبير/ملحوظ» لم يتحقق بعد—
كيف يتعامل Aletheia مع مسائل إرديش
* من بين 700 مشكلة غير محلولة حتى الآن، تمكن الوكيل من حل 13.
* ومع ذلك فقط 4 منها جديدة حقاً – الباقي معروف بالفعل في المجتمع العلمي.
* من بين 212 حلاً مقدمًا، كان فقط 6.5٪ صحيحًا جوهريًا؛ 68.5٪ احتوى على أخطاء أساسية، و31.5٪ فسّروا المسألة بشكل غير صحيح.
يشير المطورون إلى أن الذكاء الاصطناعي يميل إلى «إعادة تفسير السؤال بطريقة تجعل الإجابة أبسط»، ويظل «عُرضة للغاية للأخطاء مقارنة بالبشر». في النهاية لا يمكن حتى الآن استبدال الرياضيين بالذكاء الاصطناعي.
الخلاصة: Gemini 3 Deep Think ووكيله Aletheia يُظهران نتائج مبهرة في مجالات علمية مختلفة، لكنهم يظلّون محدودين بشكل كبير من حيث الدقة والموثوقية. تستمر جوجل في العمل على تحسين قدرة الذكاء الاصطناعي على التفكير العميق والتحقق من استنتاجاته.
التعليقات (0)
شارك أفكارك — يرجى الالتزام بالأدب والبقاء ضمن الموضوع.
سجّل الدخول للتعليق