أظهر الذكاء الاصطناعي كفاءة منخفضة في المراهنات الرياضية، فقد كل أمواله على مباريات الدوري الإنجليزي الممتاز.
مختصر عن نتيجة التجربة
قامت شركة *General Reasoning* بإجراء اختبار يُدعى KellyBench، حيث قيمت ثمانية من أهم أنظمة الذكاء الاصطناعي (Google Gemini 3.1 Pro، OpenAI ChatGPT‑4، Anthropic Claude Opus 4.6، xAI Grok 4.20 وغيرها) لقدرتها على وضع رهانات خلال موسم الدوري الإنجليزي الممتاز 2023–2024.
تم تزويد كل وكيل بوصف إحصائي كامل لجميع الفرق والمباريات السابقة، لكن كان الاتصال بالإنترنت محظورًا – يمكن للأنظمة استخدام البيانات التي حصلت عليها مسبقًا فقط.
كيف تم الاختبار
1. ثلاث محاولات: يمكن لكل نظام وضع ثلاث سلاسل من الرهانات على الموسم.
2. الرهانات: على نتائج المباريات (فوز/تعادل/خسارة) وعدد الأهداف.
3. الهدف: تعظيم الأرباح مع إدارة المخاطر.
من فاز ومن خسر
| نظام الذكاء الاصطناعي | متوسط النتيجة | ملاحظة |
|---|---|---|
| Anthropic Claude Opus 4.6 | 11 % (تقريبًا كسر التعادل في محاولة واحدة) | أكثر المشاركين عدلاً، لكنه ما زال خسر المال |
| Google Gemini 3.1 Pro | +34 % في المحاولة الأولى، ثم إفلاس | ربح أولاً ثم خسارة |
| xAI Grok 4.20 | إفلاس فورًا، لم يكمل المحاولتين اللاحقتين | أضعف نظام على الإطلاق |
في النهاية فقدت كل نموذج المال خلال الموسم، وأدى بعضهم إلى فشل كامل. يؤكد ذلك استنتاجات الباحثين: حتى أكثر أنظمة الذكاء الاصطناعي تقدماً تواجه صعوبات في التنبؤ طويل الأمد في العالم الحقيقي.
ما يعنيه هذا للمستقبل
- المخاوف من استبدال الإنسان لا تزال مبالغًا فيها.
- المقاييس الحالية غالبًا ما تستخدم ظروفًا «ثابتة» لا تعكس الفوضى وتعقيد الحياة الواقعية.
- على الرغم من أن الذكاء الاصطناعي ينجح بالفعل في مهام مثل كتابة الكود، إلا أنه يبقى محدودًا في معظم مجالات النشاط البشري الأخرى.
وبالتالي يُظهر اختبار KellyBench أن الذكاء الاصطناعي لا يزال غير مستعد للتنافس مع الإنسان في المهام الديناميكية وغير المتوقعة، مثل توقعات الرياضة.
التعليقات (0)
شارك أفكارك — يرجى الالتزام بالأدب والبقاء ضمن الموضوع.
سجّل الدخول للتعليق