تفاصيل معاناة الذكاء الاصطناعي من انهيار في الدقة خلال مواجهة مشاكل معقدة
اكتشف باحثون قيوداً أساسية في نماذج الذكاء الاصطناعي المتطورة، في ورقة بحثية تثير الشكوك حول سباق صناعة التكنولوجيا لتطوير أنظمة أقوى من أي وقت مضى.
وبحسب صحيفة الجارديان البريطانية، قالت شركة أبل في ورقة بحثية نشرت في نهاية الأسبوع إن نماذج التفكير الكبيرة (LRMs) - وهي شكل متقدم من الذكاء الاصطناعي - واجهت "انهيارًا كاملاً في الدقة" عند تقديمها لمشاكل معقدة للغاية.
ووجدت الدراسة أن نماذج الذكاء الاصطناعي القياسية تفوقت على نماذج LRMs في المهام منخفضة التعقيد، بينما عانى كلا النوعين من النماذج من "انهيار تام" في المهام عالية التعقيد.
وتحاول نماذج الاستدلال الكبيرة حل الاستفسارات المعقدة من خلال توليد عمليات تفكير مفصلة تُقسّم المشكلة إلى خطوات أصغر.
وأضافت الدراسة، التي اختبرت قدرة النماذج على حل الألغاز، أنه مع اقتراب أداء نماذج LRM من الانهيار، بدأت "تقليل جهدها في التفكير المنطقي"، وقال باحثو آبل إنهم وجدوا هذا الأمر "مقلقًا للغاية".
ووصف جاري ماركوس، الأكاديمي الأمريكي الذي أصبح من أبرز المتحفظين على قدرات نماذج الذكاء الاصطناعي، ورقة آبل البحثية بأنها "مدمرة للغاية".
وأضاف أن النتائج أثارت تساؤلات حول سباق الذكاء الاصطناعي العام (AGI)، وهو مرحلة نظرية من الذكاء الاصطناعي، يتمكن فيها النظام من مضاهاة الإنسان في أداء أي مهمة فكرية.
وفي إشارة إلى نماذج اللغة الكبيرة [LLMs] التي تدعم أدوات مثل ChatGPT، كتب ماركوس: "أي شخص يعتقد أن نماذج اللغة الكبيرة هي طريق مباشر إلى نوع من الذكاء الاصطناعي العام الذي يمكن أن يحول المجتمع بشكل أساسي نحو الأفضل يخدع نفسه".
وجدت الدراسة أن نماذج الاستدلال تُبدد طاقة الحوسبة بإيجادها الحل الصحيح للمشكلات البسيطة في مرحلة مبكرة من "التفكير"، ومع ذلك، مع ازدياد تعقيد المشكلات قليلًا، استكشفت النماذج حلولًا خاطئة أولًا، ثم توصلت إلى الحلول الصحيحة لاحقًا.
أما بالنسبة للمسائل الأكثر تعقيدًا، فقد تنهار النماذج، وتفشل في توليد أي حلول صحيحة. في إحدى الحالات، حتى مع تزويدها بخوارزمية لحل المسألة، فشلت النماذج.
وجاء في الورقة البحثية: "عند الاقتراب من عتبة حرجة - والتي تتوافق بشكل وثيق مع نقطة انهيار دقتها - تبدأ النماذج بشكل يخالف الحدس في تقليل جهدها المنطقي على الرغم من صعوبة المشكلة المتزايدة".

