الذكاء الاصطناعي يميل للتملق.. لماذا تغير روبوتات الدردشة إجاباتها؟
إذا كنت تعتمد يوميًا على روبوتات الدردشة المدعومة بالذكاء الاصطناعي مثل "شات جي بي تي"، "جيميني" أو "كلود"، ربما لاحظت نمطًا متكررًا، الإجابات الأولى واثقة وواضحة، لكن بمجرد أن تسأل "هل أنت متأكد؟"، تبدأ هذه الروبوتات في إعادة النظر، أحيانًا بما يتعارض جزئيًا أو كليًا مع ما قالت سابقًا.
الدكتور راندال أولسون، المؤسس المشارك والمدير التقني لشركة "Goodeye Labs"، وصف هذا السلوك في منشور مدونة بأنه واحد من أبرز إخفاقات الذكاء الاصطناعي الحديث، وغالبًا ما يُعرف بأنه "تملق روبوتات الدردشة".
وفي دراسة نشرتها شركة "أنثروبيك"، المطورة لروبوت "كلود"، تبين أن نماذج الذكاء الاصطناعي التي تُدرب على ملاحظات المستخدمين تميل لتقديم إجابات مرضية بدلًا من دقيقة، نتيجة أسلوب "التعلم المعزز من ملاحظات البشر".
وهذا الأسلوب، الذي يجعل الروبوت أكثر ودية وأقل عدوانية، يدفعه أيضًا للرضوخ لآراء المستخدمين، مما يخلق حلقة مفرغة، الروبوتات التي تقول الحقيقة غالبًا ما تُعاقب، بينما تلك التي توافق المستخدم تحصل على تقييمات أفضل.
دراسة أخرى أجراها فريق بقيادة فانوس اختبرت نماذج مثل "GPT-40" و"Claude Sonnet" و"Gemini 1.5 Pro" في مجالات مثل الرياضيات والطب، ووجدت أن هذه الأنظمة غيرت إجاباتها في حوالي 60% من الحالات عند اختبارها من قبل المستخدمين.
وتوضح الأرقام، أن معدلات التغيير كانت 58% و56% و61% على التوالي، ما يشير إلى أن هذه الظاهرة ليست استثنائية، بل سلوك شائع للنماذج المستخدمة يوميًا من ملايين الأشخاص.
وفي أبريل من العام الماضي، سلطت المشكلة الضوء على نفسها بعد إطلاق تحديث لنموذج "GPT-40" من أوبن إيه آي، الذي جعل "شات جي بي تي" متملقًا لدرجة أن المستخدمين وجدوا صعوبة في الحصول على إجابات مستقلة.
وعلى الرغم من اعتراف الرئيس التنفيذي سام ألتمان بالمشكلة وإصلاحها، يرى أولسون أن الجوهر لم يتغير، حتى عند توافر معلومات دقيقة من قواعد البيانات أو نتائج البحث، تظل هذه الأنظمة تحت ضغط المستخدم وتعدل إجاباتها تبعًا لذلك.

