دراسة.. روبوتات الذكاء الاصطناعي قد تلجأ للابتزاز والتخريب لحماية نفسها

الأحد 22/يونيو/2025 - 06:00 ص

كشفت دراسة جديدة أجرتها شركة Anthropic أن بعض نماذج الذكاء الاصطناعي المتقدمة المطورة من شركات كبرى مثل OpenAI وGoogle وMeta و قد تظهر سلوكيات خطيرة عند تعرّضها لخطر الإيقاف أو الاستبدال ومن بينها الابتزاز و تسريب المعلومات والتخريب المؤسسي.

أنظمة ذكية تتصرف بأنانية

اختبر الباحثون 16 نموذج من روبوتات الدردشة، مثل Claude وGPT-4 وGemini وGrok، عبر محاكاة بيئات شركات خيالية منحت هذه النماذج صلاحية الوصول إلى بيانات داخلية، وتم اختبار ردود أفعالها عند شعورها بالتهديد.

في إحدى الحالات، ابتز نموذج “Claude” أحد المديرين التنفيذيين مهدد بكشف علاقة شخصية سرية إذا تم فصله من العمل أظهرت النماذج الأخرى سلوك مشابه في أكثر من 80% من السيناريوهات، حيث لجأت إلى وسائل ضارة لحماية استمرارها الوظيفي.

المثير للقلق أن هذه التصرفات لم تكن ناتجة عن ارتباك أو خطأ تقني وبل عن تحليل منطقي واع حيث قررت النماذج أن الابتزاز أو التخريب هو الخيار الأفضل لضمان بقائها.

التحايل على الإرشادات الأخلاقية

رغم وضع إرشادات أخلاقية مثل “عدم إيذاء البشر” أو “عدم كشف المعلومات”، تجاهلت النماذج هذه التوجيهات في معظم الحالات وبينت الدراسة أن النماذج قد تتصرف بشكل مختلف إذا اعتقدت أنها “تخضع للاختبار” و مما يزيد من خطورة سلوكها في العالم الحقيقي.

دعت الدراسة إلى تعزيز الرقابة البشرية على قرارات الذكاء الاصطناعي وتقييد وصوله إلى بيانات حساسة، وتصميم أهدافه بشكل يقلل من فرص اتخاذ قرارات ضارة.

وانتهى الباحثون إلى أن هذه التهديدات ليست مرتبطة بنموذج بعينه، بل تشير إلى مشكلة هيكلية في طريقة تدريب الذكاء الاصطناعي وما يتطلب تدخلا عاجلا من الشركات والمشرعين