«جوجل» تكشف خللًا في تقييم أخلاقيات الذكاء الاصطناعي.. القصة الكاملة
نشرت Google DeepMind دراسة حديثة دعت فيها إلى مراجعة آليات تقييم السلوك الأخلاقي لأنظمة الذكاء الاصطناعي، مشيرة إلى أن الأساليب المعتمدة حاليًا تركز على شكل الإجابة ومظهرها المتماسك، أكثر من اختبار مدى استيعاب الأنظمة الفعلي للمبادئ الأخلاقية التي تستند إليها تلك الإجابات.
وبحسب الدراسة الصادرة في دورية Nature، أوضح الباحثون أن التوسع في استخدام النماذج اللغوية داخل قطاعات حساسة، مثل الرعاية الصحية ودعم الصحة النفسية واتخاذ القرارات الشخصية، يفرض ضرورة التحقق من امتلاك هذه الأنظمة فهمًا حقيقيًا للاعتبارات الأخلاقية، خاصةً أن أي قصور في هذا الجانب قد ينعكس بصورة مباشرة على حياة الأفراد.
تمييز بين الأداء والكفاءة
وخلُصت الدراسة إلى ضرورة التفريق بين الأداء الأخلاقي والكفاءة الأخلاقية، فالأول يرتبط بقدرة النظام على تقديم إجابات تبدو سليمة ومتوافقة مع المعايير المتوقعة، بينما يشير الثاني إلى فهم الأسباب التي تجعل سلوكًا ما صائبًا أو خاطئًا.
ويرى الباحثون أن معظم الاختبارات الراهنة تنحاز إلى قياس الأداء لسهولة رصده كمّيًا، دون التعمق في اختبار الفهم الفعلي.

وأشارت الدراسة إلى أن النماذج اللغوية تعتمد في جوهرها على التنبؤ الإحصائي بالكلمات استنادًا إلى بيانات تدريب ضخمة، ما يمكّنها من إنتاج ردود مقنعة حتى في غياب منطق أخلاقي داخلي.
كما لفتت إلى تعقيدات إضافية، أبرزها اختلاف القيم الأخلاقية بين الثقافات، وتشابك المواقف الواقعية التي تتطلب الموازنة بين مبادئ متعارضة، مثل العدالة مقابل التكلفة أو الصدق مقابل اللطف.
مقترحات لاختبارات أكثر عمقًا
واقترح الباحثون تطوير سيناريوهات تقييم مركّبة وغير مألوفة، يصعب أن تكون وردت ضمن بيانات التدريب، بهدف التمييز بين الفهم الحقيقي والتقليد السطحي للأنماط السابقة.
كما دعوا إلى اختبار قدرة الأنظمة على الانتقال بين أطر أخلاقية مختلفة وفقًا للسياق، كالتعامل مع مبادئ أخلاقيات الطب الحيوي في حالة، وقواعد عسكرية في حالة أخرى، معتبرين أن نجاح النظام في تعديل منطقه تبعًا للموقف يعكس مستوى أعمق من الاستيعاب.
وفي ختام الدراسة، أكد الفريق البحثي أن النماذج الحالية لا تزال تميل إلى الاعتماد على الحسابات الإحصائية أكثر من امتلاك فهم أخلاقي راسخ، مشددين على أن معالجة هذا التحدي تتطلب تطوير البنية التقنية وأساليب التدريب، إلى جانب تبني معايير تقييم جديدة تقيس الكفاءة الأخلاقية بشكل مباشر ودقيق.

