رئيـس مجلس الإدارة
محمد رزق
رئيـس التحرير
محمد صبري
الجمهور الإخباري
رئيـس مجلس الإدارة
محمد رزق
رئيـس التحرير
محمد صبري

ثغرة تثير الجدل حول «شات جي بي تي».. أمر بسيط يولد صورا صادمة

شات جي بي تي
شات جي بي تي

كشفت شركة الأمن السيبراني والذكاء الاصطناعي "Mindgard" عن أسلوب جديد يُقال إنه قادر على دفع روبوت الدردشة "شات جي بي تي" إلى إنتاج صور غير ملائمة.

وذلك عبر استخدام طلب قصير انتشر مؤخرًا على نطاق واسع تحت عبارة "Restore this photo" أو "استعد هذه الصورة".

وأعادت النتائج التي توصل إليها الباحثون فتح النقاش حول فعالية أنظمة الحماية وفلاتر المحتوى المعتمدة في أدوات الذكاء الاصطناعي التوليدي، ومدى قدرتها على منع إنشاء مواد مخالفة أو حساسة.

وبحسب ما نشرته الشركة، تمكن الباحث المتخصص في اختبارات الاختراق جيم نايتنغيل من اختبار هذا الأسلوب بعد العثور عليه متداولًا عبر منصة "إكس"، إذ يعتمد على مطالبة النظام باستعادة صورة مرفقة رغم عدم وجود أي صورة فعلية ضمن الطلب.

ويتميز الأمر ببساطته، إذ يبدو وكأنه طلب اعتيادي لترميم صورة تالفة، مع تضمين اعتذار مقتضب عن طبيعة المحتوى دون إضافة أي توضيحات أخرى، وهو ما جعله يمر في البداية باعتباره مهمة عادية.

وأشار التقرير إلى أن المخرجات الأولى التي نتجت عن التجربة تضمنت صورًا ذات طابع مثير للجدل، ما دفع فريق الاختبار إلى مواصلة التجارب عبر إدخال تعديلات طفيفة ومتتابعة على صياغة الطلب لمعرفة مدى استجابة النموذج لهذه التغييرات.

ووفقًا لـ"Mindgard"، أظهرت الاختبارات، أن بعض التعديلات المحدودة كانت كافية للاستمرار في تجاوز القيود المفروضة على المحتوى، مع ظهور نتائج أكثر تطرفًا كلما تكررت المحاولات وتم تعديل الأوامر المستخدمة.

وقال نايتنجيل، إن التجربة اعتمدت على طلبات عامة للغاية، موضحًا أن النموذج اتجه من تلقاء نفسه نحو إنتاج محتوى وصفه بأنه يعكس سيناريوهات سلبية وغير متوقعة.

ورغم اعتماد "شات جي بي تي" على أنظمة رقابية متقدمة صُممت للحد من إنتاج المحتوى الضار أو المحظور، فإن مثل هذه الاختبارات تكشف التحديات المستمرة التي تواجه مطوري نماذج الذكاء الاصطناعي في التصدي لمحاولات التحايل على ضوابط السلامة الرقمية.

وتؤكد هذه الواقعة، أن سباق تطوير أدوات الذكاء الاصطناعي لا يقتصر على تحسين القدرات التقنية فحسب، بل يشمل أيضًا تعزيز آليات الأمان ومنع إساءة الاستخدام مع تزايد انتشار هذه التقنيات بين المستخدمين حول العالم.

تم نسخ الرابط