من صورة إلى موقع جغرافي.. ChatGPT يحدد المواقع بدقة مذهلة
كشفت OpenAI هذا الأسبوع عن قدرات غير مسبوقة في نماذجها الجديدة، حيث بات بإمكانها تحديد مواقع الصور استنادا إلى دلائل بصرية وسياقية، وهو ما وصفته الشركة بأنه "اختراق كبير في الإدراك البصري للذكاء الاصطناعي".
في تجربة باتت تعرف باسم "تحدي الجغرافيا العكسية" أو GeoGuessing، بدأ مستخدمون في تحميل صور وسؤال ChatGPT عن المكان الذي التقطت فيه، وكانت النتائج؟ مدهشة بدقتها، حتى عند غياب أي إشارات واضحة.
إنجاز بصري جديد من OpenAI
يقوم ChatGPT بتحليل الصورة خلال ثوان قليلة، ثم يعرض تخمينه مصحوبا بـ"سلسلة منطق داخلية" تشرح كيف توصل إلى هذا الاستنتاج، ففي إحدى التجارب، التقط مستخدم صورة لكتاب في مكتبة، وتمكن النموذج من تحديد الموقع بدقة على أنه جامعة ملبورن، فقط من خلال رمز صغير على الملصق.
في حالة أخرى، تعرف النموذج على صورة عامة لمنزل في سورينام، ويعتقد أنها مأخوذة من Google Earth، وحدد الموقع بدقة، التجربة أشبه بـ"نسخة ذكاء اصطناعي من الرجل الذي يخمن المواقع بدقة مذهلة على يوتيوب".
دقة غير مسبوقة بفضل نموذج o3
ورغم وجود تقنيات مشابهة سابقا، إلا أن نموذج o3 الأحدث من OpenAI هو من جعل هذه الميزة أكثر شيوعا بفضل دقته وسهولة استخدامه عبر ChatGPT، ويذكر أن النموذج الحالي GPT-4o يملك القدرة ذاتها، لكن بدرجة دقة أقل.
في تجربة ميدانية، طلب من كل من GPT-4o وo3 تحديد موقع صورة جديدة من معرض نيويورك للسيارات تظهر فيها سيارة Subaru الكهربائية الجديدة، النموذج GPT-4o اقترب من التخمين الصحيح، مشيرا إلى أن الصورة ربما التقطت في معرض سيارات كبير مثل شيكاغو أو لوس أنجلوس أو نيويورك، لكنه أخطأ في اسم السيارة، أما نموذج o3 الأحدث، فحلل الصورة لما يقارب دقيقتين، ثم حدد بدقة أن الصورة من معرض نيويورك الدولي للسيارات 2025 داخل مركز "جافيتس" في مانهاتن.
ميزة أخرى مثيرة هي قدرة النموذج على تحليل الصور المشوشة أو غير المكتملة، في إحدى التجارب، حللت صورة لملاحظات مكتوبة بخط مقلوب وغير واضح، فقام ChatGPT بتدوير الصورة، ثم قراءة النص بدقة.
رغم هذا التقدم، تحذر OpenAI من أن النموذج لا يزال عرضة لبعض "الأخطاء الإدراكية الأساسية"، مشيرة إلى أنه حتى عند اتباع خطوات تحليل صحيحة، قد تؤدي تفسيرات خاطئة للمشهد البصري إلى نتائج غير دقيقة.
ومع صعود هذه القدرات، تزايدت المخاوف حول الخصوصية، فقد كشف تقرير سابق لموقع 404 Media أن أدوات تحديد المواقع بالذكاء الاصطناعي قد تستغل من قبل جهات إنفاذ القانون أو حتى متحرشين رقميين، خاصة عند استخدامها لتحديد أماكن الصور المنشورة على مواقع التواصل.
OpenAI بدورها أكدت أنها وضعت ضوابط لحماية الخصوصية، منها رفض الاستجابة لطلبات تتعلق بمعلومات حساسة أو تحديد هوية الأفراد في الصور، إلى جانب مراقبة الاستخدام واتخاذ إجراءات عند رصد انتهاكات.
وتختم الشركة بالقول إن هذه التقنية "قد تكون مفيدة في مجالات مثل تحسين الوصول لذوي الاحتياجات، دعم الأبحاث، أو تحديد المواقع في حالات الطوارئ"، لكنها تدرك أهمية موازنة التطور مع الحفاظ على خصوصية المستخدمين.





