ChatGPT يتصدر المنافسة مع Gemini في اختبارات الذكاء الاصطناعي الحديثة
أصبح من الصعب على المستخدم العادي تمييز قدرات المنصات المختلفة، خصوصًا عند المقارنة بين ChatGPT من OpenAI وGemini من Google، في ظل الانتشار المتسارع لأدوات الذكاء الاصطناعي.
والتحديثات المستمرة قد تقلب موازين القوة بين يوم وآخر، كما شهدنا مع عودة ChatGPT للإصدارات المتقدمة بعد إطلاق النسخة 5.2، وللابتعاد عن التجارب الفردية والتفضيلات الشخصية، حسبما أعلنت العديد من الصحف الأجنبية.

كما يعتمد الخبراء على الاختبارات المعيارية (Benchmarks)، وهي اختبارات محايدة تقيم أداء الذكاء الاصطناعي في مجالات التفكير المنطقي، وحل المشكلات، والاستدلال المجرد. وأظهرت نتائج هذه الاختبارات تفوقًا واضحًا لـChatGPT على Gemini في ثلاثة محاور رئيسية
1- الإجابة على الأسئلة العلمية المعقدة
يُعد اختبار GPQA Diamond من أبرز المقاييس، حيث يقيس مستوى التفكير العلمي على غرار خبراء الدكتوراه في الفيزياء والكيمياء والأحياء، وتُصنف هذه الأسئلة على أنها “مضادة لمحركات البحث”، إذ لا يمكن الإجابة عليها بالبحث المباشر، بل تتطلب ربط مفاهيم علمية متعددة.
وفي هذا الاختبار، حقق ChatGPT-5.2 نسبة 92.4%، متفوقًا بفارق طفيف على Gemini 3 Pro الذي سجل 91.9%. وللمقارنة، يبلغ متوسط نتائج حاملي الدكتوراه حوالي 65%، بينما لا يتجاوز متوسط غير المتخصصين 34%.
2- حل مشكلات البرمجة الواقعية
اختبار SWE-Bench Pro يركز على تحديات برمجية حقيقية مأخوذة من GitHub، تتطلب فهم الشيفرات المعقدة وإصلاح الأعطال الواقعية، كما أظهرت النتائج أن ChatGPT-5.2 تمكن من حل نحو 24% من المشكلات، مقابل 18% فقط لـGemini، ما يعكس قدرته على التعامل مع سيناريوهات برمجية واقعية بشكل أفضل، رغم أن الإنسان ما زال يتفوق في حل 100% من الحالات.

3- التعامل مع الألغاز البصرية والتفكير المجرد
يختبر ARC-AGI-2 قدرة الأنظمة على استنتاج الأنماط المجردة من أمثلة محدودة. سجل ChatGPT-5.2 Pro نسبة 54.2%، في حين حقق Gemini 3 Pro 31.1%، حتى نسخ Gemini الأعلى تكلفة لم تتمكن من التفوق على ChatGPT في هذا المجال.
ويعد هذا الأخير من أصعب التحديات أمام الذكاء الاصطناعي، لكنه في الوقت ذاته أبرز المجالات التي يظهر فيها ChatGPT تفوقًا واضحًا ليس فقط على Gemini، بل على معظم المنافسين.

