من النصوص إلى الفيديو.. علي بابا تقدم نموذجا متعدد الوسائط للذكاء الاصطناعي

الخميس 27/مارس/2025 - 07:01 م

أطلقت مجموعة علي بابا الصينية، نموذجا جديدا للذكاء الاصطناعي ضمن سلسلة QWEN، الذي قالت الشركة إنه قادر على معالجة النصوص والصور والصوت والفيديو، ويتميز بكفاءة عالية تسمح بتشغيله مباشرة على الهواتف المحمولة وأجهزة الكمبيوتر المحمولة.

وأوضحت “علي بابا” أن النموذج الجديد، المتاح الآن للمستخدمين على منصتي Face وGitHub، يستخدم لإنشاء ما يعرف بوكلاء الذكاء الاصطناعي الذين يمكنهم، على سبيل المثال، مساعدة الأشخاص ذوي الإعاقة البصرية في التنقل عبر بيئاتهم من خلال تقديم أوصاف صوتية في الوقت الفعلي.

علي بابا تقدم نموذجا متعدد الوسائط للذكاء الاصطناعي

منذ بداية هذا العام، واصلت “علي بابا” إصدار منتجات الذكاء الاصطناعي بوتيرة سريعة، حيث أطلقت نسخة جديدة من طراز QWEN بعد أيام قليلة من إطلاق Deepseek في يناير، وفي وقت لاحق من الشهر الحالي كشفت عن نسخة محدثة من تطبيق مساعد الذكاء الاصطناعي "Quark".

وتعتبر “علي بابا” ليست الوحيدة في مجال تطوير نماذج الذكاء الاصطناعي متعددة الوسائط، حيث تقدم كل من جوجل وألفابت وOpenAI أدوات ذكية يمكنها معالجة أنواع مختلفة من المدخلات مثل النصوص والصوت.

وفي 25 مارس، أعلنت OpenAI عن إضافة ميزات توليد الصور المتقدمة إلى ChatGPT، وأكدت “علي بابا” أن نظام QWEN2.5-OMNI-7B الجديد أظهر أداء متميزا بشكل خاص في مجالي فهم الكلام وتوليده.

تسعى الشركة، التي أسسها جاك ما، إلى زيادة استثماراتها في مجالات الذكاء الاصطناعي والحوسبة السحابية بشكل يتجاوز ما أنفقته خلال العقد الماضي، مع التطلع لتكون شريكا رئيسيا للشركات التي تعمل على تطوير وتطبيق الذكاء الاصطناعي في العالم الواقعي، خاصة مع تطور النماذج واحتياجها إلى مزيد من قوة الحوسبة.

وفي ظل التنافس المتزايد، تقدم الشركات الصينية مثل Deepseek وOpenAI نماذج قوية بتكلفة منخفضة مقارنة بالنماذج الغربية، مما يضغط على الشركات الأمريكية الكبرى مثل OpenAI وجوجل لتغير ديناميكيات السوق.

بينما لا يزال النقاش قائما حول ما إذا كانت هذه الأنظمة من الذكاء الاصطناعي قد تفوق أو تتماشى مع الأنظمة المتقدمة من المطورين الغربيين، إلا أن هذه الابتكارات الحديثة تفرض تحديات جديدة على النماذج التجارية لشركات التكنولوجيا الأمريكية الرائدة.