رئيـس مجلس الإدارة
محمد رزق
رئيـس التحرير
محمد صبري
الجمهور الإخباري
رئيـس مجلس الإدارة
محمد رزق
رئيـس التحرير
محمد صبري

علي بابا تطلق نموذجا جديدا لتوليد الصور بدقة نصوص غير مسبوقة

Qwen
Qwen

كشفت شركة علي بابا عن نموذج ذكاء اصطناعي جديد لتوليد الصور يدعى Qwen-Image، يتميز بقدرته الفريدة على إنشاء صور تحتوي على نصوص معقدة ومتعددة اللغات بدقة عالية، وهو ما لا تزال العديد من الأدوات الأخرى تُعاني منه.

تم تطوير Qwen-Image بواسطة فريق Qwen التابع لعلي بابا، وتم تصميمه خصيصًا للتعامل مع سيناريوهات متنوعة تشمل: كتابة الشعر اليدوي والملصقات ثنائية اللغة وملصقات المنتجات التجارية والرسومات التعليمية المعقدة.

 

 

ويحافظ النموذج على جودة عالية للنصوص، سواء كانت بالحروف الأبجدية مثل الإنجليزية أو الكتابة الرمزية مثل الصينية، ما يجعله مفيدا جدا في البيئات متعددة اللغات.

متاح للتجربة والاستخدام التجاري


يمكن للمستخدمين تجربة Qwen-Image عبر موقع Qwen Chat من خلال تفعيل وضع توليد الصور، كما أطلق النموذج بترخيص Apache 2.0، مما يتيح للمطورين والشركات استخدامه وتعديله وتوزيعه لأغراض تجارية، بشرط ذكر المصدر.

كيف تم تدريب النموذج؟


اعتمدت علي بابا على مليارات الصور والنصوص في تدريب النموذج، تتنوع بين: صور من مشاهد طبيعية، وصور شخصية، وملصقات فنية، وبيانات نصية مولدة صناعيا داخل الشركة (بدون الاستعانة بأي صور مولدة بنماذج أخرى).

ساعد هذا التدريب الداخلي النموذج في التعرف على الأحرف النادرة أو المعقدة، خصوصًا في اللغة الصينية.

تم التدريب على مراحل، بدءا من صور بسيطة مشروحة، وصولا إلى تخطيطات أكثر تعقيدا ونصوص مزدحمة بلغات متعددة، وهو ما سمّته الشركة التدريب بأسلوب المناهج الذي حسّن أداء النموذج بشكل كبير.

التقنية خلف Qwen-Image


يتكون النموذج من ثلاثة أجزاء رئيسية:

- Qwen2.5-VL: نموذج لغوي متعدد الوسائط لفهم السياق

- VAE: مشفر/مفكك للصور عالية الدقة

- MMDiT: نموذج انتشار (Diffusion) بتشفير خاص للمحافظة على تنسيق النصوص

تعمل هذه العناصر سويا لإنتاج صور دقيقة في النصوص والمظهر العام، سواء من حيث التصميم أو التناسق البصري.

المرتبة الثالثة عالميا بين النماذج المفتوحة


وفقا لتقييمات منصة AI Arena التي تعتمد على تقييم بشري للنماذج، يحتل Qwen-Image المرتبة الثالثة عالميًا بين جميع نماذج توليد الصور، ويُعد أفضل نموذج مفتوح المصدر حاليًا في هذه الفئة.

تم نسخ الرابط