بالتعاون مع OpenAI.. مايكروسوفت تزلزل سوق الذكاء الاصطناعي بنماذج جديدة
عادت تقنيات الذكاء الاصطناعي لتستحوذ على اهتمام العالم مجددا، حيث أعلنت شركة مايكروسوفت عن إطلاق أولى نماذجها الداخلية في هذا المجال الحيوي، وتأتي هذه الخطوة في إطار شراكة معقدة ومستدامة تجمع بين مايكروسوفت وOpenAI، المطورة الشهيرة لنماذج ChatGPT.
وكشف قسم الذكاء الاصطناعي في مايكروسوفت عن نظامين جديدين هما: MAI-Voice-1 AI وMAI-1-preview، ويبرز من بينهما نموذج MAI-Voice-1، وهو نموذج صوتي متطور قادر على توليد دقيقة كاملة من الصوت خلال أقل من ثانية واحدة، باستخدام معالج رسوميات واحد (GPU) فقط، أما النموذج الثاني، MAI-1-preview، فيقدم لمحة عن الخدمات المستقبلية المخطط إدراجها ضمن نظام Copilot.
مايكروسوفت تطلق نموذجين جديدين للذكاء الاصطناعي
وبحسب تجربة المستخدم، فإن جودة الصوت الناتجة عن MAI-Voice-1 تقارب الصوت البشري الحقيقي بشكل مثير للإعجاب، وهو ما يثير إعجاب البعض ويثير قلق آخرين من استبدال أدوات الذكاء الاصطناعي للإبداع البشري.
ولا تتوقف مايكروسوفت عند مرحلة الإعلان، إذ بدأت بالفعل في استخدام MAI-Voice-1 لتشغيل خدمة Copilot Daily، حيث يقوم مضيف ذكي بقراءة الأخبار اليومية، كما تُستخدم هذه التقنية في إنشاء محادثات صوتية بأسلوب البودكاست لشرح المواضيع المعقدة.
لمن يرغب بتجربة النظام، يمكن التوجه إلى Copilot Labs حيث يمكن كتابة النص المطلوب، وتعديل الصوت وأسلوب الكلام حسب الرغبة. أما MAI-1-preview، فقد تم تدريبه باستخدام حوالي 15000 وحدة معالجة Nvidia H100، وهو موجه للرد على الأسئلة النصية وتنفيذ التعليمات بدقة.
تخطط مايكروسوفت لإدماج MAI-1-preview في مهام نصية محددة داخل Copilot، الذي كان يعتمد حتى الآن على نماذج OpenAI الكبيرة، كما بدأ اختبار MAI-1-preview في موقع LMArena للمقارنات العامة.
لكن مايكروسوفت ليست الوحيدة التي تحرز تقدما في هذا المجال، إذ أطلقت OpenAI مؤخرا نموذجها المتقدم ChatGPT 5، الذي يتميز بقدرته على تقديم إجابات مختصرة أو مفصلة بحسب الحاجة، ما يجعله نظاما موحدا ذكيا.
ومع هذه الإصدارات الجديدة، تشهد علاقة مايكروسوفت المعقدة مع OpenAI فصلا جديدا، حيث لم تعد العلاقة مقتصرة على التعاون، بل تحولت إلى منافسة مباشرة، فبينما تظل مايكروسوفت داعما رئيسيا لشريكها، فإنها تسعى بقوة لنشر نماذجها التي تنافس ChatGPT 5.
وفي نفس الوقت، تتقدم جوجل في مجال الذكاء الاصطناعي البصري، حيث أطلقت فريق DeepMind نموذجا جديدا لتحرير الصور يحمل اسما غريبا “nano banana”، مع ميزة الحفاظ على ملامح المستخدم دون تغيير أثناء التعديل، وهو ما طال انتظاره، كما طرحت جوجل نموذج Gemini 2.5 Flash Image، الأقوى لديها في توليد الصور حتى الآن.




