Skip to content Skip to footer

MiniMax الصينية تكشف عن نماذج ذكاء اصطناعي جديدة تُضاهي عمالقة الصناعة

بقلم: Kyle Wiggers 

January 15, 2025

كشفت شركة MiniMax الناشئة، المدعومة من عملاقي التكنولوجيا  Alibaba وTencent، والتي جمعت حوالي 850 مليون دولار في جولات استثمارية وتقدر قيمتها بأكثر من 2.5 مليار دولار، عن ثلاثة نماذج جديدة: MiniMax-Text-01، وMiniMax-VL-01، وT2A-01-HD. MiniMax-Text-01 يركز على النصوص فقط، بينما يتميز MiniMax-VL-01 بقدرته على فهم النصوص والصور معًا، أما T2A-01-HD فهو متخصص في توليد الصوت، وبالتحديد الكلام.

تقول MiniMax إن MiniMax-Text-01، الذي يحتوي على 456 مليار معامل، يقدم أداءً أفضل من نماذج مثل Gemini 2.0 Flash من Google في اختبارات مثل MMLU وSimpleQA، التي تقيس قدرة النموذج على حل المسائل الرياضية والإجابة عن الأسئلة المبنية على الحقائق. بشكل عام، كلما زاد عدد المعاملات في النموذج، تحسنت قدرته على حل المشكلات.

تؤكد الشركة أن MiniMax-VL-01 يُنافس نموذج Claude 3.5 Sonnet من Anthropic في الاختبارات التي تحتاج إلى فهم متعدد الوسائط، مثل ChartQA، الذي يطلب من النماذج الإجابة عن أسئلة تتعلق بالرسوم البيانية والمخططات، مثل: “ما هي القيمة القصوى للخط البرتقالي في هذا الرسم البياني؟”. ومع ذلك، لا يتفوق MiniMax-VL-01 على Gemini 2.0 Flash في العديد من هذه الاختبارات، كما أن GPT-4o ونموذج InternVL2.5 المفتوح يتفوقان عليه في عدة جوانب.

المثير للاهتمام أن MiniMax-Text-01 يتمتع بنافذة سياق هائلة تبلغ 4 ملايين رمز، مما يعني أنه يمكنه التعامل مع حوالي 3 ملايين كلمة دفعة واحدة، أي ما يعادل قراءة خمس نسخ من رواية “الحرب والسلام”. وبالمقارنة، فإن نافذة السياق الخاصة بـ MiniMax-Text-01 أكبر بـ31 مرة من تلك الخاصة بـ GPT-4o وLlama 3.1.

أما النموذج الأخير، T2A-01-HD، فهو مصمم لتوليد الصوت، مع التركيز على الكلام. يمكنه إنشاء صوت صناعي بنبرة وإيقاع قابلين للتعديل بـ17 لغة، من بينها الإنجليزية والصينية، كما يمكنه استنساخ صوت من تسجيل مدته 10 ثوانٍ فقط.

لم تُنشر مقارنة مباشرة لأداء T2A-01-HD مع النماذج الأخرى المخصصة لتوليد الصوت، لكن جودة الصوت الناتج تبدو مماثلة لتلك التي تقدمها نماذج من Meta وشركات ناشئة مثل PlayAI.

جميع النماذج الجديدة، باستثناء T2A-01-HD، يمكن تنزيلها عبر GitHub ومنصة Hugging Face. ومع ذلك، فإن هذا لا يعني أنها مفتوحة المصدر بالكامل، حيث لم تُنشر المكونات اللازمة لإعادة إنشاء هذه النماذج من البداية. كما أن MiniMax تفرض قيودًا صارمة على استخدامها، مثل منع استخدامها لتحسين نماذج منافسة، وإلزام المنصات التي تضم أكثر من 100 مليون مستخدم نشط شهريًا بالحصول على ترخيص خاص.

تأسست MiniMax في عام 2021 على يد موظفين سابقين في شركة SenseTime، وهي إحدى أكبر شركات الذكاء الاصطناعي في الصين. تشمل مشاريع الشركة تطبيقات مثل Talkie، وهي منصة تعتمد على الذكاء الاصطناعي لتقديم تجربة لعب الأدوار، بالإضافة إلى نماذج لتحويل النصوص إلى فيديو.

رغم النجاح، أثارت بعض منتجات MiniMax جدلًا. على سبيل المثال، تم إزالة تطبيق Talkie من متجر Apple في ديسمبر لأسباب تقنية غير واضحة. التطبيق كان يتضمن شخصيات ذكاء اصطناعي لمحاكاة شخصيات عامة مثل دونالد ترامب، وتايلور سويفت، وإيلون ماسك، وليبرون جيمس، دون موافقتهم. كما أشارت تقارير إلى أن مولدات الفيديو الخاصة بالشركة قادرة على إعادة إنتاج شعارات قنوات تلفزيونية بريطانية، مما يثير تساؤلات حول استخدام محتوى محمي بحقوق النشر في تدريب النماذج. وتواجه الشركة دعوى قضائية من منصة iQiyi للبث، تتهمها فيها باستخدام تسجيلات محمية بحقوق النشر بشكل غير قانوني.

تأتي هذه الإصدارات الجديدة وسط توترات سياسية واقتصادية، حيث أعلنت إدارة بايدن المنتهية ولايتها مؤخرًا عن قواعد جديدة أكثر صرامة لتصدير تقنيات الذكاء الاصطناعي إلى الشركات الصينية. القواعد الجديدة قد تزيد القيود على تصدير الرقائق والنماذج اللازمة لتطوير أنظمة الذكاء الاصطناعي المتقدمة.

من الواضح أن المنافسة في مجال الذكاء الاصطناعي تستمر بالتصاعد، مما يجعل الساحة أكثر تشويقًا وتعقيدًا.

المصدر: techcrunch

Leave a comment