MiniMax-M2.7: نموذج وكيل مفتوح الأوزان بحجم 229B، و113 نسخة مكممة، وتحفظات مهمة على الترخيص

⏱️ وقت القراءة المقدر: 7 دقائق

مخطط مفاهيمي لـ MiniMax-M2.7

نظرة عامة على MiniMax-M2.7

أصدرت MiniMax هذا النموذج تحت المعرّف MiniMaxAI/MiniMax-M2.7. يبلغ إجمالي معاملاته 229B مع دعم ثلاثة أنواع بيانات: F32 وBF16 وFP8 (F8_E4M3). الدعم الأصلي لـ FP8 يمنح مزايا في كفاءة الذاكرة ومعدل الإنتاجية على وحدات GPU الحديثة من NVIDIA (H100 وH200 وسلسلة Blackwell).

الترخيص مصنّف “other”. من يعتزم استخدام النموذج أو نشره تجاريًا عليه قراءة نص LICENSE الأصلي مباشرة.

البنية المعمارية

لم تُفصح بطاقة النموذج المتاحة للعموم عن تفاصيل بنية MoE في M2.7، كعدد الخبراء والخبراء النشطين وآلية الانتباه وطول السياق. المعلومات الرئيسية المعلنة هي مجموع المعاملات البالغ 229B ودعم FP8.

تُبرز بطاقة النموذج ميزتين: أولاهما قدرة الوكيل الفريقي (agent team) التي تُتيح لوكلاء متعددين يمتلكون هويات دورية التعاون واتخاذ قرارات مستقلة. وثانيتهما ادعاء التطور الذاتي (self-evolution) القائل إن النموذج خضع لأكثر من 100 جولة تحسين ذاتي وفق الإصدار الداخلي. هذه الأرقام صادرة عن المطوّر دون تحقق مستقل، لذا يُنصح بالتثبت منها بالاختبار الفعلي على المهام المستهدفة.

استخدام الأدوات (tool-use) مدعوم بصورة صريحة.

المعايير

فيما يلي الأرقام من بطاقة النموذج على HF:

المعيار	MiniMax-M2.7
MLE Bench Lite	66.6%
SWE-Pro	56.22%
SWE Multilingual	76.5
Multi SWE Bench	52.7
VIBE-Pro	55.6%
Terminal Bench 2	57.0%
NL2Repo	39.8%
GDPval-AA ELO	1495
Toolathon	46.3%
MM Claw e2e	62.7%

يدّعي المطوّر أن GDPval-AA ELO 1495 يُمثّل أفضل مستوى بين النماذج مفتوحة الأوزان. هذا معيار متخصص في مهام الوكلاء، والمعنى الفعلي يتضح بالمقارنة المباشرة مع نماذج مفتوحة أخرى.

SWE-Pro 56.22% وSWE Multilingual 76.5 مستويات مقبولة في مجال وكلاء الكود. NL2Repo 39.8% لمهام معالجة المستودعات بالغة الطبيعية أدنى نسبيًا.

MM Claw e2e 62.7% يُشير إلى أداء مهام وكيل متعدد الوسائط، وهو رقم مرجعي لخطوط أنابيب تعالج النصوص والصور معًا.

الخدمة والنشر

أطر العمل المدعومة

SGLang (الإطار الموصى به)
vLLM (توازي تنسوري)
Transformers (HF)
NVIDIA NIM (نشر فوري على DGX/HGX المحلية)
Docker Model Runner (قائم على الحاويات)
OpenAI واجهة برمجية متوافقة

أشكال التكميم

مُسجّلة على HF Hub 113 نسخة مكممة، وهو أعلى عدد بين النماذج الأربعة المُراجَعة هنا. تشمل صيغ GPTQ وGGUF وAWQ وEXL2 وFP8، مما يُتيح نقطة انطلاق مناسبة لمعظم مجموعات أطر الاستدلال والأجهزة.

معاملات الاستدلال

تنصح بطاقة النموذج بالمعاملات الافتراضية: temperature 1.0 وtop_p 0.95 وtop_k 40. يُوصى بالحفاظ على هذه القيم الافتراضية والتجريب منها في مهام الوكلاء.

متطلبات الأجهزة

229B BF16 يستلزم نحو 458GB من VRAM، أي ما لا يقل عن 6 بطاقات H100 بذاكرة 80GB. استخدام FP8 يخفّض المتطلبات إلى النصف تقريبًا. مسار NVIDIA NIM يُتيح جلب حزمة الخدمة المُحسَّنة جاهزة على أنظمة DGX، مما يُقلّص عبء الإعداد الأولي.

من منظور ThakiCloud

نقطتان عمليتان تبرزان في M2.7:

113 نسخة مكممة توفر أوسع تنوع في مسارات النشر المحلي. هذا العدد يُغطي تقريبًا كل التكوينات من وحدات GPU للمستهلكين حتى أنظمة DGX. بصرف النظر عن محزون GPU لدى الفريق، سيكون إيجاد نقطة بداية أمرًا يسيرًا. النشر عبر NIM على بيئات DGX/HGX يُلغي الحاجة إلى إعداد حزمة خدمة منفصلة، كما يُتيح الاختبار الخفيف على أجهزة التطوير عبر نسخ Ollama أو llama.cpp.

الترخيص “other” بند لازم قبل النشر التجاري المحلي. مصطلح “مفتوح الأوزان” لا يعني بالضرورة الحرية التجارية. تصنيف الترخيص بوصفه “other” يُشير إلى وجود شروط تختلف عن التصنيفات القياسية (MIT، Apache، Llama Community). عند التخطيط لربط النموذج بخدمة تجارية أو نشره داخليًا على مستوى مؤسسي، ينبغي مراجعة نص LICENSE مع الفريق القانوني. التقييم التقني ومراجعة الترخيص يسيران جنبًا إلى جنب، على أن تنتهي المراجعة الثانية قبل النشر.

ادعاءات التعاون بين فرق الوكلاء والتطور الذاتي تحتاج إلى تحقق مستقل في حالات الاستخدام الفعلية. المعايير والتوصيفات المُقدَّمة من المطوّر لا تكفي وحدها للحكم على الأداء داخل سير العمل الحقيقية. نهج البدء بنسخة مكممة صغيرة في مرحلة النموذج الأولي هو المسار الأكثر واقعية لتقييم الأداء وتحديد حجم الأجهزة اللازمة.