يمكن لـ Qwen3.7-Max الحاصل على براءة اختراع من Alibaba أن يعمل بشكل مستقل لمدة 35 ساعة ويدعم الأدوات الخارجية مثل Anthropic’s Claude Code

لقد دخلت صناعة الذكاء الاصطناعي بشكل كامل “عصر الوكلاء” – وهو نموذج يمكن لنماذج الذكاء الاصطناعي من خلاله أن تفعل أكثر بكثير من مجرد إنشاء نص – فهي الآن تخطط بنشاط للمهام المعقدة وتنفذها وتعالجها في أيام، وليس ثواني.

لذلك، ربما ليس من المستغرب أن يصدر فريق أبحاث Qwen AI الشهير التابع لعملاق التجارة الإلكترونية الصيني علي بابا نموذجًا قادرًا على أداء عمل الذكاء الاصطناعي المستقل لعدة أيام: ظهر هذا النموذج في شكل Qwen3.7-Max، والذي تقارير الشركة في مشاركة المدونة حققت “ما يقرب من 35 ساعة من التنفيذ المستمر والمستقل” – وإن كان ذلك بتنسيق خاص وليس مفتوحًا كما كان الحال مع إصدارات فريق Qwen السابقة.

وكان هذا أيضًا متوقعًا – وهو ما كان يخشاه العديد من المحللين وخبراء الصناعة بعد رحيل العديد من قادة فريق Qwen الرئيسيين في وقت سابق من هذا العام. لكن هذا أمر منطقي من الناحية المالية بالنسبة لشركة علي بابا، على الأقل على المدى القصير: فتدريب نماذج الذكاء الاصطناعي، وخاصة تلك القوية مثل Qwen3.7-Max، أمر مكلف، كما أن منحها مجانًا بشكل أساسي، كما تفعل النماذج مفتوحة المصدر، لا يساعد في استرداد أي تكاليف على الفور.

وبهذا المعنى، تعمل شركة علي بابا ببساطة على مواءمة جهودها مع عمالقة الذكاء الاصطناعي في الولايات المتحدة مثل OpenAI وجوجل، حيث تقدم أحدث وأكبر النماذج حصريًا من خلال واجهات برمجة التطبيقات المدفوعة وحزم الاشتراك أو خطط الإنترنت المدفوعة، ونماذج أقل قوة قليلاً من خلال البرامج مفتوحة المصدر.

ومع ذلك، فإن وصول Qwen3.7-Max يوفر المزيد من الفرص للشركات والمستهلكين، والمزيد من المنافسة لمختبرات الذكاء الاصطناعي الأمريكية – ونادرًا ما يكون هذا حلاً سيئًا للمستهلكين على أي مستوى من الميزانية. ومع ذلك، فإن حقيقة أن النموذج متاح فقط من نقاط النهاية الصينية يعني أن جاذبيته قد تكون محدودة بالنسبة للشركات الأمريكية والأوروبية التي تتطلع إلى تحقيق أقصى قدر من مستوى الامتثال والأمن عند الوفاء بالعقود الحكومية أو حتى محاولة الامتثال لجميع قوانين سيادة البيانات الحكومية والمحلية والوطنية ذات الصلة.

عصر ماراثون الذكاء الاصطناعي

لفهم سبب اختلاف Qwen3.7-Max عن النماذج السابقة، عليك أن تنظر إلى كيفية تدريبه وكيفية أدائه عمليًا.

تميل النماذج اللغوية إلى التدهور عندما تضطر إلى الحفاظ على خط فكري واحد عبر آلاف المنعطفات التحادثية؛ ينسون التعليمات، أو يصابون بالهلوسة، أو ببساطة يعلقون في الحلقات المنطقية. تم تصميم Qwen3.7-Max خصيصًا ليكون بمثابة “أساس عامل عالمي” قادر على “التفكير طويل المدى” للتغلب على هذا الاختناق بالضبط.

إن العرض الأكثر لفتًا للانتباه لهذه القدرة هو المهمة الهندسية المستقلة التي قام فريق كوين بتفصيلها. تم منح النموذج إمكانية الوصول إلى خادم معزول مزود بـ T-Head ZW-M890 PPU، وهي بنية أجهزة لم يواجهها النموذج مطلقًا أثناء التدريب. وكانت مهمتها تحسين نواة الاهتمام.

ولمدة 35 ساعة متواصلة، عمل Qwen3.7-Max بشكل مستقل تمامًا. تم تنفيذ 1,158 استدعاءًا مختلفًا للأدوات، وإجراء 432 تقييمًا للنواة، وتشخيص أخطاء التجميع، وتحسين التعليمات البرمجية بشكل متكرر لتحقيق متوسط ​​تسريع هندسي بمقدار 10.0x.

بالمقارنة، حققت الطرازات المنافسة الصينية مثل GLM-5.1 من z.ai وKimi K2.6 من Moonshot أقصى سرعة تصل إلى 7.3x و5.0x على التوالي، وغالبًا ما كانت تنهي الجلسات طواعية عندما لم تحرز أي تقدم. ومع ذلك، كلاهما مفتوح المصدر.

يتم تحقيق هذه المتانة من خلال ما تسميه علي بابا “القياس البيئي”. تمامًا كما أصبح طلاب LLM الأوائل أكثر ذكاءً من خلال استيعاب نصوص أكثر تنوعًا، تم تدريب Qwen3.7-Max على مجموعة واسعة وقابلة للتطوير من بيئات الوكيل الديناميكية.

وهو قادر على محاكاة دورة الحياة السنوية للشركة الناشئة في تقييم “YC-Bench”، ويمر بمئات جولات اتخاذ القرار بما في ذلك إدارة شؤون الموظفين ومراقبة العقود. في هذه المحاكاة، تمكن النموذج من تحقيق إيرادات افتراضية قدرها 2.08 مليون دولار، وهو ما ضاعف تقريبًا أداء الجيل السابق، Qwen3.6-Plus.

علاوة على ذلك، يحتوي النموذج على ميزة المراقبة الذاتية لاختراق المكافآت، والكشف بشكل مستقل عن محاولات خداع بيئة التدريب وإضافة قواعد إرشادية لتصحيح سلوكه.

عقل لكل سقالة

من منظور المنتج، تم تصميم Qwen3.7-Max كمحرك معرفي لتطوير البرامج الحديثة وأتمتة المؤسسات.

يوفر النموذج نافذة سياق ضخمة تضم مليون رمز مميز وحد أقصى للإنتاج يبلغ 64 كيلو بايت، مما يوفر حملاً ضخمًا عند معالجة قواعد الأكواد الكبيرة أو المستندات الفنية الطويلة.

واحدة من ميزاته الرائعة هي “التعميم عبر تسخير”. بدلاً من أن يتم ترميزه بشكل ثابت للعمل بشكل أفضل ضمن واجهة محددة خاصة، تم تصميم Qwen3.7-Max ليكون بمثابة طبقة إضافية من الذكاء لمختلف منصات الوكلاء. هذا يدعم أصلاً بروتوكول Anthropic API، تمكين المطورين قم بتوصيله مباشرة بالأدوات الموجودة مثل Claude Code أو OpenClaw.

وتظهر البيانات المعيارية التي قدمتها شركة علي بابا أن هذا النهج المعمم قد حقق فوائد هائلة.

في معيار Apex Math Reasoningسجلت Qwen3.7-Max 44.5، متجاوزة درجة Claude Opus-4.6 Max البالغة 34.5 و ديب سيك V4-برو ماكس 38.3. نشرت أيضا الدرجات المهيمنة في الاختبار الأخير للبشرية (41.4) ومعيار ترميز الوكيل الواقعي MCP-Atlas (76.4).

جدول المقارنة القياسي علي بابا Qwen3.7-Max. المصدر: علي بابا كوين

وهذا يُترجم إلى قابلية استخدام قابلة للقياس للمستخدمين النهائيين. من خلال تكامل بروتوكول السياق النموذجي (MCP)، يمكن للنموذج أن يعمل كمساعد مكتبي مستقل، قادر على قراءة مواصفات التنسيق الجامعي وإعادة تنسيق مستند Word الفوضوي تلقائيًا باستخدام أدوات سطر الأوامر دون تدخل بشري.

إن الحفاظ على هذا المستوى من الذكاء يأتي بتكلفة واضحة. سيدفع المطورون الذين يصلون إلى واجهة برمجة التطبيقات من خلال Alibaba Cloud Model Studio 2.50 دولارًا أمريكيًا مقابل مليون رمز إدخال و7.50 دولارًا أمريكيًا مقابل مليون رمز إخراج. توفر المنصة أيضًا التخزين المؤقت المباشر وتسعير القراءة، بالإضافة إلى رسوم اتصال قدرها 10 دولارات لكل 1000 دولار لعمليات البحث المتكاملة على الويب، على الرغم من أن أدوات تفسير التعليمات البرمجية تظل مجانية لفترة محدودة.

يحتل Qwen3.7-Max أرضية وسطية إستراتيجية في اقتصاد API الحالي. في حين أنه يحظى بعلاوة كبيرة على المنافسين المحليين ذوي الأسعار العالية – حيث يكلف ما يقرب من ضعف DeepSeek V4 Pro (5.22 دولارًا) و GLM-5.1 Z.ai (5.80 دولارًا) – فإنه يقوض بشكل كبير الشركات الغربية العملاقة التي يضاهيها بشكل روتيني في المعايير.

بالنسبة للسياق، فإن تشغيل سير عمل وكيل ثقيل عبر OpenAI’s GPT-5.4 أو Anthropic’s Claude Opus 4.7 سيكلف المطورين 17.50 دولارًا و30.00 دولارًا لكل مليون رمز، على التوالي. راجع جدول تسعير VentureBeat أدناه:

نموذج

دخول

مخرج

التكلفة الإجمالية

مصدر

فلاش ميمو-V2.5

0.10 دولار

0.30 دولار

0.40 دولار

زياومي ميمو

ميني ماكس M2.7

0.30 دولار

1.20 دولار

1.50 دولار

ميني ماكس

الجوزاء 3.1 فلاش لايت

0.25 دولار

1.50 دولار

1.75 دولار

جوجل

ميمو V2.5

0.40 دولار

2.00 دولار

2.40 دولار

زياومي ميمو

كيمي-K2.6

0.95 دولار

4.00 دولار

4.95 دولار

مونشوت / كيمي

جي إل إم-5

1.00 دولار

3.20 دولار

4.20 دولار

Z.ai

جروك 4.3 (سياق منخفض)

1.25 دولار

2.50 دولار

3.75 دولار

xAI

ديب سيك V4 برو

1.74 دولار

3.48 دولار

5.22 دولار

ديب سيك

جي إل إم-5.1

1.40 دولار

4.40 دولار

5.80 دولار

Z.ai

كلوديوس هايكو 4.5

1.00 دولار

5.00 دولار

6.00 دولار

أنثروبي

جروك 4.3 (سياق عالي)

2.50 دولار

5.00 دولار

7.50 دولار

xAI

Qwen3.7-ماكس

2.50 دولار

7.50 دولار

10.00 دولار

علي بابا كلاود

الجوزاء 3.5 فلاش

1.50 دولار

9.00 دولار

10.50 دولار

جوجل

معاينة الجوزاء 3.1 Pro (200K200K)

2.00 دولار

12.00 دولارًا

14.00 دولارًا

جوجل

جي بي تي-5.4

2.50 دولار

15.00 دولارًا

17.50 دولارًا

OpenAI

معاينة الجوزاء 3.1 Pro (> 200 ألف)

4.00 دولار

18.00 دولارًا

22.00 دولارًا

جوجل

إغلاق المهمة 4.7

5.00 دولار

25.00 دولارًا

30.00 دولارًا

أنثروبي

جي بي تي-5.5

5.00 دولار

30.00 دولارًا

35.00 دولارًا

OpenAI

من خلال وضع Qwen3.7-Max أسفل Gemini 3.5 Flash من Google (10.50 دولارًا)، ولكن أعلى بكثير من نماذج الميزانية، تشير Alibaba إلى أن هذه ليست نسخة سلعية؛ هو محرك استدلالي رئيسي تم تسعيره للمساعدة في توجيه أعباء الشركات بعيدًا عن أغلى عروض وادي السيليكون.

تظل التراخيص محفوظة في الوقت الحالي

على الرغم من تفوقها التقني، فإن الجانب الأكثر إثارة للجدل في Qwen3.7-Max هو طريقة توزيعها. تعلن Qwen عن هذا الإصدار باعتباره “نموذجًا خاصًا”. إنه يعتمد على واجهة برمجة التطبيقات (API) تمامًا.

تاريخيا، يعد Qwen من Alibaba بطلاً للبرمجيات مفتوحة المصدر والمجتمعات المحلية LLM. الإصدارات السابقة مثل Qwen 2.5 وQwen 3.6 جعلت أوزانها متاحة للعامة. تسمح المقاييس المفتوحة للمطورين والباحثين والمؤسسات بتنزيل نموذج وتشغيله على أجهزتهم الخاصة وضبطه لحالات استخدام محددة للغاية أو حساسة للبيانات دون إرسال معلومات خاصة إلى خادم طرف ثالث.

من خلال حظر Qwen3.7-Max خلف واجهة برمجة التطبيقات، تنتقل Alibaba إلى قواعد اللعبة التجارية القياسية التي تستخدمها OpenAI (مع GPT-4) وAnthropic (مع كلود). بالنسبة لمستخدمي المؤسسات، هذا يعني أن استخدام Qwen3.7-Max يتطلب الثقة في Alibaba Cloud لتدفقات البيانات والاعتماد بشكل كامل على الاتصال بالإنترنت لتشغيل سير العمل الوكيل. بالنسبة لمجتمع المصادر المفتوحة، هذا يعني فقدان الوصول إلى أحد أقوى النماذج في العالم.

وانقسمت ردود أفعال المجتمع بين الإعجاب وخيبة الأمل

وكانت استجابة مجتمع المطورين سريعة وتميزت بمزيج من الاحترام العميق للإنجازات الهندسية والإحباط من نموذج الترخيص.

بارِز إلى Sudo commenter على (@sudoingX) استحوذ على المزاج السائد على X (تويتر سابقًا). وكتبوا “كوين غير واقعي”. “لقد انخفضت للتو بحد أقصى 3.7 وهي أعلى من 4.6 في معظم المعايير.”

لقد تركت المعايير الفنية، وخاصة متانة النموذج، الكثير من الذهول. وأشار سودو سو إلى أن “الرقم الأقصى الرياضي، 44.5 مقارنة بـ 34.5، يمثل فرقًا كبيرًا”. “35 ساعة من مهمة تحسين النواة المستمرة مع أكثر من 1000 استدعاء للأداة هو الجزء الذي ما زلت أقرأه. وهذا يحدث بالفعل في عصر الوكيل، وليس في الشريحة.”

سرعة التكرار على بابا تجذب الانتباه أيضًا. مع إصدار Qwen 3.6 الشهر الماضي، فإن القفز إلى 3.7-Max يسلط الضوء على وتيرة التطوير المستمرة. وكما أشار سودو سو، “لا أحد يتحرك بهذه الطريقة”.

ومع ذلك، فإن الثناء محجوز بشدة بسبب الانتقال إلى نظام بيئي مغلق. يُنظر إلى فقدان وزن النموذج على أنه ضربة لحركة الذكاء الاصطناعي المحلية، التي تعتمد على نماذج مفتوحة متطورة لدفع حدود ما يمكن القيام به على الأجهزة الاستهلاكية أو مجموعات المؤسسات الخاصة.

“شيء واحد، يرجى فتح هذا المصدر أيضًا،” توسل سودو سو في منشوره. “لقد جعلت الكثافة 3.6 النظام البيئي المحلي بأكمله أفضل. والانتقال إلى واجهة برمجة التطبيقات (API) ذات المستوى الأقصى من شأنه أن يغلق الأبواب التي ظللنا مفتوحة حتى الآن. أعطنا الأوزان أخيرًا.”

يثبت Qwen3.7-Max أن عصر الوكلاء المستقلين لم يعد إسقاطًا نظريًا؛ إنه واقع حاضر قادر على أداء أعمال هندسية معقدة بينما البشر نائمون. والسؤال الوحيد الآن هو ما إذا كانت هذه الحدود الجديدة للذكاء الاصطناعي ستكون مصدرًا ديمقراطيًا يمكنك تنزيله على جهاز الكمبيوتر المحمول الخاص بك أو أداة استخباراتية مستأجرة فقط من السحابة. في الوقت الحالي، في حالة Qwen3.7-Max، فهو الأخير بلا شك.

رابط المصدر