ما الذي ينبغي أن نعيد التفكير فيه حين يغادر Fable 5 الاشتراك

اليوم هو الموعد النهائي. نموذج Fable 5، وهو النموذج الأعلى مستوى من Anthropic، مُدرَج في خطط الاشتراك مجاناً حتى 22 يونيو فقط، ثم يُستثنى من الحصة المشمولة ابتداءً من 23 يونيو. بعد ذلك، يستلزم استخدام Fable 5 شراء رصيد منفصل بنظام الدفع حسب الاستخدام. انتشر هذا الخبر بسرعة في مجتمعات المطوّرين، ورأينا فيه إشارة لا يمكن تجاهلها.
هذا المقال ليس نقداً لقرار Anthropic. بل هو محاولة لتوضيح المخاطر الهيكلية التي تصاحب الاعتماد على اشتراكات خارجية للحصول على النماذج الحدية، وشرح سبب قراءتنا نحن، بوصفنا مزوّدي خدمة المحلية، لهذا الحدث باعتباره رسالة تدعو إلى مراجعة استراتيجية الحصول على النماذج.
ما الذي جرى
لنبدأ بالوقائع.
- يُدرَج Fable 5 دون تكلفة إضافية في خطط Pro وMax وTeam وEnterprise المعتمدة على المقاعد حتى 22 يونيو.
- ابتداءً من 23 يونيو، يُستبعد من الحصة المشمولة، ويستلزم الاستمرار في استخدامه رصيداً للاستخدام.
- يُخصم الرصيد وفق أسعار API القياسية. يبلغ سعر Fable 5 نحو $10 لكل مليون رمز مدخل، و$50 لكل مليون رمز مُخرَج، مع خصم 90% على القراءات المخزّنة مؤقتاً.
السبب الذي أعلنته Anthropic هو الطاقة الاستيعابية. “نتوقع أن يكون الطلب على Fable 5 مرتفعاً جداً، ويصعب التنبؤ به.” وأعلنت الشركة أنها ستمدّد فترة الإدراج إذا سمحت الطاقة بذلك، وأن هدفها إعادة Fable 5 إلى الاشتراكات القياسية في أقرب وقت ممكن.
باختصار، نموذج كان متاحاً باشتراك ثابت حتى أمس يتحوّل اليوم إلى رسوم مقاسة بالرمز. من منظور المستخدم، يتغيّر هيكل التكلفة بين ليلة وضحاها.
لماذا يحدث هذا
هذا ليس خاصاً بـ Anthropic، بل هو سمة هيكلية لنماذج الذكاء الاصطناعي الحدية عموماً.
تصطحب النماذج الأقوى تكاليف استدلال أعلى. أسعار رموز Fable 5 ضعف أسعار Opus 4.8 من الشركة ذاتها (مدخل $5، مُخرَج $25). حين يتيح مزوّد نموذجاً كهذا باشتراك ثابت مع استخدام شبه مفتوح، تتصاعد تكاليف GPU بصورة غير خطية حين يرتفع استخدام المستخدمين المكثّفين. وكلّما كان الطلب أقل قابليةً للتنبؤ، كان نموذج الاشتراك الثابت أكثر خطورة على المزوّد.
لذا يلجأ المزوّدون إلى رافعتين: تضييق حصة الاشتراك الثابت، أو تحويل التكاليف إلى المستخدمين عبر الدفع حسب الاستخدام. هذا القرار أقرب إلى الخيار الثاني. ليس انتهازيةً، بل نتيجة طبيعية لاقتصاديات الطاقة. المشكلة أن هذا التقلّب يقع خارج سيطرة المستخدم.
الدروس لاستراتيجية الحصول على نماذج اللغة الكبيرة
الخلاصة التي يجب أن يأخذها المشغّلون واضحة. ربط أحمال العمل الأساسية باشتراك تجاري واحد يعني تفويض تكلفة تلك الأحمال وتوافرها إلى سياسة المزوّد.
ما هو مجاني اليوم قد يصبح مدفوعاً غداً. تُعدَّل الحدود، وتُعلَن عزلة النماذج، ويتفاوت التوافر الإقليمي. لا يعني هذا أن هذه التغييرات خاطئة، بل يعني أنها متغيّرات خارج سيطرتنا. لأي عمل يحتاج إلى تكاليف قابلة للتنبؤ، هذا التقلّب في حد ذاته خطر.
الاستجابة هي التحوّط: ألّا تضع كل شيء في نموذج واحد ومزوّد واحد. أدِّر بعض أحمال العمل على أحدث أداء تجاري، وادعم الأحمال الحساسة من حيث التكلفة أو البيانات بنماذج ذات أوزان مفتوحة تتحكّم فيها. بهذه الطريقة، لن يُزعزع تغيير سياسي في أحد الجانبين عملياتك بأكملها.
منظور ThakiCloud: لماذا يصلح الخادم المحلي تحوّطاً
في ThakiCloud، نتعامل مع خدمة النماذج على منصة AI/ML SaaS مبنية على K8s. في كل مرة يقع حدث كهذا، ما نؤكده بسيط: حين تكون الأوزان في بنية تحتية نتحكّم فيها، نحن من يحدّد السعر والتوافر.
خدمة نماذج الأوزان المفتوحة محلياً أو في سحابة خاصة تغيّر ثلاثة أشياء. أولاً، تكون التكلفة الحدية لكل رمز ثابتة وفق تكاليف تشغيل GPU دون أن تتأثر بسياسات التسعير الخارجية. ثانياً، لا يوجد قلق من استبعاد نموذج فجأة من الحصة أو إيقافه، لأن الأوزان في حوزتك أصلاً. ثالثاً، لا تغادر البيانات محيطك الأمني، وهو ما يلبّي متطلبات السيادة. هذا هو ما أردنا التعبير عنه بصورة البنية التحتية الراسخة في الصخر في صورة العنوان.
بالطبع، قد تتفوّق النماذج التجارية الحدية في الاستدلال الأكثر تعقيداً. لا نقول “تخلّ عن النماذج التجارية”، بل نقول “لا تضع كل شيء في السلة التجارية”. الهيكل الأكثر متانة هو أساس محصّن ضد تقلّبات السياسات، مع قدرة على إضافة أحدث أداء عند الحاجة. بناء ذلك الأساس هو ما نقوم به.
التحفّظات والحجج المضادة
سنكون صادقين بشأن الجانب الآخر أيضاً.
- لكثير من الفرق، تبقى نماذج الاشتراك التجاري الخيار الأكثر عقلانية. فتكلفة امتلاك بنية تحتية GPU خاصة وكوادر تشغيلية قد تتجاوز رسوم الدفع حسب الاستخدام. حتى يتجاوز الاستخدام حجماً معيّناً، قد يكون الاستثمار المحلي مُبالَغاً فيه.
- قد يكون هذا التغيير مؤقتاً. أعلنت Anthropic نيّتها إعادة Fable 5 إلى الاشتراكات حال توفّر الطاقة. قد يكون تعميم تعديل سياسة واحد إلى خطر هيكلي مبالَغة.
- خدمة نماذج الأوزان المفتوحة بنفسك لا تُلغي التقلّب. أعطال الأجهزة، وتحديثات النماذج، وتناقص الكوادر البشرية، كلها أشكال مختلفة من المخاطر. التحوّط يوزّع المخاطر ولا يُلغيها.
خلاصة القول، حدث اليوم تعديل سياسي بسيط، لكن دلالاته ليست بسيطة. فهو يُعيد طرح السؤال: في أيدي من تضع تكلفة أحمال عمل الذكاء الاصطناعي الأساسية لديك وتوافرها؟ جوابنا ألّا نضع كل شيء في سلة واحدة، وخدمة الأوزان المفتوحة محلياً هي أحد محاور هذا التوازن.