⏱️ وقت القراءة المقدر: 7 دقائق

المهارات كانت تُكتب باليد

وثائق مهارات العامل، أي الوثائق التي تصف كيف يُنجز العامل مهمة بعينها، يكتبها البشر في الغالب: ما الخطوات الواجب اتباعها، وما الأدوات المستخدمة، وكيف يُتعافى من الإخفاق. كتابة وثيقة مهارة جيدة تتطلب خبرة ووقتاً. والأمر لا ينتهي بمجرد كتابتها؛ حين يُخفق العامل تلزم مراجعة الوثيقة، وذلك أيضاً من مهام البشر.

ورقة arXiv:2605.23904 بعنوان “SkillOpt: Executive Strategy for Self-Evolving Agent Skills” تُؤتمت هذه العملية. تعامل وثائق المهارات بوصفها مكونات خارجية قابلة للتدريب، وتُحسِّنها بصورة منهجية استناداً إلى نتائج تشغيل العامل.

التحسين في فضاء النص

الفكرة المحورية في SkillOpt هي “محسِّن فضاء النص” (text-space optimizer): تحسين نص وثيقة المهارة ذاتها دون المساس بأوزان النموذج. ثلاثة جوانب تميز هذا النهج عن أسلوب كتابة المهارات التقليدي.

توظيف التشغيلات المُقيَّمة: في كل مرة يُشغِّل العامل مهارة يُسجَّل مسار التشغيل ويُعطى درجة. التشغيلات عالية الدرجة تكشف ما يعمل بفاعلية. التشغيلات منخفضة الدرجة تُشير إلى أجزاء الوثيقة المشكِلة.

تعديلات منضبطة: يُحلِّل نموذج المحسِّن بيانات التشغيل ويقترح تعديلات على وثيقة المهارة. أنواع التعديلات ثلاثة: إضافة (add)، وحذف (delete)، واستبدال (replace). ليست إعادة كتابة حرة بل تحويل منضبط. أهمية الضبط هنا تكمن في أن تضييق نطاق التعديل يُسهِّل تتبع ما تغيَّر في الوثيقة وكيف أثَّر ذلك في الأداء.

بوابة التحقق: لا تُطبَّق التعديلات المقترحة فور اقتراحها. تُقبَل التغييرات فقط حين تُحسِّن درجة التحقق. التعديلات المُضرة تُرفَض تلقائياً.

لا عبء إضافي في وقت الاستدلال

من المزايا العملية لـ SkillOpt انعدام العبء الإضافي في وقت الاستدلال. التحسين يجري في وضع عدم الاتصال: جمع التشغيلات واقتراح التعديلات والتحقق منها كلها منفصلة عن تنفيذ العامل.

العامل المنشور لا يفعل سوى الرجوع إلى وثيقة المهارة المحسَّنة. بما أن عملية التحسين ليست في مسار التنفيذ، لا تأثير على زمن الاستجابة. لا مقايضة بين “مهارة أفضل = تنفيذ أبطأ”.

النتائج التجريبية

رقمان في الملخص يستحقان الانتباه.

أعلى تحسن +23.5 نقطة (GPT-5.5): عبر معايير ونماذج متعددة، أبدت العملاء التي استخدمت مهارات مُحسَّنة بـ SkillOpt تحسناً في الأداء مقارنة بالخط الأساسي. أعلى رقم هو 23.5 نقطة عند استخدام GPT-5.5. أيُّ معيار أسفر عن هذا الرقم تحديداً يستوجب مراجعة متن الورقة.

قابلية النقل عبر النماذج: المهارة المحسَّنة بنموذج معين تبقى فعالة مع نماذج أخرى. هذه الخاصية مهمة لتبرير تكلفة تحسين المهارات؛ إذا بقيت المهارة المحسَّنة بـ GPT-5.5 فعالة عند تطبيقها على نماذج عائلة Qwen، أمكن تحسين المهارة مرة واحدة وإعادة استخدامها عبر نماذج متعددة.

تُبلَّغ أيضاً قابلية النقل عبر البيئات: المهارة المحسَّنة تحافظ على فاعليتها في بيئات تنفيذ مختلفة.

مهارة مكتوبة باليد مقابل مهارة SkillOpt

الخط الأساسي الذي تقارن به الورقة هو المهارات المكتوبة يدوياً أو المراجعة بصورة متساهلة. هذه المقارنة ذات معنى لأنها واقعية: في معظم منظومات العملاء تُدار المهارات بهذا الأسلوب تحديداً.

SkillOpt يتفوق على المهارات المكتوبة يدوياً لسببين: أولاً، يُحسِّن استناداً إلى بيانات تنفيذ فعلية؛ أنماط الإخفاق والنجاح الحقيقية أكثر دقة من حدس الكاتب. ثانياً، يتحسن باستمرار؛ مع تراكم تشغيلات جديدة تُحدَّث الوثيقة. ليست وثيقة تُكتب مرة وتُترك، بل وثيقة حيَّة.

الربط بنظام مهارات ThakiCloud

النظر إلى المهارات الموجودة تحت .claude/skills/ في ThakiCloud من منظور SkillOpt يكشف عن ربط طبيعي.

عملية إدارة المهارات الراهنة يدوية. selfharness-evolve يسعى ليلاً لتحسين المهارات، لكن كيفية توظيف بيانات التشغيل تحديداً تتفاوت بين مهارة وأخرى. تطبيق إطار SkillOpt يُتيح نهجاً أكثر منهجية.

بشكل ملموس، يلزم خط أنابيب يجمع تشغيلات المهارات تلقائياً ويُقيِّمها. معايير التقييم: هل حقق العامل الهدف المقصود، وهل أكمل المهمة دون أخطاء، وما كفاءة التنفيذ؟ تلك البيانات تُغذِّي دورة اقتراح التعديلات المنضبطة والتحقق منها وتطبيقها، وهي جوهر SkillOpt.

قاعدة sonnet-format-determinism تتجه أصلاً نحو التحقق بالكود من جودة مخرجات المهارات. استخدام نتائج ذلك التحقق بوصفها إشارات تحسين بأسلوب SkillOpt يندمج مع البنية الراهنة بصورة طبيعية.

قابلية النقل عبر النماذج ذات أهمية خاصة: حين تُوجِّه منصة ThakiCloud بين نماذج sonnet وopus وhaiku وغيرها، إذا بقيت المهارة المحسَّنة على أساس نموذج واحد فعالة مع نماذج أخرى، تتقلص تكلفة التحسين بصورة ملحوظة.

تنبيه

ثمة قيود لـ SkillOpt ينبغي مراعاتها. حتى مع ضبط التعديلات، قد تتدهور التغييرات التراكمية في اتجاه غير متوقع. نمط نموذجي للخطر: ترتفع المهارة أداءً على معيار بعينه لكنها تفقد عموميتها في الأثناء.

بوابة التحقق تحدُّ من ذلك جزئياً لكن ليس كلياً. يجب أن يُرافق ذلك تتبع سجل تحسين المهارات وآلية رجوع إلى الإصدارات السابقة عند تراجع الأداء.

خلاصة

SkillOpt يحوِّل مهارة العامل من “عنصر يُنشر ثم يُترك” إلى “مكوِّن حي يتحسن باستمرار”. رقم +23.5 نقطة وقابلية النقل عبر النماذج تستحقان التحقق. الفرق التي تُشغِّل منظومات عملاء قائمة على المهارات تجدر بها قراءة الورقة كاملة.

المصدر: https://arxiv.org/abs/2605.23904