الكود هو تجهيز العامل: هيكل طبقات البنية التحتية لعملاء الذكاء الاصطناعي (arXiv:2605.18747)

⏱️ وقت القراءة المقدر: 8 دقائق

السؤال الذي يُلخِّصه المسح

في بناء منظومات العملاء تتكرر أنماط بعينها: طريقة تفاعل العامل مع البيئة، وطريقة وضع الخطط وتعديلها، وطريقة تعاون عدة عملاء معاً. هذه الأنماط مدفونة في أوراق وأنظمة متفرقة.

ورقة arXiv:2605.18747 بعنوان “Code as Agent Harness” تجمع هذه الأنماط في إطار موحد. الادعاء المحوري هو أن الكود يعمل بنية تحتية أساسية لمنظومات عملاء الذكاء الاصطناعي: يربط العامل بمحرك الاستدلال ويُعرِّف الواجهة مع البيئة ويُتيح تنسيق العملاء المتعددين. يُحلِّل المسح هذا النظام عبر ثلاث طبقات.

الإطار ثلاثي الطبقات

الطبقة الأولى: واجهة التجهيز

تعالج الطبقة الأولى كيفية موقع العامل بين محرك الاستدلال (LLM) والبيئة. يُعرِّف الكود هنا واجهتين في آن واحد.

نحو اللغوي الكبير: تنسيق المدخلات التي يستقبلها النموذج، وتنسيق المخرجات التي يُولِّدها، وتوقيعات الأدوات القابلة للاستدعاء. نحو البيئة: طبقة التنفيذ التي تتعامل مع نظام الملفات وواجهات API وقواعد البيانات وواجهات المستخدم الرسومية والخدمات الخارجية.

حين تُصمَّم طبقة الواجهة بشكل سليم يتحقق فصل بين منطق العامل وبيئة التنفيذ: يمكن تبديل بيئة التنفيذ دون المساس بمنطق العامل، ويمكن تشغيل بيئتي الاختبار والإنتاج بنفس كود العامل.

الطبقة الثانية: آليات التجهيز

تتناول الطبقة الثانية الآليات التي يعتمد عليها العامل لأداء المهام المعقدة. التخطيط والتحكم التكيفي هما المحورين.

التخطيط هو تحليل الأهداف طويلة المدى إلى خطوات قابلة للتنفيذ على المدى القريب. ميزة التجهيز المبني على الكود تتجلى حين تكون مخرجات التخطيط ذاتها كوداً قابلاً للتنفيذ مباشرةً؛ يتقلص بذلك عبء الترجمة بين التخطيط والتنفيذ.

التحكم التكيفي هو طريقة معالجة الاستثناءات والإخفاقات أثناء التنفيذ. حين يصطدم العامل أثناء التنفيذ بموقف غير متوقع، كيف يستجيب؟ أنماط كإعادة المحاولة واستكشاف مسارات بديلة والتصعيد إلى البشر تندرج هنا.

الطبقة الثالثة: تنسيق العملاء المتعددين

تعالج الطبقة الثالثة طريقة تعاون عدة عملاء. توزيع المهام التي يعجز عنها عامل منفرد على عدة عملاء، وتجميع النتائج، وإدارة التبعيات بين العملاء.

حين يضطلع الكود بدور التجهيز يتجلى تنسيق العملاء المتعددين بصورة طبيعية: يمكن التعامل مع كل عامل كدالة أو خدمة، وكتابة منطق التنسيق بأنماط برمجية مألوفة.

مجالات التطبيق

يُحلِّل المسح أربعة مجالات رئيسية للتطبيق: مساعدو البرمجة، وأتمتة واجهات المستخدم الرسومية، والاكتشاف العلمي، وسير عمل المؤسسات.

مساعدو البرمجة: توليد الكود وإصلاح الأخطاء وكتابة الاختبارات. نتائج تنفيذ الكود توفر إشارة تغذية راجعة فورية، مما يجعل هذه البيئة مناسبة لتعلم العملاء.

أتمتة واجهات المستخدم الرسومية: تشغيل المتصفحات وتطبيقات سطح المكتب والتطبيقات المحمولة مباشرةً. التعرف على عناصر الشاشة وتوليد كود التفاعل هما المفتاحان.

الاكتشاف العلمي: مساعدة في تصميم التجارب وتحليل البيانات وتفسير النتائج. التجهيز المبني على الكود مفيد في التجارب المتكررة والتحقق من الفرضيات.

سير عمل المؤسسات: ربط خدمات SaaS المتعددة والأنظمة الداخلية. تكامل واجهات API وإدارة تدفق البيانات يُشكِّلان العمود الفقري.

التحديات غير المحلولة

التحديات المفتوحة التي رصدها المسح واقعية.

منهجيات التقييم: كيف يُقاس أداء العامل؟ دقة مهمة منفردة لا تكفي. يلزم تقييم متعدد الأبعاد يشمل سرعة التكيف مع بيئات جديدة والقدرة على التعافي من الإخفاقات وكفاءة الموارد.

استراتيجيات التحقق: كيف نضمن أن الكود والخطط التي يولّدها العامل تعمل وفق القصد؟ يُناقَش مزيج من التحليل الساكن قبل التنفيذ والتشغيل في بيئة معزولة والتحقق الشكلي.

السلامة: كيف نمنع العامل من إحداث تأثيرات جانبية غير مقصودة؟ إدارة الصلاحيات وعزل التنفيذ وآليات الإلغاء هي المفاتيح.

منظور منصة ThakiCloud

الإطار ثلاثي الطبقات لهذا المسح يُمثِّل مرجعاً مفيداً لـ ThakiCloud في تصميم منصة عملائها.

النظر إلى هيكل مستودع ai-platform-strategy الراهن يكشف عن هذه الطبقات الموجودة ضمنياً. تعريفات المهارات تحت .claude/skills/ تقابل طبقة واجهة التجهيز، وكود التنفيذ تحت scripts/ يُجسِّد آليات التجهيز، ومهارات المنسِّقين تتولى تنسيق العملاء المتعددين.

الفارق هو أن هذا الهيكل تشكَّل تدريجياً لا بقرار معماري صريح. تطبيق إطار المسح لتقييم الهيكل القائم يُيسِّر تحديد ما صُمِّم جيداً وما يحتاج تعزيزاً.

من منظور واجهة التجهيز: هل تنسيق YAML للمهارات في تعريف توقيعات الأدوات متسق؟ قاعدة skill-description-quality تُعالج هذا الجانب بالفعل.

من منظور آليات التجهيز: يُنفِّذ pge-loop وdev-loop آليات التحكم التكيفي. التحقق من أن مسارات اكتشاف الإخفاق وإعادة المحاولة والتصعيد معرَّفة بوضوح هو النقطة التي تستحق المراجعة.

من منظور تنسيق العملاء المتعددين: يوجد 55 عميلاً فرعياً متخصصاً، لكن ما إذا كان الرسم البياني للتبعيات بين العملاء مُدار بصورة صريحة هو مفتاح قابلية التوسع.

خلاصة

“Code as Agent Harness” خريطة مفيدة للفرق التي تبدأ في تصميم منظومات عملاء. تُنظِّم أيَّ مشكلة تُعالَج في أيٍّ من الطبقات، وأيَّ الأنماط جرى اختبارها، وأيَّ المشكلات لا تزال مفتوحة.

القيد المتأصل في أوراق المسح قائم هنا أيضاً: التغطية الواسعة تأتي على حساب التحليل العميق في كل مجال، وقراءة الأوراق الأصلية ضرورة لكل مجال بعينه. غير أن المسح يبقى نقطة انطلاق قيِّمة لفهم بنية التحتية للعملاء بصورة منهجية.

المصدر: https://arxiv.org/abs/2605.18747