⏱️ وقت القراءة المقدر: 15 دقيقة

مقدمة

النماذج اللغوية الكبيرة (LLMs) في جوهرها أنظمة ساكنة. فبمجرد انتهاء التدريب، تتجمد معاملات النموذج وتعجز عن التكيّف مع البيئات الجديدة أو التعلم من التجارب المستجدة. وقد غدا هذا القيد الجوهري محور ورقة استطلاعية نُشرت على arXiv في يوليو 2025 (arXiv:2507.21046)، أعدّها 27 باحثًا في 51 صفحة.

تُعرِّف هذه الورقة بمنهجية راسخة مفهوم الوكلاء ذاتيي التطور (Self-Evolving Agents) وتقترح إطارًا شاملًا لفهم كيفية تطور أنظمة الذكاء الاصطناعي باستقلالية. يتناول هذا المستند تحليلًا لمضامين هذا الاستطلاع وما ينطوي عليه من دلالات على طريق الذكاء الاصطناعي الخارق (ASI).

المفاهيم الجوهرية: ما الوكلاء ذاتيو التطور؟

قيود النماذج اللغوية الكبيرة الساكنة

تعاني النماذج اللغوية الكبيرة الحالية من القيود الجوهرية التالية:

البُعد النموذج اللغوي الساكن الوكيل ذاتي التطور
المعرفة ثابتة عند التدريب تُحدَّث باستمرار
التكيّف يستلزم إعادة تدريب تكيّف ذاتي فوري
البيئة افتراضات مسبقة استجابة لبيئة ديناميكية
التغذية الراجعة لا تُدمج تُدمج ويتعلم منها
الأهداف ثابتة قابلة للتعديل الذاتي

تعريف الوكلاء ذاتيي التطور

الوكلاء ذاتيو التطور أنظمة ذكاء اصطناعي تمتلك ثلاث قدرات جوهرية:

  1. التعلم التكيّفي: تحسين الأداء باستمرار من خلال التجربة والتغذية الراجعة دون تدخل بشري
  2. التطور المستقل: تعديل سلوكها واستراتيجياتها وحتى أهدافها باستقلالية
  3. التكامل متعدد الوسائط: المعالجة المتزامنة والتعلم من أشكال معلوماتية متنوعة: نصوص وصور وصوت وفيديو

إطار التطور ثلاثي الأبعاد

تقترح الورقة إطارًا يُفكك تطور وكلاء الذكاء الاصطناعي في ثلاثة أبعاد: ماذا يتطور، ومتى يتطور، وكيف يتطور.

البُعد الأول: ماذا يتطور؟

تنقسم أهداف التطور إلى ثلاثة مستويات:

المستوى الجزئي: التكيّف على مستوى الرمز

  • تعديل توزيعات احتمالية للرمز التالي في الوقت الفعلي
  • تحسين المخرجات وفقًا للسياق المحدد

المستوى المتوسط: التعلم على مستوى المهمة

  • تعلّم استراتيجيات حل فعّالة لأنواع مهام محددة
  • بناء معرفة منظّمة لاستخدام الأدوات وتحليل المشكلات

المستوى الكلي: التعلم الميتا وتعديل الأهداف

  • تعلّم “كيفية التعلم” ذاتها
  • التعديل المستقل لبنى الأهداف أو توسيعها

البُعد الثاني: متى يحدث التطور؟

التطور داخل وقت الاختبار

  • تحسين يحدث أثناء حل مشكلة واحدة
  • أمثلة: التفكير المتسلسل، والمراجعة الذاتية

التطور بين اختبارات متعددة

  • تحسين تراكمي عبر جلسات حل متعددة
  • أمثلة: إعادة تشغيل التجارب، وأنظمة الذاكرة

التطور مدى الحياة

  • تعلّم مستمر وتطور على مدى فترات مطوّلة
  • التحدي الأساسي: الموازنة بين الاحتفاظ بالمعرفة والتعلم الجديد

آليات التشغيل

  • قائمة على الأداء: تُفعَّل حين ينخفض الأداء دون العتبة المحددة
  • قائمة على الجدة: تُفعَّل عند رصد مواقف غير مألوفة
  • قائمة على الجدول: تُفعَّل على فترات منتظمة

البُعد الثالث: كيف يحدث التطور؟

أنواع إشارات التعلم

نوع الإشارة الأساليب نقاط القوة
المكافآت الرقمية RL، PPO، GRPO تقييم موضوعي
التغذية النصية النقد، المراجعة الذاتية تغذية راجعة غنية
ديناميكيات متعددة الوكلاء النقاش، التنافس وجهات نظر متنوعة

آليات التحديث

  • أساليب قائمة على التدرج: تحديثات مباشرة للمعاملات عبر الانتشار العكسي
  • الخوارزميات التطورية: تحسين قائم على المجموعات
  • التعلم المعزز: تحسين سلوكي قائم على المكافآت
  • التعلم الميتا: تعلّم كيفية التعلم

مجالات التطبيق

تطوير البرمجيات

  • AgentCoder: وكيل برمجة يحسّن ذاتيًا جودة الكود عبر دورات مراجعة وإعادة كتابة مستقلة
  • SEW (Self-Evolving Workshop): نظام تطور تعاوني يتخصص فيه وكلاء متعددون في مهام برمجية مختلفة

التعليم

يمكن لوكلاء التدريس ذاتيي التطور نمذجة مستوى التعلم وثغرات المعرفة لكل طالب، وضبط الصعوبة وأسلوب الشرح تلقائيًا، لتقديم تجارب تعليمية مخصصة لم تكن ممكنة من قبل.

المالية

  • QuantAgent: وكيل تداول كمي يكتشف استراتيجيات تداول جديدة ويتحقق منها باستقلالية
  • يتكيّف باستمرار مع ظروف السوق المتغيرة ويُحسِّن استراتيجيات الاستثمار

الاستكشاف

  • Voyager: وكيل استكشاف ذاتي التطور في بيئات Minecraft
  • يكتشف مهارات جديدة باستقلالية ويوسّع فضاء الأفعال

المعايير والتقييم

يرصد الاستطلاع أكثر من 30 معيارًا مرجعيًا تغطي جوانب متنوعة من الوكلاء ذاتيي التطور:

المعيار محور التقييم
DSBench حل مهام علم البيانات
SWE-bench مهام هندسة البرمجيات
LifelongAgentBench التكيّف طويل الأمد
MultiAgentBench التعاون متعدد الوكلاء

تطور مقاييس التقييم

تقييم الذكاء الاصطناعي التقليدي غير كافٍ للوكلاء ذاتيي التطور. المقاييس التالية ذات أهمية بالغة:

  • سرعة التكيّف: ما مدى سرعة تكيّف الوكيل مع البيئات الجديدة؟
  • القدرة على التعميم: هل يمكنه تطبيق المعرفة المكتسبة على مهام غير مرئية؟
  • الاستقرار: هل يظل الأداء ثابتًا خلال عملية التطور؟
  • الكفاءة: كم من الموارد الحسابية يستهلك التطور؟

الاتجاهات المستقبلية

الذكاء الاصطناعي الشخصي

AutoPal: وكيل ذاتي التطور مصمم لفهم تفضيلات كل مستخدم واحتياجاته وأسلوب تفاعله بعمق. قادر على:

  • بناء رسم بياني للمعرفة مخصص لكل مستخدم
  • تكييف أسلوب التواصل وعمق الشرح تلقائيًا
  • اقتراح عناصر مثيرة للاهتمام بناءً على الذاكرة طويلة الأمد

التعميم

لتحقيق ذكاء حقيقي، تُستلزم القدرات التالية:

  • النقل عبر المجالات: تطبيق المعرفة من مجال على آخر
  • الاستدلال التركيبي: حل مشكلات جديدة بالجمع بين عناصر معروفة
  • الاستدلال السببي: فهم علاقات السبب والنتيجة لا مجرد الارتباطات

الأمان

مع تطور أنظمة الذكاء الاصطناعي باستقلالية، تبرز تحديات أمنية جديدة:

  • حماية الخصوصية: ما الذي ينبغي تذكّره وما الذي ينبغي نسيانه؟
  • محاذاة القيم: كيف نحافظ على قيم متوافقة مع القيم الإنسانية خلال التطور؟
  • قابلية التحكم: كيف نضمن إمكانية التدخل البشري في مسار التطور؟

منظومات متعددة الوكلاء

المشكلات الحقيقية المعقدة يصعب حلها بوكيل منفرد. يُعرِّف الاستطلاع MDTeamGPT، نظام دعم تشخيص طبي تتعاون فيه وكلاء متخصصة بخبرات مختلفة.

الطريق نحو الذكاء الاصطناعي الخارق

تعريف الذكاء الاصطناعي الخارق

يُعرِّف الاستطلاع الذكاء الاصطناعي الخارق (ASI) بوصفه نظامًا:

  1. يتجاوز أداء الإنسان في جميع المجالات المعرفية
  2. قادر على التعلم الذاتي المستمر
  3. يمكنه تحديد أهدافه الخاصة وتعديلها
  4. يحل مشكلات جديدة في مواقف لم يشهدها من قبل

خارطة طريق من أربع مراحل

يقترح الاستطلاع خارطة تطورية تتألف من المراحل التالية:

المرحلة الأولى: التميز في المجال المحدد

وكلاء ذاتيو التطور يتجاوزون أداء الخبراء البشريين في مجالات محددة. الأنظمة المتقدمة الحالية بلغت بالفعل هذه المرحلة.

المرحلة الثانية: التكامل عبر المجالات

وكلاء يدمجون المعرفة عبر مجالات متعددة ويحلون مشكلات معقدة متعددة التخصصات. تستلزم هذه المرحلة قدرات التعلم الميتا والنقل عبر المجالات.

المرحلة الثالثة: تحديد الأهداف بصورة مستقلة

أنظمة ذكاء اصطناعي تحدد أهدافها الخاصة وتوجهات تعلمها دون تدخل بشري. هذه المرحلة تطرح أعظم التحديات الأمنية.

المرحلة الرابعة: الذكاء الخارق الجماعي

تعاون وكلاء ذكاء اصطناعي متعددين وتطورهم المشترك لحل مشكلات تفوق قدرة أي فرد منهم، مما يُفضي إلى ذكاء ناشئ.

الأثر الاجتماعي

الآثار الإيجابية

  • تسريع البحث العلمي: تسريع كبير لدورات البحث عبر توليد الفرضيات ذاتيًا والتحقق منها
  • حل المشكلات: إيجاد حلول لتحديات عالمية معقدة كتغير المناخ والأمراض
  • التخصيص: تعليم وصحة وخدمات مخصصة حقًا

التحديات

  • مشكلة التحكم: كيف نضمن تطور أنظمة الذكاء الاصطناعي ضمن الحدود التي يرغب فيها البشر
  • مشكلة عدم المساواة: خطر الاستقطاب بين من يملكون إمكانية الوصول إلى الذكاء الاصطناعي المتقدم ومن لا يملكونها
  • إزاحة الوظائف: مخاطر الأتمتة في المهام المعرفية المعقدة

مشهد الأبحاث

يرصد الاستطلاع مجموعات بحثية رائدة حول العالم:

  • KAIST: التعلم التكيّفي وأنظمة متعددة الوكلاء
  • جامعة سيول الوطنية: التعلم المعزز والتعلم الميتا
  • جامعة يونسي: معالجة اللغة الطبيعية وتطور المعرفة
  • Naver: أبحاث التطبيقات العملية لخدمات الذكاء الاصطناعي
  • Kakao: الذكاء الاصطناعي الشخصي وتطور أنظمة التوصية
  • LG AI Research: أبحاث استقلالية الذكاء الاصطناعي الصناعي

المنهجية البحثية

يعتمد الاستطلاع المنهجية البحثية التالية:

معايير شاملة

تقييم منهجي من خلال أكثر من 30 معيارًا متنوعًا يغطي جوانب متعددة من الوكلاء ذاتيي التطور.

الدراسات الطولية

تتبع طويل الأمد لتغيرات الأداء للتمييز بين التطور الحقيقي والتحسينات المؤقتة.

المصدر المفتوح

مشاركة معظم الأبحاث الكبرى علنًا لتعزيز التعاون داخل المجتمع البحثي.

الأخلاقيات والمسؤولية الاجتماعية

الشفافية

يجب على الوكلاء ذاتيي التطور القدرة على شرح عمليات اتخاذ القرار ونتائج التطور.

العدالة

يجب ألا تُضخِّم عملية التطور التحيزات القائمة على العرق أو الجنس أو غيرها من السمات.

المسؤولية الاجتماعية

ينبغي وجود آليات ملائمة لمنع الأنظمة المتطورة من إلحاق الضرر بالمجتمع.

خلاصة

يمثل الوكلاء ذاتيو التطور تحولًا جذريًا في النموذج يتجاوز مجرد التقدم التقني في الذكاء الاصطناعي. يوفر الإطار ثلاثي الأبعاد (ماذا، ومتى، وكيف) خريطة مفاهيمية شاملة لفهم كيفية تطور أنظمة الذكاء الاصطناعي باستقلالية.

خارطة الطريق من أربع مراحل، من التميز في المجال المحدد إلى الذكاء الخارق الجماعي، طموحة غير أن كل مرحلة تبني على إنجازات بحثية وعملية متراكمة. الأنظمة المتقدمة الحالية قاربت بالفعل المرحلة الأولى وتلامس المرحلة الثانية جزئيًا.

بيد أن التحديات الجوهرية لا تزال قائمة: الأمان وقابلية التحكم ومحاذاة القيم. قوة الوكلاء ذاتيي التطور هائلة، لكن ضمان توجّه هذه القوة نحو ما يعود بالنفع على البشرية يبقى أهم سؤال بحثي في عصرنا.


مراجع: