AI Engineering Hub: مجموعة شاملة من دروس وكلاء الذكاء الاصطناعي وRAG

نظرة عامة

AI Engineering Hub هو مستودع شامل لدروس هندسة الذكاء الاصطناعي يضم 10.7k نجمة. يغطي تطبيقات عملية لنماذج اللغة الكبيرة (LLMs) وRAG ووكلاء الذكاء الاصطناعي، فضلاً عن أحدث التوجهات التقنية، مما يجعله مرجعاً لا غنى عنه لمطوري الذكاء الاصطناعي.

مميزات AI Engineering Hub

التركيز على التطبيق العملي: مشاريع حقيقية وقابلة للتنفيذ وليس مجرد نظريات
أحدث التقنيات: يستخدم نماذج حديثة مثل DeepSeek وQwen وOpenAI
تنوع المجالات: RAG ومتعدد الوكلاء ومعالجة الصوت وOCR وغيرها
رخصة MIT: مفتوح المصدر ومتاح للاستخدام التجاري

فئات المشاريع الرئيسية

1. أنظمة متعددة الوكلاء

Multi-Agent Deep Researcher (MCP)

Multi-Agent-deep-researcher-mcp-windows-linux/

نظام بحث متعدد الوكلاء لأنظمة Windows وLinux:

الميزات الرئيسية:

تواصل الوكلاء عبر بروتوكول MCP (Model Context Protocol)
أتمتة مهام البحث الموزعة
التوافق مع منصات متعددة

حالات الاستخدام:

أتمتة البحث الأكاديمي
تحليل اتجاهات التقنية
جمع معلومات المنافسين

التواصل بين الوكلاء

agent2agent-demo/

عرض توضيحي للتواصل المباشر بين الوكلاء:

الميزات الأساسية:

تعاون الوكلاء في الوقت الفعلي
توزيع المهام والتنسيق فيما بينها
تكامل النتائج والتحقق منها

2. أنظمة RAG (التوليد المعزز بالاسترجاع)

Agentic RAG مع DeepSeek

agentic_rag_deepseek/

نظام RAG قائم على الوكلاء باستخدام نموذج DeepSeek:

ميزات التنفيذ:

# مثال على هيكل النظام
class AgenticRAGSystem:
    def __init__(self):
        self.deepseek_model = "deepseek-ai/deepseek-r1-distill-qwen-8b"
        self.retrieval_agent = RetrievalAgent()
        self.generation_agent = GenerationAgent()
        self.orchestrator = AgentOrchestrator()
    
    def process_query(self, query):
        # 1. وكيل الاسترجاع يجمع المستندات ذات الصلة
        documents = self.retrieval_agent.retrieve(query)
        
        # 2. وكيل التوليد ينتج الاستجابة
        response = self.generation_agent.generate(query, documents)
        
        # 3. المنسق يتحقق من الاستجابة ويحسّنها
        return self.orchestrator.validate_and_refine(response)

Colivara DeepSeek Website RAG

Colivara-deepseek-website-RAG/

نظام RAG مبني على محتوى مواقع الويب:

الميزات:

أتمتة زحف الويب
تحديثات المحتوى في الوقت الفعلي
تحسين نموذج DeepSeek

RAG متعدد الوسائط

multi-modal-rag/

نظام RAG متعدد الوسائط يدمج النص والصور والصوت:

الصيغ المدعومة:

المستندات النصية (PDF، DOC، TXT)
الصور (PNG، JPG، SVG)
ملفات الصوت (MP3، WAV)

3. مشاريع أحدث النماذج

ضبط نموذج DeepSeek

DeepSeek-finetuning/

دليل لضبط نموذج DeepSeek:

طرق الضبط:

LoRA (Low-Rank Adaptation)
Full Fine-tuning
Instruction Tuning

مثال على التشغيل:

# إعداد البيئة
cd DeepSeek-finetuning
pip install -r requirements.txt

# إعداد البيانات
python prepare_data.py --dataset custom_dataset.jsonl

# تشغيل عملية الضبط
python train.py --model deepseek-ai/deepseek-coder-6.7b-base \
                --data ./data/processed \
                --output ./models/finetuned

مقارنة Qwen مقابل DeepSeek-R1

qwen3_vs_deepseek-r1/

مقارنة أداء أحدث النماذج:

محاور المقارنة:

قدرات الاستدلال
أداء البرمجة
دعم اللغات المتعددة
سرعة الاستنتاج

4. تطبيقات المجالات المتخصصة

LaTeX OCR مع Llama

LaTeX-OCR-with-Llama/

التعرف على الصيغ الرياضية وتحويلها إلى LaTeX:

الميزات:

التعرف على الصيغ المكتوبة بخط اليد
استخراج الصيغ المطبوعة
توليد كود LaTeX

مثال على الاستخدام:

from latex_ocr import LaTeXOCR

ocr = LaTeXOCR()
image_path = "math_equation.png"
latex_code = ocr.convert(image_path)
print(f"LaTeX: {latex_code}")
# المخرج: \frac{d}{dx}[f(x)] = \lim_{h \to 0} \frac{f(x+h) - f(x)}{h}

مجموعة أدوات تحليل الصوت

audio-analysis-toolkit/

أدوات تحليل الصوت ومعالجته:

الميزات الرئيسية:

تحويل الكلام إلى نص (STT)
تحليل المشاعر
التعرف على المتحدثين
تقييم جودة الصوت

بوت صوتي في الوقت الفعلي

real-time-voicebot/

بوت للمحادثة الصوتية في الوقت الفعلي:

الميزات:

معالجة الصوت بكمون منخفض
تدفق طبيعي للمحادثة
دعم لغات متعددة

5. تطبيقات الأعمال

AutoGen Stock Analyst

autogen-stock-analyst/

نظام آلي لتحليل الأسهم:

ميزات التحليل:

التحليل الفني
تحليل مشاعر الأخبار
تحليل القوائم المالية
توصيات الاستثمار

تحليل اتجاهات YouTube

Youtube-trend-analysis/

أداة لتحليل اتجاهات YouTube:

عناصر التحليل:

أنماط عدد المشاهدات
تحليل مشاعر التعليقات
اتجاهات الكلمات المفتاحية
معدل نمو القناة

مولّد أخبار الذكاء الاصطناعي

ai_news_generator/

نظام لتوليد الأخبار بالذكاء الاصطناعي:

الميزات:

جمع المعلومات من مصادر متعددة
توليد ملخصات آلية
فحص التحيز
الترجمة متعددة اللغات

دليل الاستخدام العملي

1. معايير اختيار المشروع

الغرض	المشروع الموصى به	مستوى الصعوبة	الوقت اللازم
بناء نظام RAG	`agentic_rag_deepseek`	متوسط	2-3 أيام
تعلم متعدد الوكلاء	`Multi-Agent-deep-researcher-mcp`	متقدم	أسبوع
ضبط النماذج	`DeepSeek-finetuning`	متوسط	3-5 أيام
معالجة الصوت	`real-time-voicebot`	متوسط	2-4 أيام
تحليل الأعمال	`autogen-stock-analyst`	مبتدئ	1-2 يوم

2. إعداد البيئة

# إعداد البيئة الأساسية
git clone https://github.com/patchy631/ai-engineering-hub.git
cd ai-engineering-hub

# إعداد البيئة لكل مشروع
cd [project-name]
pip install -r requirements.txt

# متغيرات البيئة (إذا لزم الأمر)
export OPENAI_API_KEY="your-api-key"
export DEEPSEEK_API_KEY="your-deepseek-key"

3. تخصيص المشاريع

تخصيص نظام RAG

# التخصيص بناءً على agentic_rag_deepseek
class CustomRAGSystem(AgenticRAGSystem):
    def __init__(self, domain="finance"):
        super().__init__()
        self.domain = domain
        self.load_domain_specific_data()
    
    def load_domain_specific_data(self):
        """تحميل البيانات الخاصة بالمجال"""
        if self.domain == "finance":
            self.load_financial_documents()
        elif self.domain == "medical":
            self.load_medical_literature()
    
    def custom_retrieval(self, query):
        """منطق استرجاع خاص بالمجال"""
        # استرجاع محسّن لكل مجال
        return self.retrieval_agent.retrieve_with_domain_filter(
            query, domain=self.domain
        )

توسيع نظام متعدد الوكلاء

# توسيع نظام متعدد الوكلاء
class ExtendedAgentSystem:
    def __init__(self):
        self.agents = {
            'researcher': ResearchAgent(),
            'analyst': AnalysisAgent(),
            'writer': WritingAgent(),
            'reviewer': ReviewAgent()
        }
    
    def execute_workflow(self, task):
        """تنفيذ سير العمل"""
        # 1. مرحلة البحث
        research_data = self.agents['researcher'].investigate(task)
        
        # 2. مرحلة التحليل
        analysis = self.agents['analyst'].analyze(research_data)
        
        # 3. مرحلة الكتابة
        content = self.agents['writer'].generate(analysis)
        
        # 4. مرحلة المراجعة
        final_output = self.agents['reviewer'].review(content)
        
        return final_output

نصائح لتحسين الأداء

1. كفاءة الذاكرة

# تحسين ذاكرة GPU
import torch

def optimize_model_memory(model):
    """تحسين استخدام ذاكرة النموذج"""
    # استخدام الدقة المختلطة
    model = model.half()
    
    # نقاط التفتيش للتدرج
    model.gradient_checkpointing_enable()
    
    # تعطيل التدرجات غير الضرورية
    for param in model.parameters():
        param.requires_grad = False
    
    return model

2. تحسين سرعة الاستنتاج

# تحسين المعالجة الدفعية
class BatchProcessor:
    def __init__(self, model, batch_size=8):
        self.model = model
        self.batch_size = batch_size
    
    def process_batch(self, inputs):
        """معالجة المدخلات في دفعات"""
        results = []
        
        for i in range(0, len(inputs), self.batch_size):
            batch = inputs[i:i+self.batch_size]
            with torch.no_grad():
                batch_results = self.model(batch)
            results.extend(batch_results)
        
        return results

3. تحسين التكاليف

# تحسين استدعاءات واجهة برمجة التطبيقات
class CostOptimizedAgent:
    def __init__(self):
        self.cache = {}
        self.local_model = None
    
    def smart_inference(self, query):
        """استنتاج فعّال من حيث التكلفة"""
        # 1. التحقق من ذاكرة التخزين المؤقت
        if query in self.cache:
            return self.cache[query]
        
        # 2. استخدام النموذج المحلي للاستفسارات البسيطة
        if self.is_simple_query(query):
            result = self.local_model.generate(query)
        else:
            # استخدام واجهة برمجة التطبيقات للاستفسارات المعقدة فقط
            result = self.api_call(query)
        
        # 3. تخزين النتيجة في ذاكرة التخزين المؤقت
        self.cache[query] = result
        return result

كيفية المساهمة في المجتمع

1. إضافة دروس جديدة

# 1. إنشاء نسخة من المستودع (Fork)
git fork https://github.com/patchy631/ai-engineering-hub.git

# 2. إنشاء فرع جديد
git checkout -b feature/new-tutorial

# 3. إنشاء مجلد الدرس
mkdir my-new-tutorial
cd my-new-tutorial

# 4. إنشاء الملفات المطلوبة
touch README.md requirements.txt main.py

2. إرشادات التوثيق

# عنوان الدرس

## نظرة عامة
- الهدف وأهداف التعلم
- المعرفة المسبقة المطلوبة

## التثبيت والإعداد
- متطلبات البيئة
- أوامر التثبيت

## التنفيذ خطوة بخطوة
- أمثلة على الكود
- الشروح والتعليقات

## النتائج والتقييم
- نتائج التشغيل
- مقاييس الأداء

## إمكانيات التوسع
- أفكار للتحسين
- المشاريع ذات الصلة

3. معايير جودة الكود

# دليل أسلوب الكود
def example_function(param1: str, param2: int) -> dict:
    """
    وصف الدالة
    
    Args:
        param1: وصف المعامل الأول
        param2: وصف المعامل الثاني
    
    Returns:
        وصف القيمة المُعادة
    """
    # منطق التنفيذ
    result = {"status": "success", "data": param1 * param2}
    return result

# معالجة الأخطاء
try:
    result = example_function("test", 5)
except Exception as e:
    logger.error(f"خطأ في تنفيذ الدالة: {e}")
    raise

حالات استخدام واقعية

1. حالة استخدام في الشركات الناشئة

المشكلة: أتمتة دعم العملاء الحل: rag-voice-agent + real-time-voicebot

# تنفيذ بوت دعم العملاء
class CustomerSupportBot:
    def __init__(self):
        self.rag_system = RAGVoiceAgent()
        self.voice_bot = RealTimeVoiceBot()
        self.knowledge_base = CompanyKnowledgeBase()
    
    def handle_customer_query(self, audio_input):
        # 1. تحويل الكلام إلى نص
        text_query = self.voice_bot.speech_to_text(audio_input)
        
        # 2. استرجاع المعلومات ذات الصلة عبر RAG
        relevant_info = self.rag_system.retrieve(text_query)
        
        # 3. توليد الاستجابة
        response = self.rag_system.generate_response(
            text_query, relevant_info
        )
        
        # 4. تحويل النص إلى كلام
        audio_response = self.voice_bot.text_to_speech(response)
        
        return audio_response

2. حالة استخدام في المؤسسات

المشكلة: أتمتة تحليل السوق الحل: Multi-Agent-deep-researcher-mcp + Youtube-trend-analysis

# نظام تحليل السوق
class MarketAnalysisSystem:
    def __init__(self):
        self.research_agents = MultiAgentResearcher()
        self.trend_analyzer = YouTubeTrendAnalyzer()
        self.report_generator = ReportGenerator()
    
    def analyze_market(self, industry, timeframe):
        # 1. بحث السوق متعدد الوكلاء
        market_data = self.research_agents.investigate_market(
            industry, timeframe
        )
        
        # 2. تحليل الاتجاهات الاجتماعية
        social_trends = self.trend_analyzer.analyze_trends(
            industry, timeframe
        )
        
        # 3. توليد تقرير شامل
        report = self.report_generator.create_report(
            market_data, social_trends
        )
        
        return report

اتجاه التطوير المستقبلي

1. خارطة طريق التقنية

الربع الثاني 2025: دمج GPT-5 وClaude-4
الربع الثالث 2025: توسيع الوكلاء متعددة الوسائط
الربع الرابع 2025: ضبط النماذج الآلي

2. توسيع المجتمع

ورش عمل شهرية عبر الإنترنت
برنامج حوافز للمساهمين
توسيع الشراكات المؤسسية

3. تكامل المنصات

دمج مع Hugging Face Spaces
توفير دفاتر Google Colab
دعم حاويات Docker

خاتمة

يوفر AI Engineering Hub موارد شاملة يمكن لمطوري الذكاء الاصطناعي استخدامها مباشرة في مشاريعهم العملية. بفضل 10.7k نجمة، يتجاوز هذا المستودع الدروس البسيطة ليقدم تطبيقات عالية الجودة صالحة للاستخدام في بيئات الإنتاج الفعلية.

القيم الأساسية

التركيز على التطبيق: مشاريع حقيقية وقابلة للتنفيذ وليس مجرد نظريات
أحدث التقنيات: يستخدم نماذج حديثة مثل DeepSeek وQwen
قائم على المجتمع: 1.8k فرع ومساهمات نشطة
الاستخدام التجاري: متاح مجاناً بموجب رخصة MIT

البدء

استكشاف المستودع: اختر المشاريع التي تثير اهتمامك
إعداد البيئة: هيّئ بيئة تتوافق مع المتطلبات
التطبيق العملي: اتبع الدروس خطوة بخطوة
التخصيص: عدّل المشروع ليناسب احتياجاتك
المساهمة في المجتمع: شارك تحسيناتك وأفكارك الجديدة

مستقبل هندسة الذكاء الاصطناعي سيتقدم بفضل تعاون مجتمعات المصدر المفتوح كهذه. أتقن أحدث تقنيات الذكاء الاصطناعي وطبّقها على مشاكل الواقع مع AI Engineering Hub.

نظرة عامة

مميزات AI Engineering Hub

فئات المشاريع الرئيسية

1. أنظمة متعددة الوكلاء

Multi-Agent Deep Researcher (MCP)

التواصل بين الوكلاء

2. أنظمة RAG (التوليد المعزز بالاسترجاع)

Agentic RAG مع DeepSeek

Colivara DeepSeek Website RAG

RAG متعدد الوسائط

3. مشاريع أحدث النماذج

ضبط نموذج DeepSeek

مقارنة Qwen مقابل DeepSeek-R1

4. تطبيقات المجالات المتخصصة

LaTeX OCR مع Llama

مجموعة أدوات تحليل الصوت

بوت صوتي في الوقت الفعلي

5. تطبيقات الأعمال

AutoGen Stock Analyst

تحليل اتجاهات YouTube

مولّد أخبار الذكاء الاصطناعي

دليل الاستخدام العملي

1. معايير اختيار المشروع

2. إعداد البيئة

3. تخصيص المشاريع

تخصيص نظام RAG

توسيع نظام متعدد الوكلاء

نصائح لتحسين الأداء

1. كفاءة الذاكرة

2. تحسين سرعة الاستنتاج

3. تحسين التكاليف

كيفية المساهمة في المجتمع

1. إضافة دروس جديدة

2. إرشادات التوثيق

3. معايير جودة الكود

حالات استخدام واقعية

1. حالة استخدام في الشركات الناشئة

2. حالة استخدام في المؤسسات

اتجاه التطوير المستقبلي

1. خارطة طريق التقنية

2. توسيع المجتمع

3. تكامل المنصات

خاتمة

القيم الأساسية

البدء

참고

SkillOpt: 에이전트 스킬을 훈련 가능한 텍스트 컴포넌트로 최적화하다 (arXiv:2605.23904)

보상 없이 스스로 진화하는 LLM 에이전트: 월드 노리지 탐색 기반 학습 (arXiv:2604.18131)

코드가 에이전트 하네스다: AI 에이전트 인프라의 세 계층 구조 (arXiv:2605.18747)

Autogenesis: 에이전트가 스스로를 고치는 자기진화 프로토콜 (arXiv:2604.15034)