AI Engineering Hub: مجموعة شاملة من دروس وكلاء الذكاء الاصطناعي وRAG
نظرة عامة
AI Engineering Hub هو مستودع شامل لدروس هندسة الذكاء الاصطناعي يضم 10.7k نجمة. يغطي تطبيقات عملية لنماذج اللغة الكبيرة (LLMs) وRAG ووكلاء الذكاء الاصطناعي، فضلاً عن أحدث التوجهات التقنية، مما يجعله مرجعاً لا غنى عنه لمطوري الذكاء الاصطناعي.
مميزات AI Engineering Hub
- التركيز على التطبيق العملي: مشاريع حقيقية وقابلة للتنفيذ وليس مجرد نظريات
- أحدث التقنيات: يستخدم نماذج حديثة مثل DeepSeek وQwen وOpenAI
- تنوع المجالات: RAG ومتعدد الوكلاء ومعالجة الصوت وOCR وغيرها
- رخصة MIT: مفتوح المصدر ومتاح للاستخدام التجاري
فئات المشاريع الرئيسية
1. أنظمة متعددة الوكلاء
Multi-Agent Deep Researcher (MCP)
Multi-Agent-deep-researcher-mcp-windows-linux/
نظام بحث متعدد الوكلاء لأنظمة Windows وLinux:
الميزات الرئيسية:
- تواصل الوكلاء عبر بروتوكول MCP (Model Context Protocol)
- أتمتة مهام البحث الموزعة
- التوافق مع منصات متعددة
حالات الاستخدام:
- أتمتة البحث الأكاديمي
- تحليل اتجاهات التقنية
- جمع معلومات المنافسين
التواصل بين الوكلاء
agent2agent-demo/
عرض توضيحي للتواصل المباشر بين الوكلاء:
الميزات الأساسية:
- تعاون الوكلاء في الوقت الفعلي
- توزيع المهام والتنسيق فيما بينها
- تكامل النتائج والتحقق منها
2. أنظمة RAG (التوليد المعزز بالاسترجاع)
Agentic RAG مع DeepSeek
agentic_rag_deepseek/
نظام RAG قائم على الوكلاء باستخدام نموذج DeepSeek:
ميزات التنفيذ:
# مثال على هيكل النظام
class AgenticRAGSystem:
def __init__(self):
self.deepseek_model = "deepseek-ai/deepseek-r1-distill-qwen-8b"
self.retrieval_agent = RetrievalAgent()
self.generation_agent = GenerationAgent()
self.orchestrator = AgentOrchestrator()
def process_query(self, query):
# 1. وكيل الاسترجاع يجمع المستندات ذات الصلة
documents = self.retrieval_agent.retrieve(query)
# 2. وكيل التوليد ينتج الاستجابة
response = self.generation_agent.generate(query, documents)
# 3. المنسق يتحقق من الاستجابة ويحسّنها
return self.orchestrator.validate_and_refine(response)
Colivara DeepSeek Website RAG
Colivara-deepseek-website-RAG/
نظام RAG مبني على محتوى مواقع الويب:
الميزات:
- أتمتة زحف الويب
- تحديثات المحتوى في الوقت الفعلي
- تحسين نموذج DeepSeek
RAG متعدد الوسائط
multi-modal-rag/
نظام RAG متعدد الوسائط يدمج النص والصور والصوت:
الصيغ المدعومة:
- المستندات النصية (PDF، DOC، TXT)
- الصور (PNG، JPG، SVG)
- ملفات الصوت (MP3، WAV)
3. مشاريع أحدث النماذج
ضبط نموذج DeepSeek
DeepSeek-finetuning/
دليل لضبط نموذج DeepSeek:
طرق الضبط:
- LoRA (Low-Rank Adaptation)
- Full Fine-tuning
- Instruction Tuning
مثال على التشغيل:
# إعداد البيئة
cd DeepSeek-finetuning
pip install -r requirements.txt
# إعداد البيانات
python prepare_data.py --dataset custom_dataset.jsonl
# تشغيل عملية الضبط
python train.py --model deepseek-ai/deepseek-coder-6.7b-base \
--data ./data/processed \
--output ./models/finetuned
مقارنة Qwen مقابل DeepSeek-R1
qwen3_vs_deepseek-r1/
مقارنة أداء أحدث النماذج:
محاور المقارنة:
- قدرات الاستدلال
- أداء البرمجة
- دعم اللغات المتعددة
- سرعة الاستنتاج
4. تطبيقات المجالات المتخصصة
LaTeX OCR مع Llama
LaTeX-OCR-with-Llama/
التعرف على الصيغ الرياضية وتحويلها إلى LaTeX:
الميزات:
- التعرف على الصيغ المكتوبة بخط اليد
- استخراج الصيغ المطبوعة
- توليد كود LaTeX
مثال على الاستخدام:
from latex_ocr import LaTeXOCR
ocr = LaTeXOCR()
image_path = "math_equation.png"
latex_code = ocr.convert(image_path)
print(f"LaTeX: {latex_code}")
# المخرج: \frac{d}{dx}[f(x)] = \lim_{h \to 0} \frac{f(x+h) - f(x)}{h}
مجموعة أدوات تحليل الصوت
audio-analysis-toolkit/
أدوات تحليل الصوت ومعالجته:
الميزات الرئيسية:
- تحويل الكلام إلى نص (STT)
- تحليل المشاعر
- التعرف على المتحدثين
- تقييم جودة الصوت
بوت صوتي في الوقت الفعلي
real-time-voicebot/
بوت للمحادثة الصوتية في الوقت الفعلي:
الميزات:
- معالجة الصوت بكمون منخفض
- تدفق طبيعي للمحادثة
- دعم لغات متعددة
5. تطبيقات الأعمال
AutoGen Stock Analyst
autogen-stock-analyst/
نظام آلي لتحليل الأسهم:
ميزات التحليل:
- التحليل الفني
- تحليل مشاعر الأخبار
- تحليل القوائم المالية
- توصيات الاستثمار
تحليل اتجاهات YouTube
Youtube-trend-analysis/
أداة لتحليل اتجاهات YouTube:
عناصر التحليل:
- أنماط عدد المشاهدات
- تحليل مشاعر التعليقات
- اتجاهات الكلمات المفتاحية
- معدل نمو القناة
مولّد أخبار الذكاء الاصطناعي
ai_news_generator/
نظام لتوليد الأخبار بالذكاء الاصطناعي:
الميزات:
- جمع المعلومات من مصادر متعددة
- توليد ملخصات آلية
- فحص التحيز
- الترجمة متعددة اللغات
دليل الاستخدام العملي
1. معايير اختيار المشروع
| الغرض | المشروع الموصى به | مستوى الصعوبة | الوقت اللازم |
|---|---|---|---|
| بناء نظام RAG | agentic_rag_deepseek |
متوسط | 2-3 أيام |
| تعلم متعدد الوكلاء | Multi-Agent-deep-researcher-mcp |
متقدم | أسبوع |
| ضبط النماذج | DeepSeek-finetuning |
متوسط | 3-5 أيام |
| معالجة الصوت | real-time-voicebot |
متوسط | 2-4 أيام |
| تحليل الأعمال | autogen-stock-analyst |
مبتدئ | 1-2 يوم |
2. إعداد البيئة
# إعداد البيئة الأساسية
git clone https://github.com/patchy631/ai-engineering-hub.git
cd ai-engineering-hub
# إعداد البيئة لكل مشروع
cd [project-name]
pip install -r requirements.txt
# متغيرات البيئة (إذا لزم الأمر)
export OPENAI_API_KEY="your-api-key"
export DEEPSEEK_API_KEY="your-deepseek-key"
3. تخصيص المشاريع
تخصيص نظام RAG
# التخصيص بناءً على agentic_rag_deepseek
class CustomRAGSystem(AgenticRAGSystem):
def __init__(self, domain="finance"):
super().__init__()
self.domain = domain
self.load_domain_specific_data()
def load_domain_specific_data(self):
"""تحميل البيانات الخاصة بالمجال"""
if self.domain == "finance":
self.load_financial_documents()
elif self.domain == "medical":
self.load_medical_literature()
def custom_retrieval(self, query):
"""منطق استرجاع خاص بالمجال"""
# استرجاع محسّن لكل مجال
return self.retrieval_agent.retrieve_with_domain_filter(
query, domain=self.domain
)
توسيع نظام متعدد الوكلاء
# توسيع نظام متعدد الوكلاء
class ExtendedAgentSystem:
def __init__(self):
self.agents = {
'researcher': ResearchAgent(),
'analyst': AnalysisAgent(),
'writer': WritingAgent(),
'reviewer': ReviewAgent()
}
def execute_workflow(self, task):
"""تنفيذ سير العمل"""
# 1. مرحلة البحث
research_data = self.agents['researcher'].investigate(task)
# 2. مرحلة التحليل
analysis = self.agents['analyst'].analyze(research_data)
# 3. مرحلة الكتابة
content = self.agents['writer'].generate(analysis)
# 4. مرحلة المراجعة
final_output = self.agents['reviewer'].review(content)
return final_output
نصائح لتحسين الأداء
1. كفاءة الذاكرة
# تحسين ذاكرة GPU
import torch
def optimize_model_memory(model):
"""تحسين استخدام ذاكرة النموذج"""
# استخدام الدقة المختلطة
model = model.half()
# نقاط التفتيش للتدرج
model.gradient_checkpointing_enable()
# تعطيل التدرجات غير الضرورية
for param in model.parameters():
param.requires_grad = False
return model
2. تحسين سرعة الاستنتاج
# تحسين المعالجة الدفعية
class BatchProcessor:
def __init__(self, model, batch_size=8):
self.model = model
self.batch_size = batch_size
def process_batch(self, inputs):
"""معالجة المدخلات في دفعات"""
results = []
for i in range(0, len(inputs), self.batch_size):
batch = inputs[i:i+self.batch_size]
with torch.no_grad():
batch_results = self.model(batch)
results.extend(batch_results)
return results
3. تحسين التكاليف
# تحسين استدعاءات واجهة برمجة التطبيقات
class CostOptimizedAgent:
def __init__(self):
self.cache = {}
self.local_model = None
def smart_inference(self, query):
"""استنتاج فعّال من حيث التكلفة"""
# 1. التحقق من ذاكرة التخزين المؤقت
if query in self.cache:
return self.cache[query]
# 2. استخدام النموذج المحلي للاستفسارات البسيطة
if self.is_simple_query(query):
result = self.local_model.generate(query)
else:
# استخدام واجهة برمجة التطبيقات للاستفسارات المعقدة فقط
result = self.api_call(query)
# 3. تخزين النتيجة في ذاكرة التخزين المؤقت
self.cache[query] = result
return result
كيفية المساهمة في المجتمع
1. إضافة دروس جديدة
# 1. إنشاء نسخة من المستودع (Fork)
git fork https://github.com/patchy631/ai-engineering-hub.git
# 2. إنشاء فرع جديد
git checkout -b feature/new-tutorial
# 3. إنشاء مجلد الدرس
mkdir my-new-tutorial
cd my-new-tutorial
# 4. إنشاء الملفات المطلوبة
touch README.md requirements.txt main.py
2. إرشادات التوثيق
# عنوان الدرس
## نظرة عامة
- الهدف وأهداف التعلم
- المعرفة المسبقة المطلوبة
## التثبيت والإعداد
- متطلبات البيئة
- أوامر التثبيت
## التنفيذ خطوة بخطوة
- أمثلة على الكود
- الشروح والتعليقات
## النتائج والتقييم
- نتائج التشغيل
- مقاييس الأداء
## إمكانيات التوسع
- أفكار للتحسين
- المشاريع ذات الصلة
3. معايير جودة الكود
# دليل أسلوب الكود
def example_function(param1: str, param2: int) -> dict:
"""
وصف الدالة
Args:
param1: وصف المعامل الأول
param2: وصف المعامل الثاني
Returns:
وصف القيمة المُعادة
"""
# منطق التنفيذ
result = {"status": "success", "data": param1 * param2}
return result
# معالجة الأخطاء
try:
result = example_function("test", 5)
except Exception as e:
logger.error(f"خطأ في تنفيذ الدالة: {e}")
raise
حالات استخدام واقعية
1. حالة استخدام في الشركات الناشئة
المشكلة: أتمتة دعم العملاء
الحل: rag-voice-agent + real-time-voicebot
# تنفيذ بوت دعم العملاء
class CustomerSupportBot:
def __init__(self):
self.rag_system = RAGVoiceAgent()
self.voice_bot = RealTimeVoiceBot()
self.knowledge_base = CompanyKnowledgeBase()
def handle_customer_query(self, audio_input):
# 1. تحويل الكلام إلى نص
text_query = self.voice_bot.speech_to_text(audio_input)
# 2. استرجاع المعلومات ذات الصلة عبر RAG
relevant_info = self.rag_system.retrieve(text_query)
# 3. توليد الاستجابة
response = self.rag_system.generate_response(
text_query, relevant_info
)
# 4. تحويل النص إلى كلام
audio_response = self.voice_bot.text_to_speech(response)
return audio_response
2. حالة استخدام في المؤسسات
المشكلة: أتمتة تحليل السوق
الحل: Multi-Agent-deep-researcher-mcp + Youtube-trend-analysis
# نظام تحليل السوق
class MarketAnalysisSystem:
def __init__(self):
self.research_agents = MultiAgentResearcher()
self.trend_analyzer = YouTubeTrendAnalyzer()
self.report_generator = ReportGenerator()
def analyze_market(self, industry, timeframe):
# 1. بحث السوق متعدد الوكلاء
market_data = self.research_agents.investigate_market(
industry, timeframe
)
# 2. تحليل الاتجاهات الاجتماعية
social_trends = self.trend_analyzer.analyze_trends(
industry, timeframe
)
# 3. توليد تقرير شامل
report = self.report_generator.create_report(
market_data, social_trends
)
return report
اتجاه التطوير المستقبلي
1. خارطة طريق التقنية
- الربع الثاني 2025: دمج GPT-5 وClaude-4
- الربع الثالث 2025: توسيع الوكلاء متعددة الوسائط
- الربع الرابع 2025: ضبط النماذج الآلي
2. توسيع المجتمع
- ورش عمل شهرية عبر الإنترنت
- برنامج حوافز للمساهمين
- توسيع الشراكات المؤسسية
3. تكامل المنصات
- دمج مع Hugging Face Spaces
- توفير دفاتر Google Colab
- دعم حاويات Docker
خاتمة
يوفر AI Engineering Hub موارد شاملة يمكن لمطوري الذكاء الاصطناعي استخدامها مباشرة في مشاريعهم العملية. بفضل 10.7k نجمة، يتجاوز هذا المستودع الدروس البسيطة ليقدم تطبيقات عالية الجودة صالحة للاستخدام في بيئات الإنتاج الفعلية.
القيم الأساسية
- التركيز على التطبيق: مشاريع حقيقية وقابلة للتنفيذ وليس مجرد نظريات
- أحدث التقنيات: يستخدم نماذج حديثة مثل DeepSeek وQwen
- قائم على المجتمع: 1.8k فرع ومساهمات نشطة
- الاستخدام التجاري: متاح مجاناً بموجب رخصة MIT
البدء
- استكشاف المستودع: اختر المشاريع التي تثير اهتمامك
- إعداد البيئة: هيّئ بيئة تتوافق مع المتطلبات
- التطبيق العملي: اتبع الدروس خطوة بخطوة
- التخصيص: عدّل المشروع ليناسب احتياجاتك
- المساهمة في المجتمع: شارك تحسيناتك وأفكارك الجديدة
مستقبل هندسة الذكاء الاصطناعي سيتقدم بفضل تعاون مجتمعات المصدر المفتوح كهذه. أتقن أحدث تقنيات الذكاء الاصطناعي وطبّقها على مشاكل الواقع مع AI Engineering Hub.