دليل شامل لتنسيق مجموعات بيانات النماذج اللغوية الكبيرة: من التدريب إلى محاذاة التفضيلات
استكشف مجموعات البيانات والأدوات الأساسية للتدريب اللاحق للنماذج اللغوية الكبيرة، بما في ذلك مجموعات بيانات الضبط الدقيق المراقب وبيانات محاذاة التفضيلات ومن...
استكشف مجموعات البيانات والأدوات الأساسية للتدريب اللاحق للنماذج اللغوية الكبيرة، بما في ذلك مجموعات بيانات الضبط الدقيق المراقب وبيانات محاذاة التفضيلات ومن...
اكتشف المجموعة النهائية من مجموعات البيانات العامة المنتقاة عبر مجالات متنوعة، من الزراعة إلى الرياضات الإلكترونية، يحتفظ بها مجتمع البيانات المفتوحة العالمي.
اكتشف الميزات الأساسية وتطبيقات Rowfill، منصة الذكاء الاصطناعي مفتوحة المصدر التي تنظم ملفات PDF والصور والصوت تلقائياً.
مجموعة شاملة من مجموعات البيانات العامة وطرق التنفيذ لبناء روبوتات الدردشة القائمة على RAG عبر قطاعات البنوك والتأمين والمحاسبة والقانون والرعاية الصحية والس...
تحليل كامل لمجموعة بيانات OpenMathReasoning مع 306 ألف مشكلة رياضية و5.68 مليون حل - منهجيات CoT وTIR وGenSelect وأداء سلسلة OpenMath-Nemotron
تحليل كامل لـ OpenCodeReasoning مع 735 ألف عينة و28 ألف مشكلة - بيانات اصطناعية قائمة على نموذج R1، 10 منصات رئيسية متكاملة، محسنة لـ SFT
تحليل مفصل لمجموعة بيانات NVIDIA AceReason-1.1-SFT - ترخيص CC BY 4.0، 4 مليون عينة، بيانات استدلال رياضي وبرمجي عالية الجودة قائمة على DeepSeek-R1