[Thaki Cloud الحياة والمهنة] KCD Seoul 2025
🎤 معلومات عرض ThakiCloud @ KCD Seoul 2025
📅 التاريخ
22 مايو 2025 (الخميس)
🔗 الروابط ذات الصلة
- الموقع الرسمي: KCD Seoul 2025
- صفحة الترويج على LinkedIn: ThakiCloud - KCD Seoul 2025
- مواد العرض: عرض الشرائح
📜 نص العرض
🎤 مقدمة ThakiCloud ومنصة البنية التحتية للذكاء الاصطناعي الوكيلي القائمة على xPU
1. المقدمة (الشريحة 1)
مرحباً. أنا [الاسم] من ThakiCloud.
اليوم، سأتحدث عن منصة الذكاء الاصطناعي الوكيلي الأصلية لـ Kubernetes التي تغير نموذج البنية التحتية لعصر الذكاء الاصطناعي، ومستقبل البنية التحتية للذكاء الاصطناعي القائمة على xPU التي نقترحها.
2. مقدمة الشركة والمهمة (الشريحة 2)
ThakiCloud هي شركة منصة البنية التحتية للذكاء الاصطناعي التي تحقق مرونة وقابلية التوسع على مستوى السحابة العامة في البيئات الخاصة والهجينة.
المهمة: دعم جميع الشركات للتحول إلى الذكاء الاصطناعي أولاً
مجالات التكنولوجيا الأساسية:
- البنية التحتية لـ LLM والذكاء الاصطناعي الوكيلي
- الإدارة المتكاملة للمسرعات غير المتجانسة (إدارة xPU)
- خدمة xPU القائمة على Kubernetes-Native
3. لماذا xPUaaS والذكاء الاصطناعي الوكيلي؟ (الشريحة 3)
المشاكل الحالية:
- زيادة التكلفة (TCO) المتمركزة حول GPU وعدم استقرار سلسلة التوريد
- صعوبة في تحسين الأجهزة وفقاً لأحمال العمل المختلفة
- التنسيق المعقد الفريد للذكاء الاصطناعي الوكيلي
- قضايا سيادة البيانات
حلول ThakiCloud:
- xPUaaS التي توفر مسرعات مختلفة كخدمات
- منصة الذكاء الاصطناعي الوكيلي الجاهزة المتمركزة حول تجربة المطور
- الاستجابة لتنظيم البيانات من خلال السحابة السيادية
4. تدفق تحسين أحمال عمل الذكاء الاصطناعي (الشريحة 4)
بالنظر إلى المخطط، تقوم منصتنا بتخصيص xPU الأنسب تلقائياً وفقاً لأنواع أحمال عمل الذكاء الاصطناعي.
أمثلة:
- التدريب واسع النطاق → مجموعة GPU NVIDIA
- الاستنتاج في الوقت الفعلي → GPU عالي الأداء أو NPU محلي
- الاستنتاج المجمع → هيكل هجين محسن للتكلفة
هذه الخطوط محسنة تلقائياً من خلال المراقبة المستمرة والتغذية الراجعة.
5. تكوين البنية التحتية للذكاء الاصطناعي الأصلية للسحابة (الشريحة 5~6)
تم تصميم xPUaaS الخاص بنا بناءً على هيكل امتداد Kubernetes:
- مكونات الجهاز المختلفة
- وقت تشغيل الاستنتاج المتكامل
- API بديهي من خلال غلاف xPU SDK
- بيئة المراقبة القائمة على Prometheus، Grafana، Loki
عملاء مختلفون بما في ذلك SDK والويب والجوال يصلون من خلال بوابة API.
🎤 نص العرض التفصيلي للشريحة 6
✅ تدفق التكوين العام
هيكل xPUaaS في ThakiCloud هو هيكل يصور التدفق الكامل من طلبات العميل إلى مسرعات الاستنتاج.
1. طبقة العميل
- عملاء الويب والجوال و SDK يصلون إلى خدمات الذكاء الاصطناعي من خلال بوابة API
- بوابة xPUaaS API توجه الطلبات مركزياً
2. طبقة الخدمة الأساسية
- خدمة الاستنتاج: معالجة الاستنتاج في الوقت الفعلي
- إدارة النماذج: تسجيل النماذج، إدارة الإصدارات
- مجمعات موارد xPU: تكوين مجمع المسرعات
- التوسع التلقائي: تعديل المقياس التلقائي وفقاً للطلب
3. طبقة تنسيق Kubernetes
- مكونات الجهاز: تسجيل المسرعات حسب البائع (NVIDIA، Rebellions، Furiosa، إلخ)
- المجدول المخصص: وضع الموارد المحسن
- وقت تشغيل الاستنتاج / غلاف SDK: تكامل الخلفية
- عزل الموارد / القابلية للملاحظة: بناء أنظمة العزل والمراقبة
4. طبقة الأجهزة
- التكامل في الوقت الفعلي مع NVIDIA GPU، FuriosaAI NPU، Rebellions NPU، إلخ
- يتضمن إدارة برنامج التشغيل والطاقة وفحص الصحة وتحديث البرامج الثابتة
📌 تأكيد الملخص
- بوابة API واحدة
- البنية التحتية الآلية القائمة على Kubernetes
- اتصال xPU مرن
- ضمان المراقبة القوية والاستقرار
6. استراتيجية تشغيل السحابة المرنة (الشريحة 8~9)
- النشر التصريحي القائم على GitOps + Helm
- دعم متعدد السحابات: في المقر، AWS EKS، GCP GKE، Azure AKS
- قابلية التوسع بدون خادم: التكامل مع ACA، Cloud Run
- تحقيق الأتمتة والتوسع على مستوى السحابة العامة في البيئات الخاصة
7. أسباب الانضمام إلينا (الشريحة 10)
ThakiCloud:
- تقود ابتكار البنية التحتية للذكاء الاصطناعي
- تسعى إلى ثقافة المهندسين المتمركزة حول مساهمة المصدر المفتوح
- تنمو مع النظام البيئي NPU المحلي
نحن ننتظر الشركاء والزملاء الذين سيصممون مستقبل البنية التحتية للذكاء الاصطناعي معاً.
🔚 الخلاصة
شكراً لكم على الاستماع.
نتطلع إلى إجراء المزيد من المحادثات خلال جلسة الأسئلة والأجوبة بعد العرض.