النمو في ThakiCloud، ومهنتك 🚀

“السرعة · التحقق · الإصدار” (Three Vs) — إذا كانت هذه الكلمات الثلاث تجعل قلبك يتسارع، فإن ThakiCloud هو بالضبط مسرحك. نحن مكان يمكنك فيه تجربة MLOps الحقيقي كامل المجموعة مع حركة المرور الفعلية، وتحقيق التكامل الرأسي من البنية التحتية GPU/NPU إلى SaaS. بقوة التكنولوجيا والثقافة والزملاء، نحن نتحرك بشكل أسرع وأكثر أماناً وأبعد.


MLOps في ThakiCloud، هكذا يختلف

1. السرعة — من الفكرة إلى الإنتاج، قبل أن تبرد قهوتك

  • التكامل الرأسي IaaS-PaaS-SaaS: النشر المختلط لـ GPU·NPU في Kubernetes NodePool، تكلفة إعادة جدولة صفر عند التبديل من التجربة إلى الخدمة.
  • البناء التلقائي لصورة JupyterHub: فقط ادفع فرعاً ويتم نشر Helm Chart فوراً إلى مجموعة التدريج.
  • واجهة التجربة القائمة على Feature Store: دمج إصدارات البيانات·الميزات بنقرة واحدة، إطلاق تجارب جديدة خلال 15 دقيقة.

2. التحقق — فشل سريع، المقاييس بلغة المنتج

  • قمع حركة المرور الظلية: نسخ 10% من حركة المرور في الوقت الفعلي لتقييم النماذج الجديدة دون تعرض المستخدم.
  • التكامل التلقائي لمعدل النقر·MAU ↔ مقاييس ML: مراقبة مؤشرات الأداء الرئيسية للأعمال ومقاييس ML معاً على لوحة Prometheus + Grafana.
  • طبقة الأمان الاستدلالية: تصفية التنبؤات تلقائياً مع الثقة < τ لحماية تجربة المستخدم.

3. الإصدار — السفر عبر الزمن بخط واحد من علامة Docker

  • سجل نماذج OCI: إدارة النماذج·الميزات·البيانات الوصفية كعلامات صورة، التراجع الفوري بتحديد sha فقط.
  • إعادة التدريب التلقائي اليومي: عندما يتم اكتشاف انحراف البيانات، ينفذ Airflow DAG تلقائياً إعادة التدريب·التحقق·الترقية.
  • نموذج الاحتياطي: يتم نشر النموذج الخفيف خلال ثانية واحدة عند انتهاك SLO.

نقاط الألم التي حللناها والفصل التالي

  • عدم التناسق Dev ↔ Prod → موحد مع إصدار Helm واحد.
    التالي: توحيد النشر متعدد المناطق.
  • فيضان التنبيهات → تقليل الضوضاء مع روبوت ضبط التنبيهات.
    التالي: التحليل التلقائي للسبب الجذري لمستوى السجل مع GPT.
  • أخطاء الذيل الطويل → الاستنساخ مع مصحح تقطيع الميزات.
    التالي: أتمتة الاستنساخ الكاملة القائمة على تركيب البيانات.
  • النشر البطيء → 30 → 5 أيام مع Canary + التسليم التدريجي.
    التالي: تكامل أكثر إحكاماً لـ OKRs فريق النموذج·العمليات·الأعمال.

ما يعنيه العمل في ThakiCloud — قصص حقيقية

“الساعة 3 صباحاً، تعطل نموذج التجربة لكن تم التراجع في 5 دقائق!”

يقول السيد B من فريق منصة MLOps: “بفضل ثقافة حيث الفشل أيضاً يصبح أصولاً، لست خائفاً من التجارب. السجلات المهملة تبقى أيضاً كمعرفة فريق، وتجربة PRs المصدر المفتوح التي تلتقي مباشرة بحركة المرور الحقيقية هي سحر ThakiCloud الفريد.”

يتذكر السيد C من فريق Cloud Infra مشهد GPUs تعمل في الصحراء السعودية. “تجربة تصميم وتشغيل البنية التحتية على نطاق عالمي مباشرة، والتعاون مع الزملاء يصبح القوة الدافعة للنمو اليومي.”


مناصب التوظيف

  الفريق المهمة في لمحة
  منصة MLOps إعادة تصميم Feature Store، أتمتة التحقق من مخطط Pydantic
  البحث والتطوير LLMOps تحليل السجل القائم على GPT، الخدمة ذاتية الشفاء
  البنية التحتية السحابية جدولة GPU/NPU الهجينة، HA متعدد المناطق
  هندسة البيانات بناء CDC + Iceberg Lakehouse في الوقت الفعلي

طريقة التقديم

  1. رابط GitHub / مدونة تقنية — الالتزامات هي خطاب التغطية الخاص بك.
  2. مشروع بأي تنسيق — Jupyter، Dockerfile، مخططات Helm كلها مرحب بها.
  3. خبرة Three Vs في سطر واحد — مثل، “تعطل النموذج في الساعة 3 صباحاً لكن تم التراجع في 5 دقائق🏃‍♂️”.

في انتظارك للنمو معاً

إذا كانت السرعة · التحقق · الإصدار تجعل معدل ضربات قلبك يرتفع، فلنلتقي في git push origin thakicloud.
مع ThakiCloud، أضف فصلاً جديداً إلى مهنتك.