<?xml version="1.0" encoding="utf-8"?><feed xmlns="http://www.w3.org/2005/Atom" ><generator uri="https://jekyllrb.com/" version="4.4.1">Jekyll</generator><link href="https://thakicloud.github.io/feed.xml" rel="self" type="application/atom+xml" /><link href="https://thakicloud.github.io/" rel="alternate" type="text/html" /><updated>2026-07-01T14:05:50+09:00</updated><id>https://thakicloud.github.io/feed.xml</id><title type="html">Thaki Cloud Tech Blog | ThakiCloud | 다키클라우드 기술 블로그</title><subtitle>Thaki Cloud (ThakiCloud, 다키클라우드, thaki cloud, THAKI CLOUD, ثاكي كلاود)는 AI/ML Engineering, LLMOps, DevOps 분야의 최신 기술과 실무 경험을 공유하는 전문 기술 블로그입니다. 머신러닝 모델 운영, 쿠버네티스, 클라우드 인프라, AI 엔지니어링 커리어, 인공지능 기술 블로그, 다키클라우드 개발 팀의 깊이 있는 인사이트를 제공합니다. مدونة تقنية متخصصة في هندسة الذكاء الاصطناعي والحوسبة السحابية.</subtitle><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><entry xml:lang="ar"><title type="html">خمسة نماذج أصيلة تبقى حين تذوب حدود الوظائف: من المبتكر حتى الصائن</title><link href="https://thakicloud.github.io/ar/culture/five-product-role-archetypes/" rel="alternate" type="text/html" title="خمسة نماذج أصيلة تبقى حين تذوب حدود الوظائف: من المبتكر حتى الصائن" /><published>2026-07-01T00:00:00+09:00</published><updated>2026-07-01T00:00:00+09:00</updated><id>https://thakicloud.github.io/ar/culture/five-product-role-archetypes</id><content type="html" xml:base="https://thakicloud.github.io/ar/culture/five-product-role-archetypes/"><![CDATA[<p><img src="/assets/images/five-product-role-archetypes-hero.png" alt="تصور تجريدي يجسد تلاشي حدود الوظائف وبروز نماذج أصيلة جديدة للأدوار" /></p>

<h2 id="نظرة-عامة">نظرة عامة</h2>

<p>يتكرر مشهد بات مألوفا: المسمى الوظيفي لا يصف بعد الآن ما يفعله صاحبه فعلا. المصمم يكتب نماذج أولية بالكود، والمهندس يجري مقابلات مع المستخدمين، وعالم البيانات يحسم اتجاه المنتج. مع امتصاص أدوات الذكاء الاصطناعي للجانب الميكانيكي من كل وظيفة، تتداخل حدود الهندسة والمنتج والتصميم والتحليل وتذوب في كتلة واحدة.</p>

<p>أمام هذا التحول، رصد Boris Cherny صانع Claude Code ملاحظة لافتة: حين أمعن النظر في فريق Claude Code الذي ينتمي إليه، وجد خمسة نماذج أصيلة للأدوار تتشكل بمعزل عن الوظائف الرسمية. وأهمية هذه الملاحظة بسيطة: إنها تطرح فرضية مفادها أن منظمات المستقبل قد تبني فرقها على أساس هذه النماذج لا على أساس الوظائف التقليدية.</p>

<p>يتناول هذا المقال ماهية النماذج الخمسة، وسبب انفصالها عن الوظائف الرسمية، والتركيبة اللازمة منها في كل مرحلة من مراحل نضج المنتج. هذا ليس ملخصا تقنيا، بل مقال ثقافي يتساءل: كيف نبني الفرق وكيف ننظر إلى التوظيف؟ وهو سؤال مباشر بصفة خاصة لمنظمات كـ ThakiCloud حيث يعمل البشر والوكلاء الآليون جنبا إلى جنب.</p>

<h2 id="النماذج-الأصيلة-الخمسة">النماذج الأصيلة الخمسة</h2>

<p>النماذج التي صاغها Cherny هي كالتالي، مع توضيح كيف يظهر كل نموذج في الفرق الفعلية.</p>

<p><strong>المبتكر (Prototyper)</strong> هو من يتصور أفكارا جديدة كليا. يطرح أفكارا بكثافة، لكن معظمها لا يصل إلى الإطلاق. قيمة هذا النموذج ليست في معدل نجاحه، بل في كثافة الأفكار التي ينتجها. حتى لو رُفض تسعة من كل عشرة أفكار، فإن غياب من يفتح آفاقا جديدة يعني توقف المنظمة عن التقدم إلى أراض مجهولة.</p>

<p><strong>المنفذ (Builder)</strong> هو من يحول النماذج الأولية والأفكار بسرعة إلى منتجات أو بنية تحتية جاهزة للإنتاج. دوره تضييق المسافة بين الفكرة والإطلاق. إن كان المبتكر يرسم المخططات، فالمنفذ يحول تلك المخططات إلى مبانٍ قائمة.</p>

<p><strong>المنظف (Sweeper)</strong> هو المرتب بامتياز: يصقل الواجهات المبعثرة، ويبسط الكود والأنظمة، ويزيل الميزات غير المستخدمة، ويرفع الأداء. عمله الحذف لا الإضافة. قرار إلغاء ميزة (unship) يستدعي شجاعة لا تقل عن شجاعة بنائها.</p>

<p><strong>المنمي (Grower)</strong> يأخذ منتجا قائما ويحسنه باستمرار لرفع مستوى الملاءمة مع السوق (PMF). لا يعيد رسم اللوحة من الصفر، بل يعمل على الصورة الموجودة ليرفع معدلات التحويل ويخفض الاضطراب ويراكم تحسينات صغيرة.</p>

<p><strong>الصائن (Maintainer)</strong> هو من يتملك الأنظمة الناضجة. يحافظ على الأمن والاستقرار والسرعة والكفاءة مع تنامي الأنظمة. لا بريق في عمله، لكن من دونه ينهار المنتج الناجح تحت ثقله.</p>

<pre><code class="language-mermaid">flowchart TB
    P["المبتكر (Prototyper)&lt;br/&gt;يولد أفكارا جديدة"]
    B["المنفذ (Builder)&lt;br/&gt;يحول إلى منتج جاهز للإنتاج"]
    S["المنظف (Sweeper)&lt;br/&gt;التبسيط والترتيب والأداء"]
    G["المنمي (Grower)&lt;br/&gt;تحسين PMF بصفة مستمرة"]
    M["الصائن (Maintainer)&lt;br/&gt;الأمن والاستقرار والتوسع"]
    P --&gt; B
    B --&gt; S
    S --&gt; G
    G --&gt; M
    M -.الصيانة وإعادة الاختراع.-&gt; B
</code></pre>

<h2 id="النموذج-ليس-وظيفة">النموذج ليس وظيفة</h2>

<p>جوهر هذه الملاحظة ليس القائمة في حد ذاتها، بل حقيقة أن هذه النماذج لا ترتبط بالوظائف الرسمية. يقول Cherny إنه حين ينظر إلى Anthropic في مجملها يجد بعض المصممين ينتمون إلى النموذج الأول (المبتكر)، وآخرين إلى الثاني (المنفذ)، وغيرهم إلى الثالث (المنظف). والأمر ذاته ينطبق على المهندسين ومديري المنتجات وعلماء البيانات.</p>

<p>بمعنى آخر، تفقد عبارة “نوظف مصمما” من معناها يوما بعد يوم. فالمصمم المبتكر الذي يفتح آفاقا جديدة يختلف اختلافا جذريا في طريقة إسهامه عن المصمم المنظف الذي يصقل ويكمل. المسمى الوظيفي يخبرك بالأدوات التي تعلمها، لكنه لا يخبرك بالحظة التي يتألق فيها.</p>

<p>كثيرون يجمعون بين نموذجين، وأحيانا ثلاثة. من يجمع بين المبتكر والمنفذ نادر وثمين في الشركات الناشئة المبكرة. ومن يجمع بين المنظف والصائن يشكل عمود فقري فرق البنية التحتية الناضجة. بدلا من حشر كل شخص في صندوق واحد، الأدق أن ننظر إلى الطيف الذي يقع عليه في هذه النماذج.</p>

<h2 id="تشكيل-الفرق-وفق-دورة-حياة-المنتج">تشكيل الفرق وفق دورة حياة المنتج</h2>

<p>السبب الحقيقي لأهمية هذه النماذج هو أنها تصبح صيغة لتشكيل الفرق. يرى Cherny أن الفريق الصحي يحتاج إلى تركيبة مختلفة من النماذج وفق درجة نضج المنتج.</p>

<p>المنتج الجديد الذي لم يجد بعد ملاءمته مع السوق يحتاج إلى أشخاص أقوياء في النماذج الأول والثاني والثالث (المبتكر + المنفذ + المنظف). في هذه المرحلة لا أحد يعرف ما الصواب، لذا القدرة على البناء السريع والتخلي السريع وتغيير الاتجاه باستمرار هي ما يهم. تجميع أشخاص ذوي ميول صون قوية في هذه المرحلة يعني صون ما لم يُبن بعد.</p>

<p>المنتج في طور النمو بعد تحقيق الملاءمة مع السوق يحتاج إلى النماذج الثاني والثالث والرابع (المنفذ + المنظف + المنمي) مع جرعة من النموذج الخامس (الصائن). الاتجاه معروف الآن، فالمهمة رفع الجودة وتحسين التحويل مع قدر أدنى من الاستقرار لاستيعاب المستخدمين المتزايدين.</p>

<p>المنتج الناضج ذو الملاءمة القوية مع السوق يحتاج إلى النماذج الثالث والرابع والخامس (المنظف + المنمي + الصائن) مع جرعة من النموذج الثاني (المنفذ). المهمة إبقاء النظام بسيطا، والتحسين المستمر، والحفاظ على الأمن والسرعة في مستويات التوسع، مع البناء الجديد حين يلزم فحسب.</p>

<pre><code class="language-mermaid">flowchart TB
    PRE["قبل PMF&lt;br/&gt;منتج جديد"]
    GROW["مرحلة النمو&lt;br/&gt;تحقق PMF"]
    MATURE["مرحلة النضج&lt;br/&gt;PMF قوي"]
    PRE --&gt;|"المبتكر + المنفذ + المنظف"| GROW
    GROW --&gt;|"المنفذ + المنظف + المنمي (+ جرعة الصائن)"| MATURE
    MATURE --&gt;|"المنظف + المنمي + الصائن (+ جرعة المنفذ)"| MATURE
</code></pre>

<p>الدلالة العملية لهذه الصيغة واضحة: حين تضيف شخصا إلى الفريق، السؤال الأول ليس “هل يعاني الفريق من نقص في المهندسين؟” بل “أي نموذج يغيب عن فريقنا في هذه المرحلة؟” إشباع فريق منتج ناضج بالمبتكرين يعني فيضا من الأفكار الجديدة دون من يصون النظام. والعكس، جمع الصائنين في منتج لم يجد ملاءمته بعد يعني التحصن لحماية ما لا وجود له أصلا.</p>

<h2 id="منظور-thakicloud-إعادة-رسم-الأدوار-في-عصر-الوكلاء">منظور ThakiCloud: إعادة رسم الأدوار في عصر الوكلاء</h2>

<p>الملاحظة القائلة بأن حدود الوظائف تذوب تصبح أحد المشهدية في المنظمات التي يعمل فيها البشر والوكلاء جنبا إلى جنب. حين تستوعب وكلاء الذكاء الاصطناعي حصة وافرة من عمليات البناء الميكانيكية، ينجرف البشر تلقائيا نحو النماذج الأصيلة الأكثر أهمية في كل مرحلة من مراحل المنتج. العنق الزجاجي لن يكون الأيدي التي تكتب الكود، بل العقول التي تشخص أي نموذج تحتاجه اللحظة.</p>

<p>Paxis، الحوسبة السحابية Native للوكلاء التي تشغلها ThakiCloud، تجسد هذا التحول على مستوى طبقة النظام. تعامل Paxis المهارات والأدوات والسياسات وسجلات التدقيق بوصفها موارد من الدرجة الأولى، وتختار أكثر من 960 مهارة عبر BM25 وتنفذها في بيئات معزولة. كما قال Cherny إن الأشخاص تُعاد صياغتهم وفق لحظات المنتج لا وفق مسمياتهم الوظيفية، كذلك تُجمع Paxis قدرات الوكلاء ديناميكيا وفق متطلبات المهمة لا وفق خطوط أنابيب جامدة. المبتكر يطرح الأفكار، فيحولها وكيل بدور المنفذ إلى كود جاهز للإنتاج، ثم يرتب بوابة التحقق بدور المنظف المخرجات، وكل ذلك يتكرر داخل حزمة المهارات.</p>

<p>على صعيد البنية التحتية، يضطلع ai-platform من ThakiCloud بالعمل الكامل للنموذج الصائن. جدولة وحدات GPU عبر Kueue، وتقديم النماذج عبر vLLM، والوفاء بمتطلبات الخصوصية والسيادة في بيئات K8s متعددة المستأجرين: كل ذلك هو بالضبط عمل الصائن الذي يحفظ الأمن والاستقرار والكفاءة في الأنظمة الناضجة. تفويض منظمات العملاء لهذا الجانب إلى المنصة يتيح لفرقهم الانتشار أكثر في اتجاه المبتكرين والمنميين.</p>

<p>هذا المنظور مفيد للتوظيف أيضا. تنظر ThakiCloud إلى المتقدمين من زاوية أي نموذج يمثلون، لا من زاوية مسمياتهم في السيرة الذاتية. الشخص الذي يملأ النموذج الغائب عن مرحلتنا الحالية هو من يخلق أكبر قدر من الرافعة للفريق. السؤال ليس “ماذا تحسن؟” فحسب، بل “أي لحظة تتألق فيها؟”</p>

<h2 id="حدود-الإطار-والحجج-المضادة">حدود الإطار والحجج المضادة</h2>

<p>قبل قبول هذا الإطار دون نقد، تستحق الحجج المقابلة الاستماع. أشار Ben Vinegar في السياق ذاته إلى أن “الناس يكتشفون كيف تعمل منظمات البرمجيات للتو، ثم يخطئون في عزو ديناميكيات الفرق القديمة إلى الذكاء الاصطناعي.” اعتراض حاد ومشروع: التمييز بين المبتكر والصائن موجود منذ ما قبل الذكاء الاصطناعي، وأن درجة نضج المنتج تحدد نوع الموهبة المطلوبة ليست فكرة جديدة.</p>

<p>ثمة حدود للتصنيف في حد ذاته. كل محاولة لوضع الناس في خمسة صناديق تعاني من خطر تبسيط الأفراد تبسيطا مفرطا. في الواقع، يتنقل الشخص الواحد بين عدة نماذج من مشروع لآخر، بل خلال اليوم الواحد. الخطأ هو النظر إلى النماذج بوصفها هويات ثابتة، فيصدر حكم من قبيل “أنت منظف إذن لا تقترح أفكارا جديدة”، وهذا عكس الغرض تماما. لهذا شدد Cherny نفسه على أن كثيرين يجمعون بين نماذج متعددة.</p>

<p>ومع ذلك، تبقى قيمة هذا الإطار في اللغة التي يمنحها لا في قدرته التنبؤية. حين يصبح بإمكانك القول “يعاني فريقنا من نقص في المنمين” بدلا من “نحتاج مزيدا من المهندسين”، تنتقل محادثات التوظيف وتشكيل الفرق إلى مستوى أكثر دقة وجدوى. كلما جردت الذكاء الاصطناعي الوظائف من طبقتها الميكانيكية، كلما كان ما يبقى هو الأحكام على مستوى هذه النماذج. أدوار المنتج في المستقبل قد تشبه هذه النماذج أكثر مما تشبه المسميات الوظيفية اليوم.</p>

<h2 id="خاتمة">خاتمة</h2>

<p>ذوبان حدود الوظائف ليس أزمة، بل إعادة تشكيل. النماذج الخمسة: المبتكر والمنفذ والمنظف والمنمي والصائن تكشف ما يبقى حين تختفي المسميات الوظيفية. ما يبقى ليس الأدوات، بل جوهر السؤال: في أي لحظة وبأي طريقة يقدم الشخص إسهامه؟</p>

<p>تبني ThakiCloud منظمة يتقاسم فيها البشر والوكلاء هذه النماذج. كلما تولت الوكلاء قدرا أكبر من عمليات البناء والصون المتكررة، كلما تركزت قدرة البشر على قراءة أي نموذج تحتاجه مرحلة المنتج الراهنة. تلك القراءة ستكون أثمن القدرات في العقد القادم.</p>

<h2 id="المصادر">المصادر</h2>

<ul>
  <li>Boris Cherny, X(@bcherny), 2026-06-29: <a href="https://x.com/bcherny/status/2071379474277613732">التغريدة الأصلية</a></li>
  <li>Ben Vinegar, X(@bentlegen): <a href="https://x.com/bentlegen/status/2071576459538567463">تغريدة الرد والاعتراض</a></li>
</ul>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="culture" /><category term="مستقبل-العمل" /><category term="ثقافة-تنظيمية" /><category term="فريق-المنتج" /><category term="توظيف" /><category term="Boris Cherny" /><category term="Claude Code" /><summary type="html"><![CDATA[في عصر تتشابك فيه الهندسة والمنتج والتصميم والبيانات في كتلة واحدة، يستعرض هذا المقال النماذج الأصيلة الخمسة التي رصدها Boris Cherny صانع Claude Code، وصيغة تشكيل الفرق وفق مرحلة نضج المنتج.]]></summary></entry><entry xml:lang="en"><title type="html">The Future of Work: Five Archetypes, Not Job Titles</title><link href="https://thakicloud.github.io/en/comics/five-work-archetypes/" rel="alternate" type="text/html" title="The Future of Work: Five Archetypes, Not Job Titles" /><published>2026-07-01T00:00:00+09:00</published><updated>2026-07-01T00:00:00+09:00</updated><id>https://thakicloud.github.io/en/comics/five-work-archetypes</id><content type="html" xml:base="https://thakicloud.github.io/en/comics/five-work-archetypes/"><![CDATA[<p>Roles blur into prototyper, builder, sweeper, grower, maintainer — and nobody wants the sixth.</p>

<p><img src="/assets/images/posts/comics/five-work-archetypes/strip.png" alt="The Future of Work: Five Archetypes, Not Job Titles" /></p>

<blockquote>
  <p>Source: <a href="https://x.com/bcherny">Boris Cherny on the five archetypes of future roles</a> · twitter</p>
</blockquote>

<hr />

<p><em>An auto-generated comic riffing on this week’s industry news.</em></p>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="comics" /><category term="future-of-work" /><category term="engineering-roles" /><category term="AI" /><category term="on-prem" /><category term="ThakiCloud" /><summary type="html"><![CDATA[Roles blur into prototyper, builder, sweeper, grower, maintainer — and nobody wants the sixth.]]></summary><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://thakicloud.github.io/assets/images/posts/comics/five-work-archetypes/strip.png" /><media:content medium="image" url="https://thakicloud.github.io/assets/images/posts/comics/five-work-archetypes/strip.png" xmlns:media="http://search.yahoo.com/mrss/" /></entry><entry xml:lang="en"><title type="html">Five Archetypes That Remain When Job Titles Dissolve: From Prototyper to Maintainer</title><link href="https://thakicloud.github.io/en/culture/five-product-role-archetypes/" rel="alternate" type="text/html" title="Five Archetypes That Remain When Job Titles Dissolve: From Prototyper to Maintainer" /><published>2026-07-01T00:00:00+09:00</published><updated>2026-07-01T00:00:00+09:00</updated><id>https://thakicloud.github.io/en/culture/five-product-role-archetypes</id><content type="html" xml:base="https://thakicloud.github.io/en/culture/five-product-role-archetypes/"><![CDATA[<p><img src="/assets/images/five-product-role-archetypes-hero.png" alt="Abstract visual depicting the blurring of role boundaries and the emergence of new archetypes" /></p>

<h2 id="overview">Overview</h2>

<p>Job titles are increasingly failing to describe the actual work. Designers shipping prototypes as code, engineers conducting user interviews, data scientists setting product direction – none of this feels strange anymore. As AI tools absorb the mechanical layers of each discipline, the boundaries between engineering, product, design, and data analysis are melting together.</p>

<p>Boris Cherny, creator of Claude Code, offered an interesting observation about this shift. Looking at his own Claude Code team, he noticed five role archetypes cutting across job functions. The reason this observation matters is simple: it raises a hypothesis that future organizations may staff teams around combinations of these archetypes rather than around functional job categories.</p>

<p>This post unpacks what those five archetypes are, why they detach from formal job titles, and what combinations a team needs at different stages of product maturity. This is not a technical summary – it is a culture essay asking how we should think about team composition and hiring. For organizations like ThakiCloud, where humans and agents work side by side, the question is particularly direct.</p>

<h2 id="the-five-role-archetypes">The Five Role Archetypes</h2>

<p>Cherny’s archetypes are as follows. For each one, some notes on how it shows up in real teams.</p>

<p><strong>The Prototyper</strong> generates entirely new ideas. This person produces a flood of concepts, most of which never ship. The value of this archetype lies not in a high success rate but in the density of imagination. Without someone who can open a new direction – even if nine out of ten ideas get discarded – an organization cannot push into new territory.</p>

<p><strong>The Builder</strong> converts prototypes and ideas into production-grade products or infrastructure, quickly. This is the role that closes the distance between conception and launch. If the Prototyper is the sketch, the Builder is the one who turns that sketch into a building that actually stands.</p>

<p><strong>The Sweeper</strong> tidies things up. Polishing messy UIs, simplifying code and systems, removing unused features, improving performance – the Sweeper’s job is subtraction, not addition. Deciding to unship a feature takes just as much courage as building one.</p>

<p><strong>The Grower</strong> takes an existing product and iterates relentlessly to improve PMF. Rather than redesigning the whole board, this person raises conversion, reduces churn, and accumulates small improvements on top of what already exists.</p>

<p><strong>The Maintainer</strong> owns mature systems. This archetype keeps security, stability, speed, and efficiency intact as a system scales. Not glamorous work, but without it a grown product collapses under its own weight.</p>

<pre><code class="language-mermaid">flowchart TB
    P["Prototyper&lt;br/&gt;churns out new ideas"]
    B["Builder&lt;br/&gt;converts to production-grade"]
    S["Sweeper&lt;br/&gt;simplify, tidy, performance"]
    G["Grower&lt;br/&gt;iterates toward PMF"]
    M["Maintainer&lt;br/&gt;keeps security, stability, scale"]
    P --&gt; B
    B --&gt; S
    S --&gt; G
    G --&gt; M
    M -.maintain / reinvent.-&gt; B
</code></pre>

<h2 id="these-are-roles-not-job-titles">These Are Roles, Not Job Titles</h2>

<p>The heart of this observation is not the list itself – it is that these archetypes do not map to job functions. Cherny notes that across Anthropic, some designers fall into archetype 1 (Prototyper), others into archetype 2 (Builder), and still others into archetype 3 (Sweeper). The same is true for engineers, product managers, and data scientists.</p>

<p>Put differently, “we’re hiring a designer” is a sentence that carries less and less information. Two designers can contribute to a team in completely different ways depending on whether they are the Prototyper type who opens new territory or the Sweeper type who refines and completes. A job title tells you what tools someone has learned; it does not tell you which moments they shine in.</p>

<p>Many people straddle two archetypes, and some span three. Someone who is both Prototyper and Builder is especially valuable in an early-stage startup. Someone who combines Sweeper and Maintainer becomes the backbone of a mature infrastructure team. Rather than fitting a person into a single box, it is more accurate to think about where they fall on the spectrum of these archetypes.</p>

<h2 id="team-composition-by-product-lifecycle">Team Composition by Product Lifecycle</h2>

<p>The real reason these archetypes are interesting is that they become a formula for staffing. Cherny argues that a healthy team needs a different archetype mix depending on product maturity.</p>

<p>A new product that has not yet found PMF needs people strong in Prototyper, Builder, and Sweeper (1 + 2 + 3). At this stage nobody knows what will work, so the capacity to build fast, discard fast, and keep changing direction is what counts. Filling this team with people who are primarily Maintainers means spending energy defending something that does not yet exist.</p>

<p>A growing product that has found PMF needs Builder, Sweeper, and Grower (2 + 3 + 4) plus a light Maintainer presence (5). Direction is established; the task now is to improve completeness and conversion while securing just enough stability to handle the expanding user base.</p>

<p>A mature product with strong PMF needs Sweeper, Grower, and Maintainer (3 + 4 + 5) with a sprinkling of Builder (2). The priority is keeping the system simple, improving it continuously, and protecting security and speed at scale – with new builds only when genuinely necessary.</p>

<pre><code class="language-mermaid">flowchart TB
    PRE["Pre-PMF&lt;br/&gt;new product"]
    GROW["Growth stage&lt;br/&gt;PMF found"]
    MATURE["Maturity&lt;br/&gt;strong PMF"]
    PRE --&gt;|"Prototyper + Builder + Sweeper"| GROW
    GROW --&gt;|"Builder + Sweeper + Grower (+ light Maintainer)"| MATURE
    MATURE --&gt;|"Sweeper + Grower + Maintainer (+ light Builder)"| MATURE
</code></pre>

<p>The practical implication of this formula is clear. When adding someone to the team, the first question should not be “do we need more engineers?” but “which archetype is missing for our current product stage?” Keep filling a mature product team with Prototypers and you will have no shortage of new ideas but nobody guarding the system. Fill a pre-PMF product team with only Maintainers and you will be in a defensive posture before there is anything worth defending.</p>

<h2 id="thakiclouds-take-role-realignment-in-the-age-of-agents">ThakiCloud’s Take: Role Realignment in the Age of Agents</h2>

<p>The observation that job roles are dissolving becomes sharper still in organizations where humans and agents work together. As AI agents absorb a significant share of mechanical build work, people naturally migrate toward the archetypes that are genuinely important at each product stage. The bottleneck shifts from the hands that type the code to the eye that judges which archetype is needed right now.</p>

<p>Paxis, ThakiCloud’s Agent-Native Cloud, implements this realignment at the systems layer. Paxis treats Skills, Tools, Policies, and Audit Logs as first-class resources, selecting from over 960 skills using BM25 and executing them in isolated sandboxes. Just as Cherny describes recombining human roles to fit the product moment rather than a fixed title, Paxis dynamically assembles agent capabilities to match the task at hand rather than locking them into a fixed pipeline. A Prototyper pours out ideas, a Builder-role agent converts them to production code, and a Sweeper-role validation gate cleans up the result – the same division of labor reproduced inside the skill harness.</p>

<p>On the infrastructure side, ThakiCloud’s ai-platform takes on the Maintainer archetype’s workload. Scheduling GPUs with Kueue, serving models with vLLM, and satisfying on-premises and sovereign requirements in a K8s-based multi-tenant environment – this is precisely the Maintainer’s job of protecting security, stability, and efficiency in a mature system. Customer organizations delegate this layer to the platform, which frees their own teams to concentrate more resources on the Prototyper and Grower ends of the spectrum.</p>

<p>This lens is also useful for hiring. ThakiCloud looks past the job title on a resume to ask where on the archetype spectrum a candidate actually sits. The person who fills the missing archetype for our current product stage creates the greatest leverage in the team. The question is not only “what can you do?” but “which moments are when you shine?”</p>

<h2 id="limitations-and-counterpoints">Limitations and Counterpoints</h2>

<p>Before accepting this framework uncritically, the other side deserves a hearing. Ben Vinegar pushed back on this conversation, arguing that “people are just learning how software organizations work and mistakenly attributing the dynamics of team roles – which have always existed – to AI.” That is a sharp counterpoint. The distinction between Prototyper and Maintainer existed long before AI, and the insight that different talent profiles are needed at different lifecycle stages is not a new one.</p>

<p>There are also limits to the classification itself. Like any attempt to sort people into five boxes, this framework risks oversimplifying individuals. In practice, one person moves across multiple archetypes from project to project, sometimes within a single day. Treating archetypes as fixed identities produces a harmful effect of the kind: “you’re a Sweeper, so don’t come to me with new ideas.” This is precisely why Cherny himself emphasizes that many people move fluidly across archetypes.</p>

<p>Even so, the framework earns its value not from predictive power but from the language it provides. When a team can say “we’re short on Growers right now” instead of the vague “we need another engineer,” the conversation around hiring and team composition becomes far more concrete. The more AI strips away the mechanical layer of each role, the more what remains is judgment at the archetype level. Future product roles may end up shaped closer to these archetypes than to today’s domain-specific job titles.</p>

<h2 id="closing-thoughts">Closing Thoughts</h2>

<p>Job titles dissolving is not a crisis – it is a restructuring. The five archetypes – Prototyper, Builder, Sweeper, Grower, Maintainer – show what remains when titles fall away. What remains is not a toolset but an essence: how a person contributes, and in which moments.</p>

<p>ThakiCloud is building an organization where humans and agents share these archetypes. The more agents take on repeatable build and maintenance work, the more humans focus on reading which archetype the product needs right now. That judgment is the rarest and most valuable capability in what comes next.</p>

<h2 id="sources">Sources</h2>

<ul>
  <li>Boris Cherny, X(@bcherny), 2026-06-29: <a href="https://x.com/bcherny/status/2071379474277613732">Original tweet</a></li>
  <li>Ben Vinegar, X(@bentlegen): <a href="https://x.com/bentlegen/status/2071576459538567463">Counterpoint</a></li>
</ul>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="culture" /><category term="future-of-work" /><category term="organizational-culture" /><category term="product-teams" /><category term="hiring" /><category term="Boris Cherny" /><category term="Claude Code" /><summary type="html"><![CDATA[As engineering, product, design, and data blur into a single mass, Boris Cherny, the creator of Claude Code, proposes five role archetypes and a team-composition formula tied to product lifecycle stage.]]></summary></entry><entry xml:lang="ko"><title type="html">직무가 녹아내린 자리에 남는 다섯 가지 원형: 프로토타이퍼부터 메인테이너까지</title><link href="https://thakicloud.github.io/ko/culture/five-product-role-archetypes/" rel="alternate" type="text/html" title="직무가 녹아내린 자리에 남는 다섯 가지 원형: 프로토타이퍼부터 메인테이너까지" /><published>2026-07-01T00:00:00+09:00</published><updated>2026-07-01T00:00:00+09:00</updated><id>https://thakicloud.github.io/ko/culture/five-product-role-archetypes</id><content type="html" xml:base="https://thakicloud.github.io/ko/culture/five-product-role-archetypes/"><![CDATA[<p><img src="/assets/images/five-product-role-archetypes-hero.png" alt="직무의 경계가 흐려지고 새로운 역할 원형이 떠오르는 모습을 담은 추상 비주얼" /></p>

<h2 id="개요">개요</h2>

<p>직함이 하는 일을 설명하지 못하는 순간이 점점 늘고 있습니다. 디자이너가 프로토타입을 코드로 짜고, 엔지니어가 사용자 인터뷰를 하고, 데이터 과학자가 제품 방향을 정하는 장면이 이제 낯설지 않습니다. AI 도구가 각 직무의 기계적인 부분을 흡수하면서 엔지니어링, 제품, 디자인, 데이터 분석의 경계가 한 덩어리로 녹아내리고 있습니다.</p>

<p>이 흐름을 두고 Claude Code를 만든 보리스 체르니(Boris Cherny)가 흥미로운 관찰을 내놓았습니다. 자신이 속한 Claude Code 팀을 들여다보니 직무와 무관하게 다섯 가지 역할 원형이 보이더라는 것입니다. 이 관찰이 중요한 이유는 단순합니다. 앞으로의 조직이 직무 기능이 아니라 이런 원형의 조합으로 팀을 짜게 될지 모른다는 가설을 던지기 때문입니다.</p>

<p>이 글은 그 다섯 가지 원형이 무엇인지, 왜 직무와 분리되는지, 그리고 제품의 성숙도에 따라 어떤 조합이 필요한지를 정리합니다. 기술 요약이 아니라 팀을 어떻게 구성하고 채용을 어떻게 바라볼지를 묻는 문화 에세이입니다. ThakiCloud처럼 사람과 에이전트가 함께 일하는 조직에는 특히 직접적인 질문입니다.</p>

<h2 id="다섯-가지-역할-원형">다섯 가지 역할 원형</h2>

<p>체르니가 제시한 원형은 다음과 같습니다. 각각을 우리말로 옮기면서 실제 팀에서 어떻게 드러나는지 덧붙였습니다.</p>

<p><strong>프로토타이퍼(Prototyper)</strong>는 완전히 새로운 아이디어를 떠올리는 사람입니다. 수많은 아이디어를 쏟아내지만 대부분은 출시되지 못합니다. 이 원형의 가치는 성공률이 아니라 발상의 밀도에 있습니다. 열 개 중 아홉 개가 버려지더라도 하나의 방향을 여는 사람이 없으면 조직은 새 영토로 나아가지 못합니다.</p>

<p><strong>빌더(Builder)</strong>는 프로토타입과 아이디어를 빠르게 프로덕션급 제품이나 인프라로 전환하는 사람입니다. 발상과 출시 사이의 거리를 좁히는 역할입니다. 프로토타이퍼가 스케치라면 빌더는 그 스케치를 실제로 서 있는 건물로 바꿉니다.</p>

<p><strong>스위퍼(Sweeper)</strong>는 정리하는 사람입니다. 어수선한 UI를 다듬고, 코드와 시스템을 단순하게 만들고, 쓰이지 않는 기능을 걷어내고, 성능을 끌어올립니다. 무언가를 더하는 것이 아니라 덜어내는 것이 이 원형의 일입니다. 기능을 없애는 결정(unship)은 만드는 것만큼이나 용기가 필요합니다.</p>

<p><strong>그로어(Grower)</strong>는 이미 만들어진 제품을 가져와 제품-시장 적합성(PMF)을 높이기 위해 반복적으로 개선하는 사람입니다. 큰 판을 새로 짜기보다 이미 있는 판에서 전환율을 끌어올리고, 사용자 이탈을 막고, 작은 개선을 쌓아 올립니다.</p>

<p><strong>메인테이너(Maintainer)</strong>는 성숙한 시스템을 소유하는 사람입니다. 시스템이 커질 때 보안, 안정성, 속도, 효율을 유지합니다. 화려하지 않지만 이 원형이 없으면 성장한 제품은 자기 무게에 눌려 무너집니다.</p>

<pre><code class="language-mermaid">flowchart TB
    P["프로토타이퍼&lt;br/&gt;새 아이디어를 쏟아냄"]
    B["빌더&lt;br/&gt;프로덕션급으로 전환"]
    S["스위퍼&lt;br/&gt;단순화·정리·성능"]
    G["그로어&lt;br/&gt;PMF 반복 개선"]
    M["메인테이너&lt;br/&gt;보안·안정·확장 유지"]
    P --&gt; B
    B --&gt; S
    S --&gt; G
    G --&gt; M
    M -.보수·재발명.-&gt; B
</code></pre>

<h2 id="역할은-직무가-아닙니다">역할은 직무가 아닙니다</h2>

<p>이 관찰의 핵심은 목록 자체가 아니라, 이 원형들이 직무 기능과 연결되지 않는다는 점입니다. 체르니는 Anthropic 전체를 보면 어떤 디자이너는 프로토타이퍼(1번)에, 어떤 디자이너는 빌더(2번)에, 또 어떤 디자이너는 스위퍼(3번)에 해당한다고 말합니다. 엔지니어도, 제품 관리자도, 데이터 과학자도 마찬가지입니다.</p>

<p>바꿔 말하면 “디자이너를 뽑는다”는 문장이 점점 정보량을 잃고 있습니다. 같은 디자이너라도 새 영토를 여는 프로토타이퍼형인지, 다듬어 완성하는 스위퍼형인지에 따라 팀에 기여하는 방식이 완전히 다릅니다. 직함은 그가 배운 도구를 알려줄 뿐, 그가 어떤 순간에 빛나는지는 알려주지 않습니다.</p>

<p>많은 사람이 두 개의 원형을 넘나들고, 때로는 세 개까지 걸칩니다. 프로토타이퍼이면서 빌더인 사람이 초기 스타트업에서 특히 귀합니다. 스위퍼이면서 메인테이너인 사람은 성숙한 인프라 팀의 척추가 됩니다. 한 사람을 하나의 상자에 가두는 대신 그가 어떤 원형의 스펙트럼 위에 있는지를 보는 편이 실제에 더 가깝습니다.</p>

<h2 id="제품-생애주기별-팀-구성">제품 생애주기별 팀 구성</h2>

<p>원형이 흥미로운 진짜 이유는 이것이 팀 구성의 공식이 되기 때문입니다. 체르니는 건강한 팀이라면 제품의 성숙도에 따라 다른 원형 조합이 필요하다고 정리합니다.</p>

<p>새롭고 아직 PMF를 찾지 못한 제품은 프로토타이퍼, 빌더, 스위퍼(1+2+3)에 강한 사람들이 필요합니다. 아직 무엇이 맞는지 모르는 단계이므로 빠르게 만들고, 빠르게 버리고, 방향을 계속 바꾸는 힘이 중요합니다. 이 단계에서 메인테이너 성향이 강한 사람만 모으면 만들어지지도 않은 것을 지키느라 움직이지 못합니다.</p>

<p>성장 중이고 PMF를 찾은 제품은 빌더, 스위퍼, 그로어(2+3+4)에 약간의 메인테이너(5)가 필요합니다. 방향은 잡혔으니 이제 완성도를 높이고 전환을 개선하면서, 늘어나는 사용자를 감당할 최소한의 안정성을 확보해야 합니다.</p>

<p>강한 PMF를 가진 성숙한 제품은 스위퍼, 그로어, 메인테이너(3+4+5)에 약간의 빌더(2)가 필요합니다. 시스템을 단순하게 유지하고, 지속적으로 개선하고, 커지는 규모에서 보안과 속도를 지키되, 필요할 때만 새로운 것을 짓습니다.</p>

<pre><code class="language-mermaid">flowchart TB
    PRE["PMF 이전&lt;br/&gt;새 제품"]
    GROW["성장기&lt;br/&gt;PMF 확보"]
    MATURE["성숙기&lt;br/&gt;강한 PMF"]
    PRE --&gt;|"프로토타이퍼+빌더+스위퍼"| GROW
    GROW --&gt;|"빌더+스위퍼+그로어 (+약간의 메인테이너)"| MATURE
    MATURE --&gt;|"스위퍼+그로어+메인테이너 (+약간의 빌더)"| MATURE
</code></pre>

<p>이 공식이 알려주는 실무적 함의는 분명합니다. 팀에 사람을 더할 때 “엔지니어가 부족하다”가 아니라 “지금 우리 제품 단계에 어떤 원형이 비어 있는가”를 먼저 물어야 한다는 것입니다. 성숙한 제품 팀에 프로토타이퍼만 계속 채우면 새 아이디어는 넘치지만 아무도 시스템을 지키지 않습니다. 반대로 PMF 이전 제품에 메인테이너만 모으면 지킬 것이 생기기도 전에 방어 태세부터 갖춥니다.</p>

<h2 id="thakicloud-관점-에이전트-시대의-역할-재편">ThakiCloud 관점: 에이전트 시대의 역할 재편</h2>

<p>직무가 녹아내린다는 관찰은 사람과 에이전트가 함께 일하는 조직에서 한층 뾰족해집니다. AI 에이전트가 기계적인 빌드 작업의 상당 부분을 흡수하면, 사람은 자연스럽게 제품 단계마다 진짜로 중요한 원형 쪽으로 이동하게 됩니다. 코드를 타이핑하는 손이 아니라, 어떤 원형이 지금 필요한지를 판단하는 눈이 병목이 됩니다.</p>

<p>ThakiCloud가 운용하는 Agent-Native Cloud인 Paxis는 바로 이 재편을 시스템 층위에서 구현합니다. Paxis는 Skills, Tools, Policies, Audit Logs를 일급 리소스로 다루며, 960개가 넘는 스킬을 BM25로 선택해 격리된 샌드박스에서 실행합니다. 체르니가 사람의 역할을 직함이 아니라 제품 순간에 맞춰 재조합한다고 말했듯, Paxis는 에이전트의 역량을 고정된 파이프라인이 아니라 그때그때의 작업에 맞춰 동적으로 조합합니다. 프로토타이퍼가 발상을 쏟아내면 빌더 역할의 에이전트가 프로덕션 코드로 전환하고, 스위퍼 역할의 검증 게이트가 결과를 정리하는 식의 분업이 스킬 하네스 안에서 그대로 재현됩니다.</p>

<p>인프라 쪽에서는 ThakiCloud의 ai-platform이 메인테이너 원형의 일을 대신 짊어집니다. K8s 기반 멀티테넌트 환경에서 Kueue로 GPU를 스케줄링하고, vLLM으로 모델을 서빙하며, 온프렘과 소버린 요구를 만족시키는 것은 정확히 성숙한 시스템의 보안·안정·효율을 지키는 메인테이너의 일입니다. 고객 조직은 이 부분을 플랫폼에 위임함으로써 자기 팀을 프로토타이퍼와 그로어 쪽에 더 배치할 수 있습니다.</p>

<p>채용 관점에서도 이 렌즈는 유용합니다. ThakiCloud는 이력서의 직함보다 지원자가 어떤 원형의 스펙트럼 위에 있는지를 봅니다. 지금 우리 제품 단계에 비어 있는 원형을 채우는 사람이 팀에 가장 큰 레버리지를 만들기 때문입니다. “무엇을 할 줄 아는가”만큼 “어떤 순간에 빛나는가”를 묻는 것입니다.</p>

<h2 id="한계-및-반론">한계 및 반론</h2>

<p>이 프레임워크를 무비판적으로 받아들이기 전에 반대편의 목소리도 들어야 합니다. 벤 비네거(Ben Vinegar)는 같은 논의를 두고 “사람들이 소프트웨어 조직이 어떻게 돌아가는지를 이제야 배우면서, 원래부터 있던 팀 역학을 AI 탓으로 잘못 돌리고 있다”고 지적했습니다. 날카로운 반론입니다. 프로토타이퍼와 메인테이너의 구분은 AI가 없던 시절에도 존재했고, 제품 생애주기에 따라 필요한 인재가 달라진다는 것도 새로운 통찰이 아닙니다.</p>

<p>원형 분류 자체의 한계도 있습니다. 사람을 다섯 개의 상자로 나누는 모든 시도가 그렇듯, 이 틀도 개인을 지나치게 단순화할 위험이 있습니다. 실제로는 한 사람이 프로젝트마다, 심지어 하루 안에서도 여러 원형을 오갑니다. 원형을 고정된 정체성으로 오해하면 “너는 스위퍼니까 새 아이디어는 내지 마”라는 식의 역효과가 납니다. 체르니 본인도 많은 사람이 원형을 넘나든다고 강조한 이유가 여기에 있습니다.</p>

<p>그럼에도 이 프레임워크가 가치 있는 이유는 예측력이 아니라 언어를 준다는 데 있습니다. “엔지니어 한 명 더”라는 모호한 요청 대신 “지금 우리에게 그로어가 부족하다”고 말할 수 있게 되면, 채용과 팀 구성의 대화가 훨씬 구체적으로 바뀝니다. AI가 직무의 기계적 층위를 걷어낼수록, 남는 것은 이런 원형 수준의 판단입니다. 미래의 제품 역할은 오늘의 도메인별 직함보다 이 원형에 더 가깝게 형성될지 모릅니다.</p>

<h2 id="마치며">마치며</h2>

<p>직무가 녹아내리는 것은 위기가 아니라 재편입니다. 프로토타이퍼, 빌더, 스위퍼, 그로어, 메인테이너라는 다섯 원형은 직함이 사라진 자리에 무엇이 남는지를 보여줍니다. 남는 것은 도구가 아니라 어떤 순간에 어떤 방식으로 기여하는가라는 본질입니다.</p>

<p>ThakiCloud는 사람과 에이전트가 이 원형들을 나눠 지는 조직을 만들고 있습니다. 에이전트가 반복 가능한 빌드와 유지의 상당 부분을 맡을수록, 사람은 지금 이 제품 단계에 어떤 원형이 필요한지를 읽어내는 일에 집중하게 됩니다. 그 판단이 다음 시대의 가장 귀한 역량입니다.</p>

<h2 id="출처">출처</h2>

<ul>
  <li>Boris Cherny, X(@bcherny), 2026-06-29: <a href="https://x.com/bcherny/status/2071379474277613732">원문 트윗</a></li>
  <li>Ben Vinegar, X(@bentlegen): <a href="https://x.com/bentlegen/status/2071576459538567463">반론 트윗</a></li>
</ul>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="culture" /><category term="일의미래" /><category term="조직문화" /><category term="제품팀" /><category term="채용" /><category term="Boris Cherny" /><category term="Claude Code" /><summary type="html"><![CDATA[엔지니어링·제품·디자인·데이터가 한 덩어리로 녹아드는 지금, Claude Code를 만든 보리스 체르니가 제안한 다섯 가지 역할 원형과 제품 생애주기별 팀 구성 공식을 살펴봅니다.]]></summary></entry><entry xml:lang="ko"><title type="html">Dual-Pool Token-Budget Routing — vLLM 추론 GPU 시간 31~42% 절감하는 이원화 스케줄링</title><link href="https://thakicloud.github.io/ko/technique/dual-pool-token-budget-routing-vllm-kueue/" rel="alternate" type="text/html" title="Dual-Pool Token-Budget Routing — vLLM 추론 GPU 시간 31~42% 절감하는 이원화 스케줄링" /><published>2026-07-01T00:00:00+09:00</published><updated>2026-07-01T00:00:00+09:00</updated><id>https://thakicloud.github.io/ko/technique/dual-pool-token-budget-routing-vllm-kueue</id><content type="html" xml:base="https://thakicloud.github.io/ko/technique/dual-pool-token-budget-routing-vllm-kueue/"><![CDATA[<h2 id="문제-hol-블로킹이-gpu-시간을-조용히-낭비합니다">문제: HoL 블로킹이 GPU 시간을 조용히 낭비합니다</h2>

<p>LLM 추론 서비스를 운영하다 보면 단일 대기열 구조에서 반복되는 현상을 하나 목격하게 됩니다. 챗봇 한 줄 응답처럼 토큰 수십 개로 끝나는 요청이, 긴 문서 요약이나 코드 생성 요청 뒤에 줄을 서서 수백 밀리초를 낭비하는 상황입니다. 이를 Head-of-Line(HoL) 블로킹이라고 부릅니다.</p>

<p>vLLM은 continuous batching으로 배치 효율을 크게 높였지만, 단일 풀 구조에서 긴 요청이 KV 캐시를 장기간 점유하면 짧은 요청의 선점(preemption)이 발생합니다. 선점된 요청은 재계산 비용을 지불하고, 전체 GPU 시간 효율이 떨어집니다.</p>

<p>arXiv 2604.08075가 제안한 <strong>Dual-Pool Token-Budget Routing</strong>은 이 문제를 근본적으로 해결합니다. 요청이 들어오는 시점에 예상 응답 길이를 기준으로 short-context 풀과 long-context 풀로 분리해 라우팅함으로써, 두 유형이 서로 간섭하지 않게 합니다.</p>

<p>논문이 측정한 결과는 다음과 같습니다.</p>

<table>
  <thead>
    <tr>
      <th>지표</th>
      <th>효과</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>GPU 시간 절감</td>
      <td><strong>31~42%</strong></td>
    </tr>
    <tr>
      <td>Preemption rate</td>
      <td><strong>5.4배 감소</strong></td>
    </tr>
    <tr>
      <td>P99 TTFT 개선</td>
      <td><strong>6%</strong></td>
    </tr>
  </tbody>
</table>

<h2 id="핵심-원리-토큰-버짓-기반-라우팅">핵심 원리: 토큰 버짓 기반 라우팅</h2>

<p>Dual-Pool의 핵심은 단순합니다. 요청마다 <strong>예상 최대 토큰 수</strong>를 추정하고, 임계값을 기준으로 두 풀 중 하나에 할당합니다.</p>

<div class="language-plaintext highlighter-rouge"><div class="highlight"><pre class="highlight"><code>요청의 예상 토큰 합 = 입력 토큰 + 예상 출력 토큰
</code></pre></div></div>

<p>예상 출력 토큰을 모르는 경우(대부분의 실제 상황)에는 다음 두 가지 근사를 씁니다.</p>

<ol>
  <li><strong>요청 파라미터</strong>: <code class="language-plaintext highlighter-rouge">max_tokens</code> 값을 상한으로 사용합니다.</li>
  <li><strong>히스토리 기반 분류</strong>: 같은 API 경로 또는 시스템 프롬프트 해시로 이전 요청 길이 분포를 추적해 P75 또는 P90 값을 기준으로 분류합니다.</li>
</ol>

<p>임계값 설정은 워크로드 특성에 따라 다르지만, 논문에서 보고한 실험에서는 출력 512토큰을 기준으로 short/long을 나눴습니다.</p>

<h2 id="아키텍처-두-풀의-구조">아키텍처: 두 풀의 구조</h2>

<pre><code class="language-mermaid">flowchart TB
    A[클라이언트 요청] --&gt; B[라우터\nToken-Budget 분류기]
    B --&gt;|예상 토큰 &lt; 임계값| C[Short-Context 풀\nvLLM 인스턴스 A]
    B --&gt;|예상 토큰 &gt;= 임계값| D[Long-Context 풀\nvLLM 인스턴스 B]
    C --&gt; E[Kueue LocalQueue\nshort-pool]
    D --&gt; F[Kueue LocalQueue\nlong-pool]
    E --&gt; G[GPU 워커 그룹 A\n작은 KV 캐시 요청]
    F --&gt; H[GPU 워커 그룹 B\n큰 KV 캐시 요청]
    G --&gt; I[응답 반환]
    H --&gt; I
</code></pre>

<p>Short-context 풀은 KV 캐시를 빠르게 회전시켜 높은 throughput을 유지합니다. Long-context 풀은 긴 생성을 방해 없이 완료할 수 있는 충분한 KV 캐시 메모리를 확보합니다. 두 풀은 서로 선점 간섭을 일으키지 않습니다.</p>

<h2 id="kueue-localqueue-연동-구현">Kueue LocalQueue 연동 구현</h2>

<p>ThakiCloud의 ai-platform은 Kubernetes 위에서 Kueue를 통해 GPU 워크로드를 스케줄링합니다. Dual-Pool Routing을 Kueue LocalQueue와 연동하면 클러스터 수준에서 두 풀의 자원 배분을 선언적으로 관리할 수 있습니다.</p>

<h3 id="1단계-clusterqueue와-resourceflavor-정의">1단계: ClusterQueue와 ResourceFlavor 정의</h3>

<div class="language-yaml highlighter-rouge"><div class="highlight"><pre class="highlight"><code><span class="na">apiVersion</span><span class="pi">:</span> <span class="s">kueue.x-k8s.io/v1beta1</span>
<span class="na">kind</span><span class="pi">:</span> <span class="s">ClusterQueue</span>
<span class="na">metadata</span><span class="pi">:</span>
  <span class="na">name</span><span class="pi">:</span> <span class="s">llm-inference-cq</span>
<span class="na">spec</span><span class="pi">:</span>
  <span class="na">namespaceSelector</span><span class="pi">:</span> <span class="pi">{}</span>
  <span class="na">resourceGroups</span><span class="pi">:</span>
    <span class="pi">-</span> <span class="na">coveredResources</span><span class="pi">:</span> <span class="pi">[</span><span class="s2">"</span><span class="s">nvidia.com/gpu"</span><span class="pi">]</span>
      <span class="na">flavors</span><span class="pi">:</span>
        <span class="pi">-</span> <span class="na">name</span><span class="pi">:</span> <span class="s">gpu-a100</span>
          <span class="na">resources</span><span class="pi">:</span>
            <span class="pi">-</span> <span class="na">name</span><span class="pi">:</span> <span class="s">nvidia.com/gpu</span>
              <span class="na">nominalQuota</span><span class="pi">:</span> <span class="m">8</span>
<span class="nn">---</span>
<span class="na">apiVersion</span><span class="pi">:</span> <span class="s">kueue.x-k8s.io/v1beta1</span>
<span class="na">kind</span><span class="pi">:</span> <span class="s">ResourceFlavor</span>
<span class="na">metadata</span><span class="pi">:</span>
  <span class="na">name</span><span class="pi">:</span> <span class="s">gpu-a100</span>
<span class="na">spec</span><span class="pi">:</span>
  <span class="na">nodeLabels</span><span class="pi">:</span>
    <span class="na">gpu.nvidia.com/model</span><span class="pi">:</span> <span class="s">A100</span>
</code></pre></div></div>

<h3 id="2단계-풀별-localqueue-분리">2단계: 풀별 LocalQueue 분리</h3>

<div class="language-yaml highlighter-rouge"><div class="highlight"><pre class="highlight"><code><span class="na">apiVersion</span><span class="pi">:</span> <span class="s">kueue.x-k8s.io/v1beta1</span>
<span class="na">kind</span><span class="pi">:</span> <span class="s">LocalQueue</span>
<span class="na">metadata</span><span class="pi">:</span>
  <span class="na">name</span><span class="pi">:</span> <span class="s">short-pool-queue</span>
  <span class="na">namespace</span><span class="pi">:</span> <span class="s">llm-serving</span>
<span class="na">spec</span><span class="pi">:</span>
  <span class="na">clusterQueue</span><span class="pi">:</span> <span class="s">llm-inference-cq</span>
<span class="nn">---</span>
<span class="na">apiVersion</span><span class="pi">:</span> <span class="s">kueue.x-k8s.io/v1beta1</span>
<span class="na">kind</span><span class="pi">:</span> <span class="s">LocalQueue</span>
<span class="na">metadata</span><span class="pi">:</span>
  <span class="na">name</span><span class="pi">:</span> <span class="s">long-pool-queue</span>
  <span class="na">namespace</span><span class="pi">:</span> <span class="s">llm-serving</span>
<span class="na">spec</span><span class="pi">:</span>
  <span class="na">clusterQueue</span><span class="pi">:</span> <span class="s">llm-inference-cq</span>
</code></pre></div></div>

<h3 id="3단계-vllm-deployment에-큐-어노테이션-추가">3단계: vLLM Deployment에 큐 어노테이션 추가</h3>

<div class="language-yaml highlighter-rouge"><div class="highlight"><pre class="highlight"><code><span class="na">apiVersion</span><span class="pi">:</span> <span class="s">apps/v1</span>
<span class="na">kind</span><span class="pi">:</span> <span class="s">Deployment</span>
<span class="na">metadata</span><span class="pi">:</span>
  <span class="na">name</span><span class="pi">:</span> <span class="s">vllm-short-pool</span>
  <span class="na">namespace</span><span class="pi">:</span> <span class="s">llm-serving</span>
  <span class="na">annotations</span><span class="pi">:</span>
    <span class="na">kueue.x-k8s.io/queue-name</span><span class="pi">:</span> <span class="s">short-pool-queue</span>
<span class="na">spec</span><span class="pi">:</span>
  <span class="na">replicas</span><span class="pi">:</span> <span class="m">2</span>
  <span class="na">template</span><span class="pi">:</span>
    <span class="na">spec</span><span class="pi">:</span>
      <span class="na">containers</span><span class="pi">:</span>
        <span class="pi">-</span> <span class="na">name</span><span class="pi">:</span> <span class="s">vllm</span>
          <span class="na">image</span><span class="pi">:</span> <span class="s">vllm/vllm-openai:latest</span>
          <span class="na">args</span><span class="pi">:</span>
            <span class="pi">-</span> <span class="s2">"</span><span class="s">--model"</span>
            <span class="pi">-</span> <span class="s2">"</span><span class="s">meta-llama/Llama-3.1-8B-Instruct"</span>
            <span class="pi">-</span> <span class="s2">"</span><span class="s">--max-model-len"</span>
            <span class="pi">-</span> <span class="s2">"</span><span class="s">4096"</span>       <span class="c1"># short 풀: 작은 컨텍스트 한도</span>
            <span class="pi">-</span> <span class="s2">"</span><span class="s">--gpu-memory-utilization"</span>
            <span class="pi">-</span> <span class="s2">"</span><span class="s">0.7"</span>        <span class="c1"># KV 캐시를 짧게 쓰고 빠르게 회전</span>
          <span class="na">resources</span><span class="pi">:</span>
            <span class="na">limits</span><span class="pi">:</span>
              <span class="na">nvidia.com/gpu</span><span class="pi">:</span> <span class="s2">"</span><span class="s">1"</span>
<span class="nn">---</span>
<span class="na">apiVersion</span><span class="pi">:</span> <span class="s">apps/v1</span>
<span class="na">kind</span><span class="pi">:</span> <span class="s">Deployment</span>
<span class="na">metadata</span><span class="pi">:</span>
  <span class="na">name</span><span class="pi">:</span> <span class="s">vllm-long-pool</span>
  <span class="na">namespace</span><span class="pi">:</span> <span class="s">llm-serving</span>
  <span class="na">annotations</span><span class="pi">:</span>
    <span class="na">kueue.x-k8s.io/queue-name</span><span class="pi">:</span> <span class="s">long-pool-queue</span>
<span class="na">spec</span><span class="pi">:</span>
  <span class="na">replicas</span><span class="pi">:</span> <span class="m">2</span>
  <span class="na">template</span><span class="pi">:</span>
    <span class="na">spec</span><span class="pi">:</span>
      <span class="na">containers</span><span class="pi">:</span>
        <span class="pi">-</span> <span class="na">name</span><span class="pi">:</span> <span class="s">vllm</span>
          <span class="na">image</span><span class="pi">:</span> <span class="s">vllm/vllm-openai:latest</span>
          <span class="na">args</span><span class="pi">:</span>
            <span class="pi">-</span> <span class="s2">"</span><span class="s">--model"</span>
            <span class="pi">-</span> <span class="s2">"</span><span class="s">meta-llama/Llama-3.1-8B-Instruct"</span>
            <span class="pi">-</span> <span class="s2">"</span><span class="s">--max-model-len"</span>
            <span class="pi">-</span> <span class="s2">"</span><span class="s">32768"</span>      <span class="c1"># long 풀: 넉넉한 컨텍스트 허용</span>
            <span class="pi">-</span> <span class="s2">"</span><span class="s">--gpu-memory-utilization"</span>
            <span class="pi">-</span> <span class="s2">"</span><span class="s">0.90"</span>       <span class="c1"># KV 캐시를 크게 확보</span>
          <span class="na">resources</span><span class="pi">:</span>
            <span class="na">limits</span><span class="pi">:</span>
              <span class="na">nvidia.com/gpu</span><span class="pi">:</span> <span class="s2">"</span><span class="s">1"</span>
</code></pre></div></div>

<h3 id="4단계-라우터-구현-python-예시">4단계: 라우터 구현 (Python 예시)</h3>

<div class="language-python highlighter-rouge"><div class="highlight"><pre class="highlight"><code><span class="kn">from</span> <span class="n">fastapi</span> <span class="kn">import</span> <span class="n">FastAPI</span><span class="p">,</span> <span class="n">Request</span>
<span class="kn">import</span> <span class="n">httpx</span>

<span class="n">app</span> <span class="o">=</span> <span class="nc">FastAPI</span><span class="p">()</span>

<span class="n">SHORT_POOL_URL</span> <span class="o">=</span> <span class="sh">"</span><span class="s">http://vllm-short-pool-svc:8000/v1/chat/completions</span><span class="sh">"</span>
<span class="n">LONG_POOL_URL</span>  <span class="o">=</span> <span class="sh">"</span><span class="s">http://vllm-long-pool-svc:8000/v1/chat/completions</span><span class="sh">"</span>
<span class="n">TOKEN_THRESHOLD</span> <span class="o">=</span> <span class="mi">512</span>  <span class="c1"># 이 값은 워크로드 히스토리로 튜닝
</span>
<span class="k">def</span> <span class="nf">estimate_output_tokens</span><span class="p">(</span><span class="n">payload</span><span class="p">:</span> <span class="nb">dict</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
    <span class="sh">"""</span><span class="s">max_tokens를 상한으로 사용. 없으면 256 기본값.</span><span class="sh">"""</span>
    <span class="k">return</span> <span class="n">payload</span><span class="p">.</span><span class="nf">get</span><span class="p">(</span><span class="sh">"</span><span class="s">max_tokens</span><span class="sh">"</span><span class="p">)</span> <span class="ow">or</span> <span class="mi">256</span>

<span class="k">def</span> <span class="nf">route_request</span><span class="p">(</span><span class="n">payload</span><span class="p">:</span> <span class="nb">dict</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
    <span class="sh">"""</span><span class="s">예상 토큰 수에 따라 라우팅 대상 URL 반환.</span><span class="sh">"""</span>
    <span class="n">estimated</span> <span class="o">=</span> <span class="nf">estimate_output_tokens</span><span class="p">(</span><span class="n">payload</span><span class="p">)</span>
    <span class="k">if</span> <span class="n">estimated</span> <span class="o">&lt;</span> <span class="n">TOKEN_THRESHOLD</span><span class="p">:</span>
        <span class="k">return</span> <span class="n">SHORT_POOL_URL</span>
    <span class="k">return</span> <span class="n">LONG_POOL_URL</span>

<span class="nd">@app.post</span><span class="p">(</span><span class="sh">"</span><span class="s">/v1/chat/completions</span><span class="sh">"</span><span class="p">)</span>
<span class="k">async</span> <span class="k">def</span> <span class="nf">proxy</span><span class="p">(</span><span class="n">request</span><span class="p">:</span> <span class="n">Request</span><span class="p">):</span>
    <span class="n">payload</span> <span class="o">=</span> <span class="k">await</span> <span class="n">request</span><span class="p">.</span><span class="nf">json</span><span class="p">()</span>
    <span class="n">target_url</span> <span class="o">=</span> <span class="nf">route_request</span><span class="p">(</span><span class="n">payload</span><span class="p">)</span>
    <span class="k">async</span> <span class="k">with</span> <span class="n">httpx</span><span class="p">.</span><span class="nc">AsyncClient</span><span class="p">(</span><span class="n">timeout</span><span class="o">=</span><span class="mf">120.0</span><span class="p">)</span> <span class="k">as</span> <span class="n">client</span><span class="p">:</span>
        <span class="n">resp</span> <span class="o">=</span> <span class="k">await</span> <span class="n">client</span><span class="p">.</span><span class="nf">post</span><span class="p">(</span><span class="n">target_url</span><span class="p">,</span> <span class="n">json</span><span class="o">=</span><span class="n">payload</span><span class="p">)</span>
        <span class="k">return</span> <span class="n">resp</span><span class="p">.</span><span class="nf">json</span><span class="p">()</span>
</code></pre></div></div>

<p>이 라우터는 Kubernetes Service로 노출하고, 기존 추론 엔드포인트 앞에 배치합니다.</p>

<h2 id="운영-고려사항">운영 고려사항</h2>

<h3 id="임계값-튜닝">임계값 튜닝</h3>

<p>512토큰 임계값은 워크로드에 따라 달라집니다. 실제 운영에서는 다음 지표를 7일 이상 수집한 뒤 조정하는 것을 권장합니다.</p>

<ul>
  <li>요청별 실제 출력 토큰 분포 (P50, P90, P99)</li>
  <li>풀별 preemption rate (<code class="language-plaintext highlighter-rouge">vllm:num_preemptions_total</code> Prometheus 메트릭)</li>
  <li>풀별 <code class="language-plaintext highlighter-rouge">vllm:num_requests_waiting</code> 대기 큐 깊이</li>
</ul>

<p>Short 풀 대기 큐가 지속적으로 깊어진다면 임계값을 낮추거나 short 풀 replica를 늘려야 합니다. Long 풀 GPU 사용률이 낮다면 임계값을 올려 long으로 가는 요청을 줄입니다.</p>

<h3 id="keda-오토스케일링-연동">KEDA 오토스케일링 연동</h3>

<p>vLLM Prometheus 메트릭 기반 KEDA ScaledObject를 추가하면 풀별로 독립적인 오토스케일링이 가능합니다.</p>

<div class="language-yaml highlighter-rouge"><div class="highlight"><pre class="highlight"><code><span class="na">apiVersion</span><span class="pi">:</span> <span class="s">keda.sh/v1alpha1</span>
<span class="na">kind</span><span class="pi">:</span> <span class="s">ScaledObject</span>
<span class="na">metadata</span><span class="pi">:</span>
  <span class="na">name</span><span class="pi">:</span> <span class="s">vllm-short-pool-scaler</span>
  <span class="na">namespace</span><span class="pi">:</span> <span class="s">llm-serving</span>
<span class="na">spec</span><span class="pi">:</span>
  <span class="na">scaleTargetRef</span><span class="pi">:</span>
    <span class="na">name</span><span class="pi">:</span> <span class="s">vllm-short-pool</span>
  <span class="na">minReplicaCount</span><span class="pi">:</span> <span class="m">1</span>
  <span class="na">maxReplicaCount</span><span class="pi">:</span> <span class="m">8</span>
  <span class="na">triggers</span><span class="pi">:</span>
    <span class="pi">-</span> <span class="na">type</span><span class="pi">:</span> <span class="s">prometheus</span>
      <span class="na">metadata</span><span class="pi">:</span>
        <span class="na">serverAddress</span><span class="pi">:</span> <span class="s">http://prometheus:9090</span>
        <span class="na">metricName</span><span class="pi">:</span> <span class="s">vllm_requests_waiting_short</span>
        <span class="na">query</span><span class="pi">:</span> <span class="s">vllm:num_requests_waiting{deployment="vllm-short-pool"}</span>
        <span class="na">threshold</span><span class="pi">:</span> <span class="s2">"</span><span class="s">5"</span>
</code></pre></div></div>

<p>KEDA 메트릭 기반 스케일링은 단순 HTTP RPS 기반보다 추론 부하에 더 직접 대응합니다. 위 임계값 <code class="language-plaintext highlighter-rouge">5</code>는 현재 대기 요청이 5개를 초과하면 scale-up을 시작하라는 의미입니다.</p>

<h3 id="모델-공유-vs-인스턴스-분리">모델 공유 vs 인스턴스 분리</h3>

<p>두 풀이 반드시 서로 다른 vLLM 인스턴스를 써야 하는 것은 아닙니다. 동일 모델을 다른 <code class="language-plaintext highlighter-rouge">--max-model-len</code> 설정으로 띄우는 것이 기본 구성이지만, 메모리 예산이 넉넉하다면 단일 vLLM 인스턴스에 두 개의 외부 포트를 열고 내부적으로 priority class를 달리 적용하는 방법도 있습니다.</p>

<p>다만 preemption 간섭을 완전히 차단하려면 <strong>인스턴스 분리가 더 명확합니다</strong>. KV 캐시 메모리는 vLLM 프로세스 내에서 공유되기 때문입니다.</p>

<h2 id="thakicloud-ai-platform-적용-관점">ThakiCloud ai-platform 적용 관점</h2>

<p>ThakiCloud의 ai-platform은 멀티테넌트 환경에서 여러 고객의 추론 워크로드를 단일 GPU 클러스터에서 서빙합니다. Dual-Pool Routing은 이 환경에서 두 가지 이점을 더합니다.</p>

<p>첫째, 테넌트 간 간섭을 줄입니다. 짧은 챗봇 응답이 주인 고객사 A의 요청이, 긴 문서 분석이 주인 고객사 B의 배치 요청에 밀리는 상황은 SLO 위반으로 이어집니다. 풀 분리는 이 간섭을 구조적으로 차단합니다.</p>

<p>둘째, GPU 예산 효율이 높아집니다. 논문이 측정한 31~42% GPU 시간 절감은 같은 GPU 예산으로 더 많은 요청을 소화하거나, 동일 처리량을 더 적은 GPU로 달성한다는 의미입니다. 온프렘 자원이 고정된 환경에서 이 절감률은 곧 서빙 비용 절감으로 직결됩니다.</p>

<p>Kueue LocalQueue를 이미 사용 중인 ThakiCloud 클러스터에서는 Short/Long 큐 선언과 라우터 배치만으로 이 구조를 추가할 수 있습니다. 기존 vLLM Deployment 스펙과의 호환성도 높아 적용 범위가 넓습니다.</p>

<h2 id="정리">정리</h2>

<p>Dual-Pool Token-Budget Routing이 해결하는 문제는 단순합니다. 짧은 요청과 긴 요청이 같은 대기열에 섞이면 짧은 요청이 손해를 봅니다. 이를 대기열 단계에서 분리하면 각 유형의 요청이 자기 속도로 처리됩니다.</p>

<p>arXiv 2604.08075가 측정한 GPU 시간 31~42% 절감, preemption rate 5.4배 감소, P99 TTFT 6% 개선은 구현 복잡도에 비해 효과가 큰 기법입니다. Kubernetes 환경에서는 Kueue LocalQueue 두 개, vLLM Deployment 두 개, 경량 라우터 하나로 이 구조를 구현할 수 있습니다.</p>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="technique" /><category term="vllm" /><category term="llm-inference" /><category term="kueue" /><category term="gpu-scheduling" /><category term="llmops" /><category term="kubernetes" /><summary type="html"><![CDATA[짧은 응답 요청이 긴 응답 요청에 밀려 기다리는 HoL 블로킹은 GPU 시간을 낭비하는 조용한 적입니다. 요청을 short-context 풀과 long-context 풀로 나눠 라우팅하는 Dual-Pool Token-Budget Routing은 arXiv 2604.08075에서 GPU 시간 31~42% 절감, P99 TTFT 6% 개선을 측정했습니다. Kueue LocalQueue와 연동해 이 기법을 Kubernetes 위에서 구현하는 방법을 단계별로 정리합니다.]]></summary></entry><entry xml:lang="ko"><title type="html">내 AI 스택이 다 중국산이 됐다</title><link href="https://thakicloud.github.io/ko/%EB%A7%8C%ED%99%94/ai-stack-sovereignty/" rel="alternate" type="text/html" title="내 AI 스택이 다 중국산이 됐다" /><published>2026-07-01T00:00:00+09:00</published><updated>2026-07-01T00:00:00+09:00</updated><id>https://thakicloud.github.io/ko/%EB%A7%8C%ED%99%94/ai-stack-sovereignty</id><content type="html" xml:base="https://thakicloud.github.io/ko/%EB%A7%8C%ED%99%94/ai-stack-sovereignty/"><![CDATA[<p>스택이 통째로 남의 손에 넘어간 날, 파시스와 메티스의 대처법.</p>

<p><img src="/assets/images/posts/만화/ai-stack-sovereignty/strip.png" alt="내 AI 스택이 다 중국산이 됐다" /></p>

<blockquote>
  <p>원 뉴스: <a href="https://x.com/hjguyhan/status/2071779159391793563">My entire AI stack is now Chinese</a> · twitter</p>
</blockquote>

<hr />

<p><em>이 만화는 업계 뉴스를 바탕으로 자동 생성된 초안입니다.</em></p>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="만화" /><category term="만화" /><category term="comic" /><category term="온프렘" /><category term="sovereignty" /><category term="AI" /><summary type="html"><![CDATA[스택이 통째로 남의 손에 넘어간 날, 파시스와 메티스의 대처법.]]></summary><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://thakicloud.github.io/assets/images/posts/%EB%A7%8C%ED%99%94/ai-stack-sovereignty/strip.png" /><media:content medium="image" url="https://thakicloud.github.io/assets/images/posts/%EB%A7%8C%ED%99%94/ai-stack-sovereignty/strip.png" xmlns:media="http://search.yahoo.com/mrss/" /></entry><entry xml:lang="ko"><title type="html">미래의 일, 직무 대신 5가지 ‘원형’</title><link href="https://thakicloud.github.io/ko/%EB%A7%8C%ED%99%94/five-work-archetypes/" rel="alternate" type="text/html" title="미래의 일, 직무 대신 5가지 ‘원형’" /><published>2026-07-01T00:00:00+09:00</published><updated>2026-07-01T00:00:00+09:00</updated><id>https://thakicloud.github.io/ko/%EB%A7%8C%ED%99%94/five-work-archetypes</id><content type="html" xml:base="https://thakicloud.github.io/ko/%EB%A7%8C%ED%99%94/five-work-archetypes/"><![CDATA[<p>엔지니어·PM·디자이너가 프로토타이퍼·빌더·스위퍼·그로워·메인테이너로 녹아든다는데, 아무도 안 하려는 6번째가 있다.</p>

<p><img src="/assets/images/posts/만화/five-work-archetypes/strip.png" alt="미래의 일, 직무 대신 5가지 '원형'" /></p>

<blockquote>
  <p>원 뉴스: <a href="https://x.com/bcherny">Boris Cherny on the five archetypes of future roles</a> · twitter</p>
</blockquote>

<hr />

<p><em>이 만화는 업계 뉴스를 바탕으로 자동 생성된 초안입니다.</em></p>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="만화" /><category term="future-of-work" /><category term="engineering-roles" /><category term="AI" /><category term="on-prem" /><category term="ThakiCloud" /><summary type="html"><![CDATA[엔지니어·PM·디자이너가 프로토타이퍼·빌더·스위퍼·그로워·메인테이너로 녹아든다는데, 아무도 안 하려는 6번째가 있다.]]></summary><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://thakicloud.github.io/assets/images/posts/%EB%A7%8C%ED%99%94/five-work-archetypes/strip.png" /><media:content medium="image" url="https://thakicloud.github.io/assets/images/posts/%EB%A7%8C%ED%99%94/five-work-archetypes/strip.png" xmlns:media="http://search.yahoo.com/mrss/" /></entry><entry xml:lang="ar"><title type="html">Samsung وSK Hynix تُعلنان استثمارات محلية بقيمة 4,755 تريليون وون خلال عشر سنوات: من مصانع الذاكرة في هونام إلى مراكز بيانات الذكاء الاصطناعي بطاقة 15 غيغاواط</title><link href="https://thakicloud.github.io/ar/news/samsung-skhynix-ai-memory-mega-investment/" rel="alternate" type="text/html" title="Samsung وSK Hynix تُعلنان استثمارات محلية بقيمة 4,755 تريليون وون خلال عشر سنوات: من مصانع الذاكرة في هونام إلى مراكز بيانات الذكاء الاصطناعي بطاقة 15 غيغاواط" /><published>2026-06-30T00:00:00+09:00</published><updated>2026-06-30T00:00:00+09:00</updated><id>https://thakicloud.github.io/ar/news/samsung-skhynix-ai-memory-mega-investment</id><content type="html" xml:base="https://thakicloud.github.io/ar/news/samsung-skhynix-ai-memory-mega-investment/"><![CDATA[<p>في 29 يونيو 2026، صدر إعلان ضخم من قصر الضيافة في الرئاسة الكورية. أعلنت شركتا Samsung Electronics وSK hynix عن خطط لاستثمار ما مجموعه 4,755 تريليون وون داخل كوريا خلال السنوات العشر المقبلة. جاء هذا الإعلان في اجتماع “التقرير الوطني الشعبي للمشاريع الثلاثة الكبرى للقفزة الكبرى في كوريا” الذي ترأسه الرئيس لي جيه-مونغ، وأعلن فيه الرئيسان التنفيذيان لي جيه-يونغ وتشوي تاي-وون عن هذا الالتزام مباشرة.</p>

<p>يستعرض هذا المقال تفاصيل ما أُعلن في ذلك اليوم بشكل منهجي: ما الذي سيُبنى، وأين، وبأي تكلفة، وما السياق الصناعي والسياسي وراء ذلك، وما الذي يعنيه هذا لمشغلي البنية التحتية للذكاء الاصطناعي.</p>

<p><img src="/assets/images/samsung-skhynix-ai-memory-mega-investment-results-en.png" alt="رسم بياني مقارن بين حجم الاستثمارات المحلية لـSamsung وSK على مدى عشر سنوات والميزانية السنوية الحكومية" /></p>

<h2 id="ما-الذي-أُعلن">ما الذي أُعلن؟</h2>

<p>لم يكن الإعلان مجرد تقرير مستقل من الشركتين، بل كان إعلاناً عن مشروع وطني ضخم وصفه الرئيس بـ”الثورة الصناعية للذكاء الاصطناعي على النمط الكوري”. الجهتان المستثمرتان: مجموعة Samsung بمبلغ 2,655 تريليون وون، ومجموعة SK بمبلغ 2,100 تريليون وون، على مدى عشر سنوات داخل كوريا، ليبلغ المجموع 4,755 تريليون وون، أي ما يعادل 6.5 أضعاف الميزانية الحكومية السنوية (نحو 728 تريليون وون).</p>

<p>أشار الرئيس التنفيذي لي جيه-يونغ إلى مدينة غوانغجو مباشرة بوصفها الموقع المرشح لمجمع أشباه الموصلات الجديد، قائلاً: “نخطط لاتخاذ غوانغجو موقعاً مرشحاً حيث نتطلع إلى الحصول على دعم حوافز”. وأكد الرئيس التنفيذي تشوي تاي-وون أن الهدف هو تحويل كوريا من “دولة تستهلك الذكاء الاصطناعي إلى دولة تصدّره”. كما طالب الرئيس التنفيذي لـSK hynix غوانغ نو-جيونغ بتطبيق قانون أشباه الموصلات الخاص على مجمع Yongin وبتحسين ظروف المعيشة في المناطق.</p>

<p>تجدر الإشارة إلى أن مبلغ 4,755 تريليون وون يمثل إجمالي المبالغ المخططة للتنفيذ على مدى عشر سنوات أو أكثر، وليس نفقات سنوية. يبلغ إجمالي الإنفاق الرأسمالي السنوي للشركتين حالياً نحو 70 تريليون وون (نحو 41 تريليون لـSamsung DS ونحو 29 تريليون لـSK hynix). ينبغي التمييز بين حجم الإعلان ووتيرة التنفيذ السنوية.</p>

<blockquote>
  <p>ملاحظة حول التحويل إلى الدولار: المبلغ المعلن مُقوَّم بالوون الكوري وهو المرجع المعتمد. وبسعر 1,380 وون لكل دولار، تعادل 4,755 تريليون وون نحو 3.4 تريليون دولار.</p>
</blockquote>

<h2 id="هيكل-الاستثمار-800-تريليون-وون-لمصانع-المنطقة-الجنوبية-الغربية-و15-غيغاواط-لمراكز-البيانات">هيكل الاستثمار: 800 تريليون وون لمصانع المنطقة الجنوبية الغربية و15 غيغاواط لمراكز البيانات</h2>

<p>أكثر الالتزامات إلزامية ضمن إجمالي 4,755 تريليون وون هي مصانع الذاكرة في المنطقة الجنوبية الغربية (هونام). ستضخ كل من Samsung وSK hynix 400 تريليون وون، ليبلغ مجموع استثمارهما 800 تريليون وون لإنشاء أربعة مصانع ذاكرة (مصنعان لكل شركة). وتنظر Samsung في غوانغجو موقعاً مرشحاً. وتوزعت بقية البنود على النحو التالي:</p>

<pre><code class="language-mermaid">flowchart TB
    A["Samsung + SK hynix&lt;br/&gt;استثمارات محلية لعشر سنوات&lt;br/&gt;4,755 تريليون وون"] --&gt; B["Samsung Electronics&lt;br/&gt;2,655 تريليون"]
    A --&gt; C["SK Group&lt;br/&gt;2,100 تريليون"]
    B --&gt; B1["أشباه الموصلات&lt;br/&gt;Pyeongtaek + Yongin&lt;br/&gt;~2,030 تريليون"]
    B --&gt; B2["تغليف HBM&lt;br/&gt;تشونغتشيونغ&lt;br/&gt;140 تريليون"]
    C --&gt; C1["مراكز بيانات AI&lt;br/&gt;1,000 تريليون - 15GW"]
    C --&gt; C2["أشباه الموصلات&lt;br/&gt;Yongin&lt;br/&gt;600 تريليون"]
    C --&gt; C3["زيادة إنتاج NAND&lt;br/&gt;Cheongju&lt;br/&gt;100 تريليون"]
    B --&gt; D["مصانع الذاكرة في المنطقة الجنوبية الغربية&lt;br/&gt;4 مصانع - 800 تريليون&lt;br/&gt;مشترك بين الشركتين"]
    C --&gt; D
</code></pre>

<p>يستحق الاهتمام بند مراكز بيانات الذكاء الاصطناعي من جانب SK، إذ تقود SKT مشروعاً بقيمة 1,000 تريليون وون لإنشاء مراكز بيانات ذكاء اصطناعي بسعة 15 غيغاواط على المستوى الوطني بحلول عام 2035. ونظراً إلى أن تكلفة إنشاء غيغاواط واحد من مراكز البيانات تتراوح عادةً بين مليار وثلاثة مليارات دولار، فإن هذا الحجم يبدو منطقياً مع ما يُخصص لـ15 غيغاواط. يُضاف إلى ذلك استثمار SK hynix المنفصل بقيمة 100 تريليون وون لزيادة إنتاج NAND Flash في Cheongju. وخصصت Samsung نحو 2,030 تريليون وون لأشباه الموصلات في Pyeongtaek وYongin، و140 تريليون وون لتغليف HBM في تشونغتشيونغ.</p>

<h2 id="لماذا-الآن-ولماذا-بهذا-الحجم-دورة-hbm-الفائقة">لماذا الآن؟ ولماذا بهذا الحجم؟ دورة HBM الفائقة</h2>

<p>تتمحور القوة الدافعة وراء هذه الأرقام الضخمة حول عامل واحد: طلب HBM، أي ذاكرة النطاق الترددي العالي. تُعدّ HBM ذاكرة فائقة القيمة تُكدَّس على مسرّعات الذكاء الاصطناعي، وتبلغ قيمتها بين خمسة وسبعة أضعاف DRAM العادية. ومن المتوقع أن ينمو سوق HBM العالمي من نحو 35 مليار دولار عام 2025 إلى نحو 54.6 إلى 58 مليار دولار عام 2026، أي بنسبة نمو تتجاوز 58%.</p>

<p>جذور الطلب هي إنفاق مشغلي الخدمات السحابية الكبار. تجاوز إنفاق Amazon وMicrosoft وGoogle وMeta وOracle الرأسمالي على البنية التحتية للذكاء الاصطناعي عام 2026 حاجز 600 مليار دولار، وارتفعت حصة الذاكرة منه إلى نحو 30% بعد أن كانت 8% بين عامَي 2023 و2024. ويمثل طلب Blackwell وRubin من NVIDIA وحده مئات المليارات من الدولارات في قوائم الطلبيات، وقد بيعت مسبقاً إنتاج عام 2026 لموردي HBM الثلاثة: SK hynix وMicron وSamsung.</p>

<p>الجوهر هنا أن هذه الاختناقات تنشأ من شح الطاقة الإنتاجية لا من شح رأس المال. فالمشكلة ليست نقص الأموال بل نقص المصانع. ولهذا السبب تتجه الشركتان في آنٍ واحد نحو توسع ضخم في الطاقة الإنتاجية. سجّلت SK hynix هامش ربح تشغيلي بلغ 47% في الربع الثالث من عام 2025، وهو ما أتاح دورة إعادة استثمار هذه الأرباح في منشآت Yongin وCheongju.</p>

<h2 id="دعم-السياسات-قانون-أشباه-الموصلات-الخاص">دعم السياسات: قانون أشباه الموصلات الخاص</h2>

<p>اعتمدت كوريا تاريخياً على الإعفاءات الضريبية لدعم قطاع أشباه الموصلات بدلاً من منح الدعم النقدي المباشر كما تفعل الولايات المتحدة وأوروبا. رفع قانون K-Chips الصادر في فبراير 2025 معدل الإعفاء الضريبي على استثمارات المنشآت للشركات الكبرى من 15% إلى 20%، ومدّد إعفاءات البحث والتطوير حتى عام 2031. ويُقدَّر الأثر الضريبي المشترك للشركتين بنحو 6 تريليونات وون.</p>

<p>يُضاف إلى ذلك قانون أشباه الموصلات الخاص الذي صدر في يناير 2026، والذي يتيح للدولة والسلطات المحلية دعم البنية التحتية الصناعية كالكهرباء والمياه والطرق. ومن المقرر تطبيقه في الربع الثالث من 2026. إن تشغيل مصانع هونام البالغة قيمتها 800 تريليون وون يتوقف توقفاً حاسماً على توفير البنية التحتية للكهرباء والمياه في الوقت المناسب وفق هذا القانون. ولهذا السبب طالب الرئيس التنفيذي غوانغ علناً بتطبيق القانون على مجمع Yongin.</p>

<h2 id="المنافسة-العالمية-التوسع-المتزامن-لموردي-hbm-الثلاثة">المنافسة العالمية: التوسع المتزامن لموردي HBM الثلاثة</h2>

<table>
  <thead>
    <tr>
      <th>الشركة</th>
      <th>الموقع</th>
      <th>الاستثمارات الأخيرة</th>
      <th>وضع HBM</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>SK hynix</td>
      <td>المرتبة الأولى في الذاكرة</td>
      <td>600 تريليون وون في Yongin وغيرها</td>
      <td>حصة سوقية ~57% في HBM، إمداد أولوي لـHBM4</td>
    </tr>
    <tr>
      <td>Samsung Electronics</td>
      <td>منافس في الذاكرة</td>
      <td>~2,030 تريليون وون في Pyeongtaek وYongin</td>
      <td>حصة سوقية ~35% في HBM، توسع 50% في 2026</td>
    </tr>
    <tr>
      <td>Micron</td>
      <td>المرتبة الثالثة في الذاكرة</td>
      <td>~20 مليار دولار في السنة المالية 2026</td>
      <td>مبيعات HBM لعام 2026 مكتملة، بدء إنتاج HBM4 في الربع الثاني</td>
    </tr>
    <tr>
      <td>TSMC</td>
      <td>التصنيع بالعقد</td>
      <td>165 مليار دولار في أريزونا</td>
      <td>طاقة تغليف CoWoS محجوزة بالكامل حتى 2026</td>
    </tr>
  </tbody>
</table>

<p>بيعت مخزونات إنتاج HBM لعام 2026 لدى الموردين الثلاثة بالكامل. التحدي الحقيقي يكمن في عامَي 2027 و2028: إن لم تكن المصانع الكورية كافية عندئذٍ، فقد تذهب الحصة السوقية من طلب HBM4 وHBM5 إلى Micron. وعلى صعيد التصنيع، خصصت TSMC 165 مليار دولار في أريزونا وحدها لاستيعاب طاقة تغليف CoWoS حتى 2026، فيما انسحبت Intel فعلياً من منافسة HBM في سياق إعادة هيكلة أعمال التصنيع.</p>

<h2 id="الكهرباء-هي-الاختناق-الحقيقي-التنافس-على-مواقع-مراكز-البيانات">الكهرباء هي الاختناق الحقيقي: التنافس على مواقع مراكز البيانات</h2>

<p>منذ الربع الأول من 2026، انتقل الاختناق الرئيسي في البنية التحتية للذكاء الاصطناعي من الرقائق إلى الكهرباء. تأخرت أو أُلغيت مشاريع مراكز بيانات بسعة نحو 7 غيغاواط في الولايات المتحدة بسبب نقص الكهرباء. ومفارقةً، يرفع هذا من جاذبية المنطقة الجنوبية الغربية الكورية والشرق الأوسط كمواقع يمكن فيها تأمين الكهرباء والأراضي.</p>

<p>خطة SK لبناء مراكز بيانات ذكاء اصطناعي بسعة 15 غيغاواط بقيمة 1,000 تريليون وون بحلول 2035 ليست مجرد استثمار عقاري. فحين يبني مصنّع الذاكرة مراكز البيانات التي يُورّد إليها HBM مباشرةً، يتمكن من خلق طلبه الخاص واستعادة قوته التفاوضية في سلسلة التوريد التي تُحدد فيها NVIDIA ومشغلو الخدمات السحابية الكبار المواصفات. وتسير Samsung في الاتجاه ذاته نحو التكامل الرأسي من خلال مركز بيانات الذكاء الاصطناعي في Haenam ومصنع لوحات خوادم الذكاء الاصطناعي في Sejong.</p>

<h2 id="ردود-فعل-السوق">ردود فعل السوق</h2>

<p>عقب الإعلان مباشرةً، أغلق سهم Samsung Electronics بعد تذبذب عند 323,000 وون، واستعادت SK hynix المرتبة الأولى من حيث القيمة السوقية في بورصة كوسبي متجاوزةً Samsung Electronics في 30 يونيو. قارن بعض المحللين هذا التطور بتجاوز Microsoft لـCisco إبان فقاعة الدوت كوم عام 2000 واعتبروه إشارةً محتملة إلى ذروة السوق، غير أن غالبية المحللين أحجموا عن الحكم بالمبالغة في التقييم معربين عن رغبتهم في متابعة الأداء الفعلي والظروف الاقتصادية الكلية. وثمة وجهة نظر ترى أن التحول في القيمة السوقية مبالغ فيه، إذ تبقى تقديرات الأرباح التشغيلية لـSamsung لعام 2026 أعلى (361 تريليون وون) مقارنةً بـSK hynix (262 تريليون وون).</p>

<h2 id="منظور-thakicloud-كلما-توسعت-الأجهزة-ازداد-الدور-الحاسم-لطبقة-البرمجيات">منظور ThakiCloud: كلما توسعت الأجهزة، ازداد الدور الحاسم لطبقة البرمجيات</h2>

<p>جوهر هذا الإعلان هو أن كوريا تندمج رأسياً في البنية التحتية للذكاء الاصطناعي على المستوى الوطني، وهو ما يتقاطع مباشرةً مع أعمال ThakiCloud في منصة ai-platform.</p>

<p>مع توسع مراكز بيانات الذكاء الاصطناعي المحلية إلى سعة 15 غيغاواط، يتنامى الطلب على البنية التحتية متعددة المستأجرين لتدريب النماذج وخدمتها. تستهدف ThakiCloud هذه الطبقة تحديداً من خلال جدولة GPU المبنية على Kubernetes وKueue وخدمة النماذج عبر vLLM. حين توفر المصانع ومراكز البيانات الأجهزة، تصبح ثمة حاجة إلى مستوى تحكم يشغّل أحمال عمل العملاء المتعددين بشكل معزول وآمن.</p>

<p>طبيعة الطلب أيضاً في صالحنا. كثيراً ما يتعين على الصناعات الوطنية الاستراتيجية والقطاع العام تشغيل النماذج داخل مراكز البيانات الخاصة بها بدلاً من الاعتماد على السحابة الخارجية، ولا سيما في البيئات ذات الاشتراطات الأمنية الصارمة. تلبّي قدرات ThakiCloud في الاستضافة الذاتية وعزل المستأجرين المتعددين وخدمة النماذج بكفاءة عالية هذا الطلب السيادي على الذكاء الاصطناعي بدقة.</p>

<p>والأهم من ذلك: كلما زادت وفرة HBM وحسّاب الأداء العالي، انتقل محور المنافسة من “كم حجم ما اشتريته” إلى “كم كفاءة تشغيله”. تُقرر إدارة دورة حياة GPU والجدولة في نهاية المطاف مستوى التكلفة. هنا تحديداً تكمن قيمة ThakiCloud: طبقة البرمجيات التي تُشغّل الأجهزة التي ستُنتجها هذه الاستثمارات البالغة 4,755 تريليون وون بكفاءة قصوى.</p>

<h2 id="المحاذير-والحجج-المضادة-التفاؤل-المطلق-سابق-لأوانه">المحاذير والحجج المضادة: التفاؤل المطلق سابق لأوانه</h2>

<p>قراءة هذا الإعلان بوصفه خبراً إيجابياً حصراً ينطوي على مخاطر. إليك الحجج الصادقة في الاتجاه المعاكس.</p>

<p>أولاً، يمثل مبلغ 4,755 تريليون وون “خطة” تراكمية لعشر سنوات وليس إنفاقاً سنوياً موثقاً. الطابع الحكومي للمناسبة قد يضخ انحيازاً تصاعدياً في الأرقام، وقد عانى مجمع Yongin البالغ قيمته 622 تريليون وون الذي أُعلن عنه عام 2024 من تأخيرات في الجدول الزمني. ثمة دوماً فجوة بين الإعلان والتنفيذ.</p>

<p>ثانياً، إن انتهت دورة HBM الفائقة، تحولت عمليات التوسع الراهنة إلى طاقة فائضة مستقبلية. قطاع الذاكرة شهد تاريخياً دورات حادة التذبذب. إن كان الإنفاق الرأسمالي على الذكاء الاصطناعي مبالغاً فيه وفق بعض التحليلات، فقد تتزامن المصانع التي ستبدأ الإنتاج بين عامَي 2027 و2028 مع مرحلة تباطؤ الطلب.</p>

<p>ثالثاً، إن لم تُوفَّر البنية التحتية للكهرباء والمياه في الوقت المناسب، فقد تتأخر بداية تشغيل المصانع رغم الاستثمار البالغ 800 تريليون وون. وكون الكهرباء السبب الرئيسي في تأخر مراكز البيانات عالمياً يجعل هذه المخاوف حقيقية لا نظرية.</p>

<p>أخيراً، تبرز تحذيرات من أن التقييمات السوقية تجاوزت الأداء الفعلي. الحجم الإعلاني لا يضمن بالضرورة نتائج الأعمال.</p>

<h2 id="الخلاصة">الخلاصة</h2>

<p>إطار إعلان 29 يونيو 2026 واضح: Samsung وSK hynix ستستثمران 4,755 تريليون وون محلياً خلال عشر سنوات، يتمحور في جوهره حول أربعة مصانع ذاكرة في المنطقة الجنوبية الغربية بقيمة 800 تريليون وون ومراكز بيانات ذكاء اصطناعي بسعة 15 غيغاواط من SK بقيمة 1,000 تريليون وون. المحرك لكل هذا هو دورة HBM الفائقة، ونجاح المشروع مرتبط بسرعة توفير البنية التحتية للكهرباء والمياه.</p>

<p>بينما تبني كوريا أجهزة الذكاء الاصطناعي على المستوى الوطني، تتنامى معها قيمة طبقة البرمجيات التي تُشغّل هذه الأجهزة بكفاءة. وفي هذا التقاطع تحديداً، تُرسّخ ThakiCloud موقعها من خلال خدمة النماذج المبنية على Kubernetes وKueue والبنية التحتية السيادية.</p>

<h2 id="المصادر">المصادر</h2>

<ul>
  <li>Financial News، أربعة مصانع في المنطقة الجنوبية الغربية، Samsung وSK بـ4,755 تريليون وون (2026-06-29): <a href="https://www.fnnews.com/news/202606291837098645">https://www.fnnews.com/news/202606291837098645</a></li>
  <li>Newsis، Samsung وSK: 800 تريليون وون لمحور أشباه الموصلات في هونام (2026-06-29): <a href="https://www.newsis.com/view/NISX20260629_0003687807">https://www.newsis.com/view/NISX20260629_0003687807</a></li>
  <li>Aju News، مراكز بيانات الذكاء الاصطناعي بـ15 غيغاواط من SKT (2026-06-29): <a href="https://www.ajunews.com/view/20260629171803513">https://www.ajunews.com/view/20260629171803513</a></li>
  <li>Hankyung، 600 تريليون وون لـYongin و100 تريليون وون لـCheongju (2026-06-29): <a href="https://www.hankyung.com/article/2026062943107">https://www.hankyung.com/article/2026062943107</a></li>
  <li>CNBC، South Korea Samsung SK Hynix mega-projects (2026-06-29): <a href="https://www.cnbc.com/2026/06/29/samsung-sk-hynix-reported-1point3-reported-trillion-spending-plans.html">https://www.cnbc.com/2026/06/29/samsung-sk-hynix-reported-1point3-reported-trillion-spending-plans.html</a></li>
  <li>SK hynix، توقعات السوق لعام 2026 (دورة HBM الفائقة): <a href="https://news.skhynix.com/2026-market-outlook-focus-on-the-hbm-led-memory-supercycle/">https://news.skhynix.com/2026-market-outlook-focus-on-the-hbm-led-memory-supercycle/</a></li>
  <li>TrendForce، Micron ترفع الإنفاق الرأسمالي إلى 20 مليار دولار مع بيع HBM لعام 2026 بالكامل (2025-12-18): <a href="https://www.trendforce.com/news/2025/12/18/news-micron-hikes-capex-to-20b-with-2026-hbm-supply-fully-booked-hbm4-ramps-2q26/">https://www.trendforce.com/news/2025/12/18/news-micron-hikes-capex-to-20b-with-2026-hbm-supply-fully-booked-hbm4-ramps-2q26/</a></li>
  <li>Korea Policy Briefing، قانون أشباه الموصلات الخاص يُقرّ في البرلمان (2026-01-30): <a href="https://www.korea.kr/briefing/pressReleaseView.do?newsId=156742072">https://www.korea.kr/briefing/pressReleaseView.do?newsId=156742072</a></li>
</ul>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="news" /><category term="samsung" /><category term="sk-hynix" /><category term="hbm" /><category term="ai-memory" /><category term="semiconductor" /><category term="data-center" /><category term="sovereign-ai" /><category term="kubernetes" /><category term="kueue" /><summary type="html"><![CDATA[في 29 يونيو 2026، أعلنت شركتا Samsung Electronics وSK hynix عن خطط استثمارية محلية مشتركة بقيمة 4,755 تريليون وون على مدى عشر سنوات. نستعرض تفاصيل الإعلان الذي يتمحور حول أربعة مصانع ذاكرة في المنطقة الجنوبية الغربية (800 تريليون وون) ومراكز بيانات الذكاء الاصطناعي بسعة 15 غيغاواط (1,000 تريليون وون)، ونحلل دورة HBM الفائقة والبيئة السياسية وانعكاسات النمو على منصة ThakiCloud المبنية على Kubernetes وKueue.]]></summary></entry><entry xml:lang="en"><title type="html">Samsung &amp;amp; SK’s 4,755 Trillion KRW 10-Year Domestic Investment: Honam Memory Fabs to 15GW AI Data Centers</title><link href="https://thakicloud.github.io/en/news/samsung-skhynix-ai-memory-mega-investment/" rel="alternate" type="text/html" title="Samsung &amp;amp; SK’s 4,755 Trillion KRW 10-Year Domestic Investment: Honam Memory Fabs to 15GW AI Data Centers" /><published>2026-06-30T00:00:00+09:00</published><updated>2026-06-30T00:00:00+09:00</updated><id>https://thakicloud.github.io/en/news/samsung-skhynix-ai-memory-mega-investment</id><content type="html" xml:base="https://thakicloud.github.io/en/news/samsung-skhynix-ai-memory-mega-investment/"><![CDATA[<p>On June 29, 2026, a landmark figure emerged at the Cheongwadae State Guest House. Samsung Electronics and SK hynix announced plans to invest a combined 4,755 trillion KRW domestically over the next 10 years. The declaration was made in person by Samsung Chairman Lee Jae-yong and SK Group Chairman Chey Tae-won at the “Republic of Korea Great Leap, Three National Mega-Projects Public Briefing” presided over by President Lee Jae-myung.</p>

<p>This post calmly unpacks what was announced that day: what will be built, where, and at what scale; the industrial trends and policies behind the numbers; and what it all means for operators of AI infrastructure.</p>

<p><img src="/assets/images/samsung-skhynix-ai-memory-mega-investment-results-en.png" alt="Bar chart comparing Samsung and SK's 10-year domestic investment plan against the government's annual budget" /></p>

<h2 id="what-was-announced">What Was Announced</h2>

<p>The announcement was not a standalone corporate IR event. It was a declaration of a national mega-project, which President Lee framed as a “Korean-style AI industrial revolution.” Two groups are investing: Samsung Group pledged 2,655 trillion KRW and SK Group pledged 2,100 trillion KRW in domestic investment over 10 years, for a combined total of 4,755 trillion KRW, roughly 6.5 times the government’s annual budget of approximately 728 trillion KRW.</p>

<p>Chairman Lee Jae-yong named Gwangju as a candidate site for the new semiconductor complex, stating: “We are considering Gwangju as a candidate site where incentive support is expected.” Chairman Chey Tae-won emphasized his intention to transform Korea “from a country that consumes AI into a country that exports it.” SK hynix CEO Kwak Noh-jung specifically requested the application of the Semiconductor Special Act to the Yongin cluster and improvements to regional living conditions.</p>

<p>One important context: 4,755 trillion KRW represents a cumulative planned figure spread over more than 10 years, not a near-term commitment. The two companies’ current combined annual capital expenditure runs at roughly 70 trillion KRW (Samsung DS approximately 41 trillion, SK hynix approximately 29 trillion). Announcement scale and annual execution pace should be read separately.</p>

<blockquote>
  <p>USD conversion note: The announced figure is denominated in Korean won, which is the reference to use. At an exchange rate of 1,380 KRW per USD, 4,755 trillion KRW is roughly 3.4 trillion USD.</p>
</blockquote>

<h2 id="investment-structure-800-trillion-krw-southwestern-fabs-and-15gw-data-centers">Investment Structure: 800 Trillion KRW Southwestern Fabs and 15GW Data Centers</h2>

<p>Within the 4,755 trillion KRW total, the most binding commitment is the southwestern (Honam) memory fab plan. Samsung and SK will each contribute 400 trillion KRW, 800 trillion KRW in total, to build four new memory fabs (two per company). Samsung is considering Gwangju as its site. The remaining components break down as follows.</p>

<pre><code class="language-mermaid">flowchart TB
    A["Samsung &amp; SK 10-Year Domestic Investment&lt;br/&gt;4,755 Trillion KRW"] --&gt; B["Samsung Electronics&lt;br/&gt;2,655 Trillion"]
    A --&gt; C["SK Group&lt;br/&gt;2,100 Trillion"]
    B --&gt; B1["Pyeongtaek &amp; Yongin Semiconductors&lt;br/&gt;approx. 2,030 Trillion"]
    B --&gt; B2["Chungcheong HBM Packaging&lt;br/&gt;140 Trillion"]
    C --&gt; C1["AI Data Centers&lt;br/&gt;1,000 Trillion · 15GW"]
    C --&gt; C2["Yongin Semiconductors&lt;br/&gt;600 Trillion"]
    C --&gt; C3["Cheongju NAND Capacity Expansion&lt;br/&gt;100 Trillion"]
    B --&gt; D["Southwestern Memory Fabs (4 fabs)&lt;br/&gt;800 Trillion · Joint Samsung &amp; SK"]
    C --&gt; D
</code></pre>

<p>The most notable item on the SK side is the AI data center plan. Led by SKT, the group intends to spend 1,000 trillion KRW by 2035 to build 15GW of AI data centers nationwide. Given that typical capex for a 1GW data center runs roughly $1 to $3 billion, a 1,000 trillion KRW figure for 15GW is broadly consistent. In addition, SK hynix will separately invest 100 trillion KRW in expanding NAND flash capacity at its Cheongju facility. Samsung has allocated approximately 2,030 trillion KRW to Pyeongtaek and Yongin semiconductor operations and 140 trillion KRW to HBM packaging in the Chungcheong region.</p>

<h2 id="why-now-why-this-scale-the-hbm-supercycle">Why Now, Why This Scale: The HBM Supercycle</h2>

<p>The driving force behind these enormous numbers converges on a single technology: HBM, or High Bandwidth Memory. HBM is a high-value memory stacked directly onto AI accelerators, commanding a unit price five to seven times that of conventional DRAM. The global HBM market is forecast to grow from approximately $35 billion in 2025 to $54.6 to $58 billion in 2026, a jump of more than 58%.</p>

<p>The root of that demand lies in hyperscaler spending. Amazon, Microsoft, Google, Meta, and Oracle together exceeded $600 billion in AI infrastructure capex in 2026, with memory’s share of that spending rising to approximately 30%, roughly four times the 8% share seen in 2023 to 2024. Backlog from NVIDIA Blackwell and Rubin demand alone has reached hundreds of billions of dollars, and the 2026 production output of the three HBM suppliers, SK hynix, Micron, and Samsung, is effectively sold out.</p>

<p>The critical insight is that the bottleneck is capacity, not capital. The constraint is not a lack of money to build; it is a lack of fabs to build in. That is why both companies are moving toward large-scale expansion simultaneously. SK hynix posted an operating margin of 47% in Q3 2025, and that profitability is now being recycled into Yongin and Cheongju facilities, creating a virtuous cycle.</p>

<h2 id="policy-backing-the-semiconductor-special-act">Policy Backing: The Semiconductor Special Act</h2>

<p>Korea has historically supported its semiconductor industry through tax credits rather than direct cash subsidies as seen in the United States or Europe. The K-Chips Act passed in February 2025 raised the facility investment tax credit rate for large corporations from 15% to 20% and extended R&amp;D credits through 2031. The combined tax benefit for the two companies is estimated at approximately 6 trillion KRW.</p>

<p>Layered on top is the Semiconductor Special Act, passed in January 2026. This legislation creates a legal basis for the state and local governments to directly support the construction of critical industrial infrastructure including power, water, and roads. Implementation is scheduled for Q3 2026. For the 800 trillion KRW Honam fabs to actually come online, the timely delivery of power and water infrastructure under this Special Act will be the decisive variable. CEO Kwak Noh-jung’s direct request at the announcement for the Special Act to be applied to the Yongin cluster reflects exactly this concern.</p>

<h2 id="global-competition-three-hbm-suppliers-expanding-simultaneously">Global Competition: Three HBM Suppliers Expanding Simultaneously</h2>

<table>
  <thead>
    <tr>
      <th>Company</th>
      <th>Position</th>
      <th>Recent Investment</th>
      <th>HBM Status</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>SK hynix</td>
      <td>Memory No. 1</td>
      <td>Yongin 600 trillion KRW, etc.</td>
      <td>HBM share approx. 57%, HBM4 priority supply</td>
    </tr>
    <tr>
      <td>Samsung Electronics</td>
      <td>Memory challenger</td>
      <td>Pyeongtaek &amp; Yongin approx. 2,030 trillion KRW</td>
      <td>HBM share approx. 35%, 50% capacity expansion in 2026</td>
    </tr>
    <tr>
      <td>Micron</td>
      <td>Memory No. 3</td>
      <td>FY26 approx. $20 billion</td>
      <td>2026 HBM fully booked, HBM4 mass production in Q2</td>
    </tr>
    <tr>
      <td>TSMC</td>
      <td>Foundry</td>
      <td>Arizona $165 billion</td>
      <td>CoWoS packaging sold out through 2026</td>
    </tr>
  </tbody>
</table>

<p>All three HBM suppliers have their 2026 output sold out. The real question is 2027 to 2028. If sufficient Korean fab capacity is not online by then, the incremental demand for HBM4 and HBM5 could shift to Micron. On the foundry side, TSMC is committing $165 billion to Arizona alone, filling its CoWoS packaging capacity through 2026, while Intel has effectively withdrawn from HBM competition through its foundry restructuring.</p>

<h2 id="power-as-the-real-bottleneck-data-center-location-competition">Power as the Real Bottleneck: Data Center Location Competition</h2>

<p>Since Q1 2026, the primary bottleneck for AI infrastructure has shifted from chips to power. In the United States, approximately 7GW of data center projects have been delayed or cancelled due to power constraints. Paradoxically, this makes Korea’s southwestern region and parts of the Middle East, where power and land remain available, increasingly attractive.</p>

<p>SK’s plan to build 15GW of AI data centers nationwide for 1,000 trillion KRW by 2035 is not simply a real estate bet. When a memory manufacturer directly builds the data centers that will consume its HBM output, it can create its own demand and recover bargaining power in a supply chain where NVIDIA and hyperscalers currently set the terms. Samsung is moving in the same direction of vertical integration, with AI data center projects in Haenam and an AI server substrate factory in Sejong.</p>

<h2 id="market-reaction">Market Reaction</h2>

<p>Immediately following the announcement, Samsung Electronics shares closed at 323,000 KRW after volatile trading, and on June 30 SK hynix reclaimed the top position in KOSPI market capitalization from Samsung Electronics. Some analysts drew parallels to the Cisco-Microsoft reversal during the 2000 dot-com bubble and raised concerns about a market peak. However, the majority of analysts withheld judgment on simple overheating, noting that “actual earnings and the macro environment need more observation.” There is also a view that the valuation reversal is excessive, given that Samsung’s 2026 operating profit estimate (361 trillion KRW) remains higher than SK hynix’s (262 trillion KRW).</p>

<h2 id="thakicloud-perspective-the-more-hardware-scales-the-more-the-software-layer-matters">ThakiCloud Perspective: The More Hardware Scales, the More the Software Layer Matters</h2>

<p>The essence of this announcement is that Korea is vertically integrating AI infrastructure at the national level, and that connects directly to ThakiCloud’s ai-platform business.</p>

<p>As domestic AI data centers expand to 15GW, the demand for multi-tenant infrastructure to train and serve models on top of that hardware grows with it. ThakiCloud targets exactly this layer with Kubernetes and Kueue-based GPU scheduling and vLLM serving. When fabs and data centers supply the hardware, a control plane is needed to safely isolate and run multiple customers’ workloads on top of it.</p>

<p>The nature of the demand also works in our favor. National critical industries and public sector entities frequently need to operate models inside their own data centers rather than relying on external clouds, especially in security-sensitive environments. ThakiCloud’s self-hosting, multi-tenant isolation, and cost-efficient serving align precisely with this sovereign AI demand.</p>

<p>And the most important shift is this: as HBM and high-performance GPUs proliferate, the axis of competition moves from “how much did you buy” to “how efficiently can you run it.” GPU lifecycle management and queuing that prevents expensive accelerators from sitting idle ultimately determines cost. The software layer that runs the hardware created by 4,755 trillion KRW efficiently, that is exactly where ThakiCloud’s value lies.</p>

<h2 id="caveats-and-counterarguments-too-early-for-pure-optimism">Caveats and Counterarguments: Too Early for Pure Optimism</h2>

<p>Reading this announcement as unambiguously positive would be a mistake. The counterarguments deserve an honest look.</p>

<p>First, 4,755 trillion KRW is a 10-year cumulative “plan,” not an annualized figure with verified execution. The government event context may introduce upward bias, and the Yongin 622 trillion KRW cluster announced in 2024 has already experienced schedule delays. There is always a gap between announcement and execution.</p>

<p>Second, if the HBM supercycle reverses, today’s expansion becomes tomorrow’s oversupply. Memory is historically a sharply cyclical industry. If AI capex proves to be overinvestment as some analysts contend, the fabs coming online in 2027 to 2028 could coincide with a period of softening demand.</p>

<p>Third, if power and water infrastructure is not delivered on schedule, even an 800 trillion KRW fab investment will be delayed. Power is the leading cause of global data center delays, making this a concrete rather than abstract risk.</p>

<p>Finally, the valuation reversal has prompted warnings that market prices are running ahead of fundamentals. Announcement scale does not guarantee earnings.</p>

<h2 id="summary">Summary</h2>

<p>The framework of the June 29, 2026 announcement is clear. Samsung and SK will invest 4,755 trillion KRW domestically over 10 years, anchored by 800 trillion KRW in southwestern memory fabs and SK’s 15GW AI data centers. The HBM supercycle is the engine driving all of it, and success will depend on the speed of power and water infrastructure delivery.</p>

<p>As Korea builds AI hardware at national scale, the value of the software layer that runs that hardware efficiently grows alongside it. ThakiCloud is positioning itself at exactly that intersection, with K8s- and Kueue-based serving and sovereign infrastructure.</p>

<h2 id="sources">Sources</h2>

<ul>
  <li>Financial News, Southwestern Fabs Samsung &amp; SK 4,755 Trillion (2026-06-29): <a href="https://www.fnnews.com/news/202606291837098645">https://www.fnnews.com/news/202606291837098645</a></li>
  <li>Newsis, Samsung &amp; SK 800 Trillion Honam Semiconductor Hub (2026-06-29): <a href="https://www.newsis.com/view/NISX20260629_0003687807">https://www.newsis.com/view/NISX20260629_0003687807</a></li>
  <li>Aju News, SKT 15GW AI Data Centers (2026-06-29): <a href="https://www.ajunews.com/view/20260629171803513">https://www.ajunews.com/view/20260629171803513</a></li>
  <li>Hankyung, Yongin 600 Trillion &amp; Cheongju 100 Trillion (2026-06-29): <a href="https://www.hankyung.com/article/2026062943107">https://www.hankyung.com/article/2026062943107</a></li>
  <li>CNBC, South Korea Samsung SK Hynix mega-projects (2026-06-29): <a href="https://www.cnbc.com/2026/06/29/samsung-sk-hynix-reported-1point3-reported-trillion-spending-plans.html">https://www.cnbc.com/2026/06/29/samsung-sk-hynix-reported-1point3-reported-trillion-spending-plans.html</a></li>
  <li>SK hynix, 2026 Market Outlook (HBM Supercycle): <a href="https://news.skhynix.com/2026-market-outlook-focus-on-the-hbm-led-memory-supercycle/">https://news.skhynix.com/2026-market-outlook-focus-on-the-hbm-led-memory-supercycle/</a></li>
  <li>TrendForce, Micron CapEx $20B &amp; 2026 HBM booked (2025-12-18): <a href="https://www.trendforce.com/news/2025/12/18/news-micron-hikes-capex-to-20b-with-2026-hbm-supply-fully-booked-hbm4-ramps-2q26/">https://www.trendforce.com/news/2025/12/18/news-micron-hikes-capex-to-20b-with-2026-hbm-supply-fully-booked-hbm4-ramps-2q26/</a></li>
  <li>Policy Briefing, Semiconductor Special Act Passed by National Assembly (2026-01-30): <a href="https://www.korea.kr/briefing/pressReleaseView.do?newsId=156742072">https://www.korea.kr/briefing/pressReleaseView.do?newsId=156742072</a></li>
</ul>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="news" /><category term="samsung" /><category term="sk-hynix" /><category term="hbm" /><category term="ai-memory" /><category term="semiconductor" /><category term="data-center" /><category term="sovereign-ai" /><category term="kubernetes" /><category term="kueue" /><summary type="html"><![CDATA[On June 29, 2026, Samsung Electronics and SK hynix announced a combined 4,755 trillion KRW domestic investment over the next 10 years. Centered on four memory fabs in the southwestern region (800 trillion KRW) and SK's 15GW AI data center plan (1,000 trillion KRW), this post breaks down the announcement, examines the HBM supercycle and policy environment, and explores what rapidly expanding domestic AI infrastructure means for ThakiCloud's Kubernetes- and Kueue-based serving platform.]]></summary></entry><entry xml:lang="ko"><title type="html">삼성·SK, 10년간 4,755조 원 국내 투자: 호남 메모리 팹부터 15GW AI 데이터센터까지</title><link href="https://thakicloud.github.io/ko/news/samsung-skhynix-ai-memory-mega-investment/" rel="alternate" type="text/html" title="삼성·SK, 10년간 4,755조 원 국내 투자: 호남 메모리 팹부터 15GW AI 데이터센터까지" /><published>2026-06-30T00:00:00+09:00</published><updated>2026-06-30T00:00:00+09:00</updated><id>https://thakicloud.github.io/ko/news/samsung-skhynix-ai-memory-mega-investment</id><content type="html" xml:base="https://thakicloud.github.io/ko/news/samsung-skhynix-ai-memory-mega-investment/"><![CDATA[<p>2026년 6월 29일 청와대 영빈관에서 큰 숫자가 하나 나왔습니다. 삼성전자와 SK하이닉스가 앞으로 10년간 국내에 합산 4,755조 원을 투자하겠다는 계획입니다. 이재명 대통령이 주재한 “대한민국 대도약 3대 메가프로젝트 국민보고회” 자리에서 이재용 회장과 최태원 회장이 직접 선언했습니다.</p>

<p>이 글은 그날 발표된 내용을 차분히 정리합니다. 무엇을, 어디에, 얼마나 짓겠다는 것인지, 그 배경에 어떤 산업 흐름과 정책이 있는지, 그리고 이것이 AI 인프라를 운용하는 사업자에게 무엇을 의미하는지 순서대로 짚겠습니다.</p>

<p><img src="/assets/images/samsung-skhynix-ai-memory-mega-investment-results.png" alt="삼성·SK 10년 국내 투자 계획 규모를 정부 연간 예산과 비교한 막대 그래프" /></p>

<h2 id="무엇을-발표했나">무엇을 발표했나</h2>

<p>발표는 기업 단독 IR이 아니라 대통령이 “한국형 AI 산업혁명”으로 규정한 국가 메가프로젝트 선언이었습니다. 투자 주체는 두 그룹입니다. 삼성그룹이 2,655조 원, SK그룹이 2,100조 원을 향후 10년간 국내에 집행하겠다고 밝혔고, 합치면 4,755조 원입니다. 정부 연간 예산(약 728조 원)의 6.5배에 해당하는 규모입니다.</p>

<p>이재용 회장은 광주를 신규 반도체 단지 후보지로 직접 언급하며 “인센티브 지원이 기대되는 광주를 후보지로 계획 중”이라고 말했습니다. 최태원 회장은 한국을 “AI를 소비하는 나라에서 수출하는 나라로” 전환하겠다고 강조했습니다. 곽노정 SK하이닉스 CEO는 용인 클러스터의 반도체특별법 적용과 지방 정주 여건 개선을 함께 요청했습니다.</p>

<p>다만 4,755조 원은 10년 이상에 걸친 누적 계획 집행액이라는 점을 짚어둘 필요가 있습니다. 두 회사의 현재 연간 설비투자 합계는 약 70조 원대(삼성 DS 약 41조, SK하이닉스 약 29조)입니다. 발표 규모와 연간 집행 속도는 구분해서 봐야 합니다.</p>

<blockquote>
  <p>달러 환산 참고: 발표 금액의 기준은 원화입니다. 1달러=1,380원으로 환산하면 4,755조 원은 약 3조 4,000억 달러 규모입니다.</p>
</blockquote>

<h2 id="투자-구조-서남권-800조-팹과-15gw-데이터센터">투자 구조: 서남권 800조 팹과 15GW 데이터센터</h2>

<p>총계 4,755조 원 안에서 가장 구속력 있는 약정은 서남권(호남) 메모리 팹입니다. 삼성과 SK가 각각 400조 원씩, 합쳐서 800조 원을 투입해 메모리 팹 4기(각사 2기)를 신설합니다. 삼성은 광주를 후보지로 보고 있습니다. 나머지 항목은 다음과 같이 구성됩니다.</p>

<pre><code class="language-mermaid">flowchart TB
    A["삼성·SK 10년 국내 투자&lt;br/&gt;4,755조 원"] --&gt; B["삼성전자&lt;br/&gt;2,655조"]
    A --&gt; C["SK그룹&lt;br/&gt;2,100조"]
    B --&gt; B1["평택·용인 반도체&lt;br/&gt;약 2,030조"]
    B --&gt; B2["충청 HBM 패키징&lt;br/&gt;140조"]
    C --&gt; C1["AI 데이터센터&lt;br/&gt;1,000조 · 15GW"]
    C --&gt; C2["용인 반도체&lt;br/&gt;600조"]
    C --&gt; C3["청주 낸드 증산&lt;br/&gt;100조"]
    B --&gt; D["서남권 메모리 팹 4기&lt;br/&gt;800조 · 양사 공동"]
    C --&gt; D
</code></pre>

<p>SK 쪽에서 눈여겨볼 항목은 AI 데이터센터입니다. SKT가 주도해 2035년까지 1,000조 원을 들여 전국 15GW 규모의 AI 데이터센터를 구축하겠다는 계획입니다. 데이터센터 1GW 건설 캐펙스가 통상 10억~30억 달러 수준임을 고려하면, 15GW에 1,000조 원이라는 규모는 대략 정합합니다. 여기에 SK하이닉스의 청주 낸드플래시 증산(100조 원)이 별도로 더해집니다. 삼성은 평택·용인 반도체에 약 2,030조 원, 충청 HBM 패키징에 140조 원을 배정했습니다.</p>

<h2 id="왜-지금-이렇게-큰-규모인가-hbm-슈퍼사이클">왜 지금, 이렇게 큰 규모인가: HBM 슈퍼사이클</h2>

<p>이 거대한 숫자의 동력은 한 가지로 수렴합니다. HBM, 고대역폭메모리 수요입니다. HBM은 AI 가속기에 적층 탑재되는 고부가 메모리로, 일반 DRAM보다 단가가 5~7배 높습니다. 글로벌 HBM 시장은 2025년 약 350억 달러에서 2026년 약 546억~580억 달러로, 58% 이상 성장이 전망됩니다.</p>

<p>수요의 뿌리는 하이퍼스케일러의 지출입니다. 아마존·마이크로소프트·구글·메타·오라클의 2026년 AI 인프라 캐펙스는 6,000억 달러를 넘어섰고, 그중 메모리가 차지하는 비중이 약 30%까지 올라왔습니다. 2023~2024년의 8%에서 약 4배로 뛴 수치입니다. NVIDIA의 Blackwell·Rubin 수요만으로 수천억 달러 규모의 수주 잔고가 쌓였고, 세 HBM 공급사인 SK하이닉스·마이크론·삼성의 2026년 생산분은 사실상 완판된 상태입니다.</p>

<p>핵심은 이 병목이 자본 부족이 아니라 생산 용량 부족에서 온다는 점입니다. 돈이 없어서 못 만드는 것이 아니라 팹이 부족해서 못 만드는 상황입니다. 그래서 두 회사가 동시에 대규모 증설로 향하는 것입니다. SK하이닉스는 2025년 3분기 영업이익률 47%를 기록했고, 이 수익이 용인·청주 설비로 재투입되는 선순환 구조를 만들었습니다.</p>

<h2 id="정책이-받쳐주는-구조-반도체-특별법">정책이 받쳐주는 구조: 반도체 특별법</h2>

<p>한국은 미국이나 유럽처럼 현금 보조금을 직접 주는 대신 세액공제 중심으로 반도체를 지원해왔습니다. 2025년 2월 통과된 K-칩스법은 대기업 시설투자 세액공제율을 15%에서 20%로 올렸고, R&amp;D 공제를 2031년까지 연장했습니다. 두 회사 합산 약 6조 원의 감세 효과로 추산됩니다.</p>

<p>여기에 2026년 1월 통과된 반도체 특별법이 더해졌습니다. 이 법은 전력·용수·도로 같은 산업기반시설 조성에 국가와 지자체가 직접 지원할 근거를 마련했습니다. 시행은 2026년 3분기 예정입니다. 이번 800조 원 호남 팹이 실제로 가동되려면 이 특별법에 따른 전력·용수 인프라의 적기 공급이 결정적 변수입니다. 곽노정 CEO가 발표 자리에서 용인 클러스터의 특별법 적용을 직접 요청한 것도 이 때문입니다.</p>

<h2 id="글로벌-경쟁-세-hbm-공급사의-동시-증설">글로벌 경쟁: 세 HBM 공급사의 동시 증설</h2>

<table>
  <thead>
    <tr>
      <th>기업</th>
      <th>위치</th>
      <th>최근 투자</th>
      <th>HBM 상황</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>SK하이닉스</td>
      <td>메모리 1위</td>
      <td>용인 600조 등</td>
      <td>HBM 점유 약 57%, HBM4 우선공급</td>
    </tr>
    <tr>
      <td>삼성전자</td>
      <td>메모리 추격</td>
      <td>평택·용인 약 2,030조</td>
      <td>HBM 점유 약 35%, 2026년 50% 증설</td>
    </tr>
    <tr>
      <td>마이크론</td>
      <td>메모리 3위</td>
      <td>FY26 약 200억 달러</td>
      <td>2026년 HBM 완판, HBM4 2분기 양산</td>
    </tr>
    <tr>
      <td>TSMC</td>
      <td>파운드리</td>
      <td>애리조나 1,650억 달러</td>
      <td>CoWoS 패키징 2026년 매진</td>
    </tr>
  </tbody>
</table>

<p>세 HBM 공급사 모두 2026년 생산분이 매진된 상황입니다. 문제는 2027~2028년입니다. 이때 가동될 한국 팹이 충분하지 않으면 HBM4·HBM5 수요 증가분을 마이크론에 내줄 수 있습니다. 파운드리 쪽에서는 TSMC가 애리조나에만 1,650억 달러를 투입하며 CoWoS 패키징 용량을 2026년까지 매진시켰고, 인텔은 파운드리 구조조정으로 HBM 경쟁에서 사실상 이탈했습니다.</p>

<h2 id="전력이-진짜-병목-데이터센터의-입지-경쟁">전력이 진짜 병목: 데이터센터의 입지 경쟁</h2>

<p>2026년 1분기부터 AI 인프라의 핵심 병목은 칩이 아니라 전력으로 이동했습니다. 미국에서는 약 7GW 규모의 데이터센터 프로젝트가 전력 부족으로 지연되거나 취소됐습니다. 역설적으로 이는 전력과 토지를 확보할 수 있는 한국 서남권과 중동의 입지 매력을 높입니다.</p>

<p>SK가 2035년까지 1,000조 원을 들여 전국 15GW급 AI 데이터센터를 짓겠다는 것은 단순한 부동산 투자가 아닙니다. 메모리 제조사가 자신이 HBM을 납품하는 데이터센터를 직접 구축하면, 수요를 스스로 창출하고 NVIDIA와 하이퍼스케일러가 사양을 결정하는 공급망 구조에서 협상력을 회복할 수 있습니다. 삼성도 해남 AI 데이터센터, 세종 AI 서버 기판 공장 등으로 같은 수직통합 방향을 향하고 있습니다.</p>

<h2 id="시장-반응">시장 반응</h2>

<p>발표 직후 삼성전자 주가는 등락 끝에 323,000원에 마감했고, 6월 30일에는 SK하이닉스가 삼성전자를 제치고 코스피 시총 1위를 탈환했습니다. 일부 전문가는 2000년 닷컴 버블 당시 시스코-마이크로소프트 역전과 비교하며 고점 신호를 거론했으나, 다수 애널리스트는 “실적과 매크로를 더 지켜봐야 한다”며 단순 과열 판단을 유보했습니다. 삼성의 2026년 영업이익 추정치(361조 원)가 SK하이닉스(262조 원)보다 높아 밸류에이션 역전이 과도하다는 시각도 있습니다.</p>

<h2 id="thakicloud-관점-하드웨어가-늘수록-소프트웨어-계층이-중요해집니다">ThakiCloud 관점: 하드웨어가 늘수록 소프트웨어 계층이 중요해집니다</h2>

<p>이 발표의 본질은 한국이 AI 인프라를 국가 차원에서 수직통합한다는 것이며, 이는 ThakiCloud의 ai-platform 사업과 직접 맞닿습니다.</p>

<p>국내 AI 데이터센터가 15GW 규모로 확장되면 그 위에서 모델을 학습하고 서빙할 멀티테넌트 인프라 수요가 함께 커집니다. ThakiCloud는 Kubernetes와 Kueue 기반 GPU 스케줄링, vLLM 서빙으로 바로 이 계층을 겨냥합니다. 팹과 데이터센터가 하드웨어를 공급하면, 그 위에서 여러 고객의 워크로드를 안전하게 격리하며 굴리는 제어 평면이 필요해집니다.</p>

<p>수요의 성격도 우리에게 유리합니다. 국가 기간산업과 공공 영역은 외부 클라우드가 아니라 자체 데이터센터 안에서 모델을 운용해야 하는 경우가 많습니다. 보안 요구가 까다로운 환경일수록 그렇습니다. ThakiCloud의 self-hosting, 멀티테넌트 격리, 비용효율 서빙은 이 소버린 AI 수요에 정확히 부합합니다.</p>

<p>그리고 가장 중요한 변화가 있습니다. HBM과 고성능 GPU가 늘어날수록 경쟁의 축은 “얼마나 많이 샀는가”에서 “얼마나 효율적으로 굴리는가”로 옮겨갑니다. 값비싼 가속기를 놀리지 않게 하는 GPU 라이프사이클 관리와 큐잉이 결국 비용을 좌우합니다. 4,755조 원이 만들어낼 하드웨어를 효율적으로 굴리는 소프트웨어 계층, 바로 그곳에 ThakiCloud가 제공하는 가치가 있습니다.</p>

<h2 id="한계와-반론-낙관만-하기엔-이릅니다">한계와 반론: 낙관만 하기엔 이릅니다</h2>

<p>이 발표를 무조건 호재로만 읽는 것은 위험합니다. 반대 방향의 근거를 정직하게 짚겠습니다.</p>

<p>먼저 4,755조 원은 10년 누적 “계획”이며 연간 집행이 검증된 숫자가 아닙니다. 정부 행사라는 특성상 상향 편향이 있을 수 있고, 과거 2024년에 발표된 용인 622조 클러스터도 일정 지연을 겪었습니다. 발표와 집행 사이에는 늘 간극이 있습니다.</p>

<p>다음으로 HBM 슈퍼사이클이 꺾이면 오늘의 증설은 내일의 공급과잉이 됩니다. 메모리는 역사적으로 사이클이 가파른 산업입니다. AI 캐펙스가 일부 분석대로 과투자라면, 2027~2028년 가동될 팹이 하필 수요 둔화기와 겹칠 수 있습니다.</p>

<p>전력·용수 인프라가 제때 공급되지 않으면 800조 원을 들인 팹도 가동이 미뤄집니다. 글로벌 데이터센터 지연의 주원인이 전력인 만큼 이는 추상적 우려가 아니라 실질적 리스크입니다.</p>

<p>마지막으로 시총 역전을 두고 밸류에이션이 실적을 앞서간다는 경고가 나옵니다. 발표의 규모가 곧 실적을 보장하지는 않습니다.</p>

<h2 id="정리">정리</h2>

<p>2026년 6월 29일 발표의 골격은 명확합니다. 삼성과 SK가 10년간 4,755조 원을 국내에 투자하며, 그 중심에는 서남권 800조 메모리 팹과 SK의 15GW AI 데이터센터가 있습니다. 이 모든 것을 끌어가는 동력은 HBM 슈퍼사이클이고, 성패는 전력·용수 인프라의 속도에 달려 있습니다.</p>

<p>한국이 AI 하드웨어를 국가 규모로 짓는 동안, 그 하드웨어를 효율적으로 굴리는 소프트웨어 계층의 가치는 함께 커집니다. ThakiCloud는 바로 그 지점에서 K8s·Kueue 기반 서빙과 소버린 인프라로 자리를 잡아가고 있습니다.</p>

<h2 id="출처">출처</h2>

<ul>
  <li>파이낸셜뉴스, 서남권 팹 4기 삼성·SK 4,755조 (2026-06-29): <a href="https://www.fnnews.com/news/202606291837098645">https://www.fnnews.com/news/202606291837098645</a></li>
  <li>뉴시스, 삼성·SK 800조 호남 반도체 허브 (2026-06-29): <a href="https://www.newsis.com/view/NISX20260629_0003687807">https://www.newsis.com/view/NISX20260629_0003687807</a></li>
  <li>아주경제, SKT 15GW AI 데이터센터 (2026-06-29): <a href="https://www.ajunews.com/view/20260629171803513">https://www.ajunews.com/view/20260629171803513</a></li>
  <li>한국경제, 용인 600조·청주 100조 (2026-06-29): <a href="https://www.hankyung.com/article/2026062943107">https://www.hankyung.com/article/2026062943107</a></li>
  <li>CNBC, South Korea Samsung SK Hynix mega-projects (2026-06-29): <a href="https://www.cnbc.com/2026/06/29/samsung-sk-hynix-reported-1point3-reported-trillion-spending-plans.html">https://www.cnbc.com/2026/06/29/samsung-sk-hynix-reported-1point3-reported-trillion-spending-plans.html</a></li>
  <li>SK hynix, 2026 Market Outlook (HBM Supercycle): <a href="https://news.skhynix.com/2026-market-outlook-focus-on-the-hbm-led-memory-supercycle/">https://news.skhynix.com/2026-market-outlook-focus-on-the-hbm-led-memory-supercycle/</a></li>
  <li>TrendForce, Micron CapEx $20B·2026 HBM booked (2025-12-18): <a href="https://www.trendforce.com/news/2025/12/18/news-micron-hikes-capex-to-20b-with-2026-hbm-supply-fully-booked-hbm4-ramps-2q26/">https://www.trendforce.com/news/2025/12/18/news-micron-hikes-capex-to-20b-with-2026-hbm-supply-fully-booked-hbm4-ramps-2q26/</a></li>
  <li>정책브리핑, 반도체 특별법 국회 통과 (2026-01-30): <a href="https://www.korea.kr/briefing/pressReleaseView.do?newsId=156742072">https://www.korea.kr/briefing/pressReleaseView.do?newsId=156742072</a></li>
</ul>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="news" /><category term="samsung" /><category term="sk-hynix" /><category term="hbm" /><category term="ai-memory" /><category term="semiconductor" /><category term="data-center" /><category term="sovereign-ai" /><category term="kubernetes" /><category term="kueue" /><summary type="html"><![CDATA[2026년 6월 29일 삼성전자와 SK하이닉스가 향후 10년간 국내에 합산 4,755조 원을 투자한다고 발표했습니다. 서남권 메모리 팹 4기(800조), SK의 15GW AI 데이터센터(1,000조)를 중심으로 발표 내용을 정리하고, HBM 슈퍼사이클과 정책 환경, 그리고 국내 AI 인프라 수요가 ThakiCloud의 K8s·Kueue 기반 서빙 플랫폼에 무엇을 의미하는지 살펴봅니다.]]></summary></entry></feed>