<?xml version="1.0" encoding="utf-8"?><feed xmlns="http://www.w3.org/2005/Atom" ><generator uri="https://jekyllrb.com/" version="4.4.1">Jekyll</generator><link href="https://thakicloud.github.io/feed.xml" rel="self" type="application/atom+xml" /><link href="https://thakicloud.github.io/" rel="alternate" type="text/html" /><updated>2026-07-05T09:32:58+09:00</updated><id>https://thakicloud.github.io/feed.xml</id><title type="html">Thaki Cloud Tech Blog | ThakiCloud | 다키클라우드 기술 블로그</title><subtitle>Thaki Cloud (ThakiCloud, 다키클라우드, thaki cloud, THAKI CLOUD, ثاكي كلاود)는 AI/ML Engineering, LLMOps, DevOps 분야의 최신 기술과 실무 경험을 공유하는 전문 기술 블로그입니다. 머신러닝 모델 운영, 쿠버네티스, 클라우드 인프라, AI 엔지니어링 커리어, 인공지능 기술 블로그, 다키클라우드 개발 팀의 깊이 있는 인사이트를 제공합니다. مدونة تقنية متخصصة في هندسة الذكاء الاصطناعي والحوسبة السحابية.</subtitle><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><entry xml:lang="en"><title type="html">Speccing a Stack Like a Doctor’s Breakfast</title><link href="https://thakicloud.github.io/en/comics/doctor-breakfast-stack-diet/" rel="alternate" type="text/html" title="Speccing a Stack Like a Doctor’s Breakfast" /><published>2026-07-05T00:00:00+09:00</published><updated>2026-07-05T00:00:00+09:00</updated><id>https://thakicloud.github.io/en/comics/doctor-breakfast-stack-diet</id><content type="html" xml:base="https://thakicloud.github.io/en/comics/doctor-breakfast-stack-diet/"><![CDATA[<p>A “doctor-recommended breakfast” list made the rounds this week: warm water, a boiled egg, unsweetened milk, cabbage, blueberries, a tomato. A validated combo you just follow. Paxis and Metis take it somewhere odd — what if you specced your AI stack the same way, only the healthy parts? The catch was never the ingredients. It’s who owns the fridge. Sovereignty means keeping your models, data, and infrastructure under your own control instead of a landlord’s, and on-prem means running that stack inside your own facility rather than renting someone else’s.</p>

<p><img src="/assets/images/posts/comics/doctor-breakfast-stack-diet/strip.png" alt="Speccing a Stack Like a Doctor's Breakfast" /></p>

<blockquote>
  <p>Source: <a href="https://x.com/hjguyhan/status/2073308927132057815">RT @dailyonjeje: 의사 협회에서 뽑은 최고의 아침식사래.</a> · twitter</p>
</blockquote>

<h2 id="what-this-means-for-thakicloud">What this means for ThakiCloud</h2>

<p>A healthy breakfast comes down to who holds the fridge key, not the ingredients. AI infrastructure is no different. Paxis lets you deploy as many agents as you need inside your own facility, instead of a public cloud that meters every bot that boils an egg. Metis runs inference and training on your own GPUs rather than someone else’s fridge, so you skip the per-berry billing. With an on-prem, sovereign stack you pick the menu and you can actually predict the check. What ThakiCloud sells isn’t a lease on someone else’s kitchen. It’s the kitchen, with no invoice attached.</p>

<hr />

<p><em>An auto-generated comic riffing on this week’s industry news.</em></p>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="comics" /><category term="온프렘" /><category term="주권AI" /><category term="비용" /><category term="파시스" /><category term="메티스" /><category term="병맛" /><summary type="html"><![CDATA[A perfectly healthy combo — pity someone else holds the fridge key.]]></summary><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://thakicloud.github.io/assets/images/posts/comics/doctor-breakfast-stack-diet/strip.png" /><media:content medium="image" url="https://thakicloud.github.io/assets/images/posts/comics/doctor-breakfast-stack-diet/strip.png" xmlns:media="http://search.yahoo.com/mrss/" /></entry><entry xml:lang="ko"><title type="html">모델을 국산화해도 주권은 오지 않습니다: 오늘 뉴스가 가리키는 ‘실행 계층</title><link href="https://thakicloud.github.io/ko/agentops/sovereign-ai-execution-layer/" rel="alternate" type="text/html" title="모델을 국산화해도 주권은 오지 않습니다: 오늘 뉴스가 가리키는 ‘실행 계층" /><published>2026-07-05T00:00:00+09:00</published><updated>2026-07-05T00:00:00+09:00</updated><id>https://thakicloud.github.io/ko/agentops/sovereign-ai-execution-layer</id><content type="html" xml:base="https://thakicloud.github.io/ko/agentops/sovereign-ai-execution-layer/"><![CDATA[<p>한 인터뷰의 문장 하나가 오늘 아침 다이제스트 전체를 다시 읽게 만들었습니다. 고려대와 경기대에서 강의하는 최윤성 겸임교수는 앤트로픽의 차세대 모델 ‘미토스’를 예로 들며, AI가 전략 자산이 되는 순간 동맹국이라도 모델 접근권이 언제든 끊길 수 있다고 지적했습니다. 그리고 이렇게 정리했습니다. “통제 가능한 것은 남의 모델이 아니라, 어떤 모델을 쓰든 공급망을 검증하고 차단할 수 있는 인프라다.”</p>

<p>이 한 문장이 왜 오늘의 뉴스 묶음을 관통하는지, 지금부터 하나씩 풀어보겠습니다.</p>

<h2 id="우리-모델이라는-착시">“우리 모델”이라는 착시</h2>

<p>소버린 AI라고 하면 대부분 같은 그림을 떠올립니다. 우리 손으로 만든 파운데이션 모델입니다. 실제로 정부는 5,300억 원 규모의 독자 파운데이션 모델 사업을 추진하고 있습니다. LG AI연구원, SK텔레콤, 업스테이지, 모티프테크놀로지스 네 팀이 6개월 단위로 경쟁하고, 8월 2차 평가를 거쳐 오픈소스로 전면 공개될 예정입니다. 목표는 2027년까지 세계 10위권 모델을 확보하는 것입니다.</p>

<p>여기까지만 보면 주권의 문제는 곧 모델의 문제처럼 보입니다. 그런데 오늘 다이제스트는 정반대 방향을 가리킵니다. 최 교수의 진단이 날카로운 지점이 바로 여기입니다. 모델을 국산화해도, 그 모델을 돌리는 학습 데이터와 GPU, 클라우드, 에이전트 도구가 전부 외부 생태계에 묶여 있다면 주권은 절반짜리라는 것입니다. 그는 기존 SBOM이나 SCA 같은 보안 도구가 모델 가중치처럼 코드가 아닌 자산을 읽지 못하는 가시성 공백을 지적하면서, 가중치와 학습 데이터셋, 하이퍼파라미터, 에이전트 도구 명세까지 담는 AI 자재명세서(AIBOM)를 대안으로 제시했습니다.</p>

<p>정리하면 이렇습니다. 모델은 화려한 간판이지만, 주권이 실제로 결정되는 곳은 그 모델이 살아 움직이는 바탕, 즉 실행 계층입니다. 오늘 뉴스에 등장한 여러 기업의 선택이 약속이라도 한 듯 이 지점을 향합니다.</p>

<h2 id="한컴은-왜-모델이-아니라-os라고-말했나">한컴은 왜 ‘모델’이 아니라 ‘OS’라고 말했나</h2>

<p>가장 상징적인 사건은 한컴입니다. 창립 36년 만인 지난 7월 2일 임시 주주총회에서 ‘한글과컴퓨터’라는 이름을 ‘한컴’으로 바꾸는 정관 개정안을 의결했습니다. 단순한 리브랜딩이 아닙니다. 문서 소프트웨어 회사에서 여러 AI 에이전트를 하나의 환경에서 연결하고 통제하는 ‘소버린 에이전틱 OS’ 기업으로 정체성을 옮기겠다는 선언이었습니다.</p>

<p>주목할 단어는 ‘OS’입니다. 한컴은 자기들이 만들 것을 ‘모델’이라 부르지 않았습니다. 운영체제라고 불렀습니다. 여러 에이전트를 안전하게 구동하고 통제하는 바탕을 겨냥한다는 뜻입니다. 하반기 베타를 예고했고, 폴란드 국가공인 연구센터와 유럽 현지화 공동연구에도 착수했습니다. 이 전환은 숫자로도 뒷받침됩니다. 지난해 89억 원으로 전체 매출의 5% 수준이던 AI 패키지 매출이 올해 1분기에는 52억 원, 비중 11.52%로 뛰었습니다.</p>

<p>같은 결의 움직임이 KT에서도 보입니다. KT는 서빙 로봇 약 4,000대를 통째로 매각하고 재임대하는 구조로 바꾸며 하드웨어 소유에서 손을 뗐습니다. 대신 제조사가 다른 로봇들을 한 화면에서 통합 제어하는 클라우드 운영 플랫폼에 베팅했습니다. 로봇을 파는 대신, 로봇들이 함께 돌아가는 바탕을 장악하겠다는 계산입니다. 파는 물건은 다르지만 방향은 같습니다. 개별 제품이 아니라 오케스트레이션 계층에서 가치가 나온다고 본 것입니다.</p>

<h2 id="모델은-들어왔는데-왜-여전히-불안한가">모델은 들어왔는데, 왜 여전히 불안한가</h2>

<p>바탕이 왜 중요한지는 그 바탕이 흔들릴 때 가장 선명해집니다. 오늘 다이제스트의 두 기사가 그 장면을 보여줍니다.</p>

<p>먼저 금융권입니다. 지난해 은행권 금융사고 규모는 4,318억 원으로 역대 최고를 기록했습니다. 부천의 한 새마을금고에서는 242억 원 규모 불법 대출이 수년간 잡히지 않았습니다. 그래서 은행들은 앞다퉈 AI 이상거래탐지시스템을 도입하고 있습니다. 카카오뱅크는 시퀀스 탐지 모델을 적용한 뒤 금융사기 예방 건수가 월평균 4.4배 늘었다고 합니다. 여기까지는 성공담입니다.</p>

<p>문제는 그다음입니다. 국내 금융사 중 AI 모델을 자체 개발한 곳은 10%에 불과하고, 그중 다시 3분의 1은 클라우드 인프라와 모델, 데이터를 전부 외부 공급자에 의존합니다. 민감한 거래 데이터를 다루는 이상탐지 시스템이 정작 남의 바탕 위에서 돌아가는 셈입니다. 모델을 도입하는 것과 그 모델을 내 통제 아래 두는 것은 전혀 다른 문제입니다.</p>

<p>애플 협력사 사고는 이 불안의 극단을 보여줍니다. 아이폰 협력사 타타 일렉트로닉스가 랜섬웨어 공격을 받아 630GB, 20만여 개 파일이 다크웹에 공개됐습니다. 아이폰 신제품 공급업체 목록과 프로토타입 시험 사진까지 포함됐다고 합니다. 인도 정부의 침해대응팀이 조사에 착수했습니다. 눈여겨볼 대목은 이 패턴이 처음이 아니라는 점입니다. 2023년 TSMC의 IT 협력사, 2022년 도요타의 부품 협력사가 똑같이 뚫렸습니다. 본사가 아니라 협력사가 통로가 됩니다. 데이터가 여러 곳에 흩어져 협업 시스템에 얹혀 있는 한, 아무리 좋은 모델을 국산으로 만들어도 정보는 가장 약한 연결 고리에서 새어 나갑니다. 상반기 가상자산 해킹 피해의 66%가 북한 소행이었다는 오늘의 또 다른 기사는, 실행 계층의 취약성이 이미 국가 단위 위협의 표적이 되었음을 확인해 줍니다.</p>

<h2 id="통제할-수-있는-것은-바탕뿐입니다">통제할 수 있는 것은 바탕뿐입니다</h2>

<p>이 지점에서 최 교수의 문장으로 돌아가 봅니다. 통제 가능한 것은 남의 모델이 아니라, 어떤 모델을 쓰든 공급망을 검증하고 차단할 수 있는 인프라입니다. 뉴스가 던진 기업의 통증을 정리하면 네 가지로 좁혀집니다. 무엇이 실행되는지 감사할 수 있는가, 데이터와 실행을 내 주권 아래 둘 수 있는가, 한 곳이 뚫려도 전체로 번지지 않게 격리되는가, 그리고 이 모든 것을 감당 가능한 비용으로 운영할 수 있는가.</p>

<p>ThakiCloud가 Paxis를 Agent-Native Cloud로 설계한 이유가 바로 이 네 가지 질문에 있습니다. Paxis는 스킬과 도구, 정책, 감사 로그를 일급 리소스로 다룹니다. 에이전트가 무엇을 실행하는지 정책 게이트가 사전에 거르고, 실제로 무엇을 했는지 감사 로그가 사후에 남깁니다. 최 교수가 말한 AIBOM식 공급망 투명성이 지향하는 그림과 같은 방향입니다. 에이전트의 자율도를 L0에서 L3까지 등급으로 나눠 거버넌스를 거는 구조는, 금융권이 요구하는 통제 가능성을 계층 그 자체로 구현한 것입니다. 협업 워크로드를 격리 샌드박스에서 실행하는 방식은 애플 협력사 사고 같은 연쇄 유출을 물리적으로 끊어냅니다. 그리고 소버린 온프렘 쿠버네티스 위에서 돌아가기에, 민감 데이터를 외부 네트워크로 내보내지 않고 폐쇄망 안에 둘 수 있습니다. 작업마다 최적의 모델을 고르는 비용 라우팅은 네 번째 질문, 즉 지속 가능성에 대한 답입니다.</p>

<p>한컴이 굳이 사명을 바꿔가며 ‘OS’라는 단어를 고른 것도, KT가 로봇을 팔지 않고 플랫폼에 건 것도 결국 같은 통찰의 다른 표현입니다. 에이전트 시대의 가치는 개별 모델이 아니라, 에이전트가 살고 일하는 바탕에서 나옵니다. Paxis는 그 바탕을 감사 가능하고 주권적인 형태로 제공하는 제품입니다.</p>

<h2 id="화려한-것은-모델-결정되는-것은-바탕">화려한 것은 모델, 결정되는 것은 바탕</h2>

<p>오늘 하루에도 D램 슈퍼사이클과 1천조 원 데이터센터 전쟁, 빅테크의 자체 칩 경쟁 같은 굵직한 뉴스가 쏟아졌습니다. 헤드라인은 언제나 모델과 칩이 가져갑니다. 그러나 기업의 실무자가 밤에 잠 못 이루는 이유는 조금 다릅니다. 우리 에이전트가 지금 무엇을 하고 있는지 설명할 수 있는가, 사고가 나면 어디서 시작됐는지 추적할 수 있는가, 이 데이터가 정말 우리 손 안에 있는가 하는 질문입니다.</p>

<p>주권은 선언으로 완성되지 않습니다. 우리 모델을 만들었다는 사실만으로도 완성되지 않습니다. 그 모델이 어디서 실행되고, 무엇을 하도록 허락받았으며, 무슨 일을 했는지 언제든 열어볼 수 있을 때 비로소 주권이라 부를 수 있습니다. 오늘 뉴스가 조용히 가리키는 곳은 화려한 모델이 아니라, 그 아래 놓인 바탕입니다. 그리고 그 바탕을 먼저 다지는 쪽이 다음 라운드의 주도권을 쥐게 될 것입니다.</p>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="agentops" /><category term="agentops" /><category term="paxis" /><category term="enterprise-ai" /><category term="thakicloud" /><summary type="html"><![CDATA[독파모부터 한컴의 사명 변경까지, 2026년 7월 5일 아침 뉴스는 하나의 방향을 가리킵니다. 소버린 AI의 승부처는 '어떤 모델을 만드느냐'가 아니라 '그 모델을 어디서 어떻게 실행하고 감사하느냐'로 이미 옮겨갔습니다.]]></summary></entry><entry xml:lang="ko"><title type="html">의사 추천 아침식사로 스택 짜기ㅋ</title><link href="https://thakicloud.github.io/ko/%EB%A7%8C%ED%99%94/doctor-breakfast-stack-diet/" rel="alternate" type="text/html" title="의사 추천 아침식사로 스택 짜기ㅋ" /><published>2026-07-05T00:00:00+09:00</published><updated>2026-07-05T00:00:00+09:00</updated><id>https://thakicloud.github.io/ko/%EB%A7%8C%ED%99%94/doctor-breakfast-stack-diet</id><content type="html" xml:base="https://thakicloud.github.io/ko/%EB%A7%8C%ED%99%94/doctor-breakfast-stack-diet/"><![CDATA[<p>의사협회가 추천했다는 아침식사 목록이 타임라인을 한 바퀴 돌았습니다. 미지근한 물, 삶은 달걀, 무가당 우유, 양배추, 블루베리, 토마토. 검증된 조합을 그대로 따르기만 하면 되는 셈이죠. 파시스와 메티스는 여기서 엉뚱한 질문을 던집니다. AI 스택도 이렇게 몸에 좋은 것만 골라 담으면 되지 않겠냐고요. 그런데 진짜 문제는 재료가 아니라 그 냉장고를 누가 쥐고 있느냐에 있습니다. 주권은 모델과 데이터와 인프라를 남이 아니라 내 통제 아래 두는 것을 말하고, 온프렘은 그 스택을 남의 시설이 아닌 자기 시설 안에서 직접 돌리는 방식입니다.</p>

<p><img src="/assets/images/posts/만화/doctor-breakfast-stack-diet/strip.png" alt="의사 추천 아침식사로 스택 짜기ㅋ" /></p>

<blockquote>
  <p>원 뉴스: <a href="https://x.com/hjguyhan/status/2073308927132057815">RT @dailyonjeje: 의사 협회에서 뽑은 최고의 아침식사래.</a> · twitter</p>
</blockquote>

<h2 id="thakicloud-제품-적용-시사점">ThakiCloud 제품 적용 시사점</h2>

<p>건강한 아침의 핵심은 재료가 아니라 냉장고 열쇠를 누가 쥐느냐에 있습니다. AI 인프라도 다르지 않습니다. 파시스는 달걀 삶는 봇 하나까지 과금하는 퍼블릭클라우드 대신, 필요한 에이전트를 우리 시설 안에서 마음껏 풀도록 설계됐습니다. 메티스는 추론과 학습을 외부 냉장고가 아니라 자체 GPU 위에서 돌려, 블루베리 한 줌 클릭당 과금 같은 종량 폭탄에서 벗어나게 합니다. 온프렘 주권형 스택이라면 메뉴도 내가 정하고 계산서도 내가 예측합니다. ThakiCloud가 파는 건 남의 부엌 사용권이 아니라, 청구서가 붙지 않는 내 부엌 그 자체입니다.</p>

<hr />

<p><em>이 만화는 업계 뉴스를 바탕으로 자동 생성된 초안입니다.</em></p>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="만화" /><category term="온프렘" /><category term="주권AI" /><category term="비용" /><category term="파시스" /><category term="메티스" /><category term="병맛" /><summary type="html"><![CDATA[몸에 좋은 조합만 골라 담았는데, 냉장고 열쇠는 왜 쟤가 쥐고 있냐.]]></summary><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://thakicloud.github.io/assets/images/posts/%EB%A7%8C%ED%99%94/doctor-breakfast-stack-diet/strip.png" /><media:content medium="image" url="https://thakicloud.github.io/assets/images/posts/%EB%A7%8C%ED%99%94/doctor-breakfast-stack-diet/strip.png" xmlns:media="http://search.yahoo.com/mrss/" /></entry><entry xml:lang="ar"><title type="html">أنت لا تتبنّى الوكلاء، بل تفتقر إلى مستوى تحكّم لتشغيلهم</title><link href="https://thakicloud.github.io/ar/agentops/enterprise-agents-need-control-plane/" rel="alternate" type="text/html" title="أنت لا تتبنّى الوكلاء، بل تفتقر إلى مستوى تحكّم لتشغيلهم" /><published>2026-07-04T00:00:00+09:00</published><updated>2026-07-04T00:00:00+09:00</updated><id>https://thakicloud.github.io/ar/agentops/enterprise-agents-need-control-plane</id><content type="html" xml:base="https://thakicloud.github.io/ar/agentops/enterprise-agents-need-control-plane/"><![CDATA[<h2 id="من-العرض-التوضيحي-إلى-المناوبة-الليلية">من العرض التوضيحي إلى المناوبة الليلية</h2>

<p>يكفي أن تقرأ أخبار الذكاء الاصطناعي المحلية ليوم واحد من النصف الأول من هذا العام حتى يتّضح المسار. تدفع شركات التأمين الذكاء الاصطناعي إلى ما هو أبعد من الردّ على الاستفسارات، نحو أعمال جوهرية مثل تقدير نسبة الخطأ في حوادث السيارات والاكتتاب. وانتقلت شركة Korea Midland Power إلى ما وراء الذكاء التوليدي، إلى ذكاء اصطناعي وكيلي ذاتيّ ينفّذ العمل فعلياً في تشغيل المحطة. فهو يعمل على شبكة معزولة، ويجمع تلقائياً حالات الشذوذ في المعدّات ويقدّم عنها إحاطة كل صباح. أمّا Microsoft وAmazon Web Services فتبني كلٌّ منهما تنظيماً مخصّصاً بآلاف الأفراد لإدماج الوكلاء داخل مواقع العملاء.</p>

<p>يجمعها أمر واحد: لقد تغيّر السؤال. حتى العام الماضي كان السؤال في قاعة الاجتماعات “هل نتبنّى هذا؟”. أمّا السؤال الذي يصارعه الممارسون الآن فهو “كيف نشغّل هذا بأمان؟”. ومع نزول الوكلاء من منصّة العرض وتولّيهم المناوبة الليلية، انتقل مركز الثقل من الأداء إلى التشغيل.</p>

<h2 id="عنق-الزجاجة-ليس-النموذج">عنق الزجاجة ليس النموذج</h2>

<p>لِنُزِح أولاً المفهوم الخاطئ الشائع: فكرة أنّ نموذجاً أفضل سيحلّ المشكلة. ضَعِ الوكيل في الميدان وسترى أنّ ما يعيقه ليس قدرة النموذج على الاستدلال، بل ثلاثة جدران تشغيلية.</p>

<p>الأول هو تعذّر التدقيق. إذا لم تستطع أن تعيد لاحقاً بناء سبب اتخاذ الوكيل قراره، وأيّ الأدوات استدعاها وبأيّ ترتيب، فإنّ الموافقة على الإنتاج لا تصدر أصلاً في المجالات شديدة التنظيم مثل التمويل أو القطاع العام. وتقف أتمتة اكتتاب التأمين على هذا الخطّ بالضبط. فبصرف النظر عن صواب النتيجة أو خطئها، لن يصمد أمام الجهة الرقابية نظامٌ يعجز عن شرح مسار قراره.</p>

<p>الثاني هو السيادة وسلسلة التوريد. إنّ ما تشير إليه تغطية السيادة الرقمية الأخيرة يمسّ جوهر المسألة: لم تعد سيادة النموذج وحدها كافية. إذ يجب أيضاً التحقّق من مصدر ونزاهة حِزَم المصدر المفتوح ومجموعات البيانات وطبقة أدوات الوكلاء التي يعمل النموذج عليها فعلياً. وكلّما زاد تعامل شركة مالية مع بيانات طبية وشخصية حسّاسة، صار عزل الشبكة والتشغيل داخل المؤسسة شرطاً مسبقاً لا نقطة تفاوض.</p>

<p>الثالث هو التنفيذ الآمن. في اللحظة التي يشغّل فيها الوكيل شيفرة ويستدعي أدوات خارجية، تصبح بيئة التنفيذ غير المعزولة بذرة حادثٍ بحدّ ذاتها. فاستدعاء أداة واحد خاطئ قد يؤدّي إلى تسريب بيانات أو تغيير لا رجعة فيه.</p>

<p>لا يزول أيٌّ من هذه الجدران الثلاثة بترقية النموذج درجةً واحدة، لأنّها جميعاً مسألة أين تضع التشغيل.</p>

<h2 id="لماذا-تعجز-السُّحُب-التقليدية-عن-حلّها">لماذا تعجز السُّحُب التقليدية عن حلّها</h2>

<p>على مدى الأعوام الخمسة عشر الماضية، نجحت السحابة في تجريد الأجهزة الافتراضية وقواعد البيانات والشبكات إلى موارد من الدرجة الأولى. فصار إطلاق خادم عند الحاجة، وربط الصلاحيات، وتسجيل السجلّات، أموراً موحّدة على مستوى المنصّة. لكن ضَعْ وكيلاً فوق ذلك يتغيّر السرد.</p>

<p>إنّ المفاهيم الأساسية للوكيل ليست خوادم، بل: أيّ قدرة يستعمل، وأيّ الأدوات يمكنه الوصول إليها، وتحت أيّ سياسة يتحرّك، وماذا فعل. في السُّحُب التقليدية تبقى هذه الأربعة لا موارد من الدرجة الأولى، بل آثاراً جانبية مبعثرة في شيفرة التطبيق. فسجلات التدقيق يتركها كلّ فريق لنفسه، والسياسة مدفونة في جُمَل التوجيه، وصلاحيات الأدوات تُدار عبر مفاتيح API متناثرة هنا وهناك.</p>

<p>والنتيجة أنّ التحكّم يستند إلى العُرف لا إلى المنصّة. وحين تتغيّر الفِرَق ويرحل الأفراد، يرحل ذلك العُرف معهم. وعبارة “نفعل ذلك بحكم العادة” ليست جواباً يصمد أمام الجهة الرقابية. فالتحكّم يجب أن يكون قابلاً لإعادة الإنتاج ومفروضاً، وتلك مسؤولية المنصّة لا مسؤولية شيفرة فردية.</p>

<h2 id="التحكّم-بوصفه-منصّة-لا-عُرفاً">التحكّم بوصفه منصّة، لا عُرفاً</h2>

<p>المُنطلَق الذي اختارته Paxis بسيط: إنّ موارد عصر الوكلاء من الدرجة الأولى ليست أجهزة افتراضية، بل المهارات (Skills) والأدوات (Tools) والسياسات (Policies) وسجلات التدقيق (Audit Logs). وكما تتعامل السُّحُب التقليدية مع الخوادم والشبكات، ترفع Paxis هذه الأربعة إلى موارد تديرها المنصّة مباشرةً.</p>

<p>تعامل Skills قدرات الوكيل كموارد خاضعة لإدارة الإصدارات. فتسجيل القدرة والتحقّق منها وسحبها يجري على مستوى المنصّة لا داخل مشروع فردي. وتعرّف Tools الوصول إلى الأدوات تعريفاً تصريحياً؛ فأيّ وكيل يمكنه استدعاء أيّ أداة ومتى تحكم فيه السياسة سلفاً. وتحدّد Policies درجة الاستقلالية تحديداً صريحاً؛ ولأنّ التنفيذ لا يمضي إلّا عبر بوّابة موافقة محدّدة، يصير الخطّ الذي يجب ألّا يتجاوزه الوكيل مغروساً في مسار التنفيذ لا في وثيقة. وتُعدّ Audit Logs البوّابة الافتراضية التي يمرّ عبرها كلّ فعل؛ فإعادة البناء لاحقاً هي الأصل لا الاستثناء.</p>

<p><img src="/assets/images/enterprise-agents-need-control-plane-diagram.svg" alt="بنية مستوى تحكّم يمرّ فيها كلّ فعل للوكيل عبر بوّابة السياسة وسجلّ التدقيق ويعمل فوق Kubernetes سيادي" /></p>

<p><em>يُفحَص كلّ فعل للوكيل عند بوّابة السياسة وفق قواعد الاستقلالية والموافقة؛ ولا يمضي سوى التنفيذ المسموح به عبر المهارات والأدوات وصندوق رمليّ معزول. وبصرف النظر عن النتيجة، يُسجَّل كلّ فعل في سجلّ التدقيق، وتجري العملية كاملةً فوق Kubernetes سيادي داخل المؤسسة ومعزول عن الشبكة.</em></p>

<p>وبإسقاط ذلك على الجدران الثلاثة، يتّسق الأمر هكذا:</p>

<table>
  <thead>
    <tr>
      <th>الجدار في الميدان</th>
      <th>حدّ الأسلوب التقليدي</th>
      <th>استجابة Paxis</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>تعذّر التدقيق</td>
      <td>تسجيل يختلف بين فريق وآخر، ومسار قرار لا يمكن إعادة بنائه</td>
      <td>كلّ استدعاء أداة وكلّ قرار يمرّ عبر Audit Logs، وإعادة البناء هي الأصل</td>
    </tr>
    <tr>
      <td>السيادة وسلسلة التوريد</td>
      <td>التحكّم في النموذج وحده، وطبقات المهارات والأدوات والبيانات نقطة عمياء</td>
      <td>تسجيل Skills وTools والتحقّق منها كموارد من الدرجة الأولى، وتشغيلها داخل المؤسسة على K8s سيادي</td>
    </tr>
    <tr>
      <td>التنفيذ الآمن</td>
      <td>استدعاءات أدوات غير معزولة، وصلاحيات متناثرة عبر مفاتيح API</td>
      <td>لا يُشغَّل سوى التنفيذ الذي يمرّ عبر بوّابة السياسة، وذلك داخل صندوق رمليّ معزول</td>
    </tr>
  </tbody>
</table>

<p>والجوهر أنّه حين يجدول الوكيل عمله بنفسه، ويشغّل شيفرة داخل صندوق رمليّ معزول، ويستقي المعرفة من ويكي الفريق، فإنّ كلّ فعل من تلك الأفعال يجب أن يمرّ عبر بوّابة السياسة وسجلّ التدقيق. فالتحكّم يستند إلى بنية المنصّة لا إلى اجتهاد شخص.</p>

<h2 id="بإسقاطه-مباشرةً-على-أخبار-اليوم">بإسقاطه مباشرةً على أخبار اليوم</h2>

<p>بالنسبة لشركة التأمين، تجعل أتمتة الاكتتاب من التنفيذ القابل للتدقيق شرطاً للموافقة. فإذا لم يبقَ مسار قرار، لن يتجاوز العتبة التنظيمية، وسجلات التدقيق هي ما يسدّ ذلك المتطلَّب. أمّا القول بأنّ السيادة الرقمية يجب أن تتّسع إلى سيادة سلسلة التوريد فيُقرأ مطلباً للتحقّق من مصدر ونزاهة لا النموذج فحسب بل طبقتَي المهارات والأدوات ضمن خطّ النشر. وعزل الشبكة والتشغيل داخل المؤسسة اللذان تطلبهما الشركات المالية يتّصلان مباشرةً بمُنطلَق تشغيل الوكلاء فوق بنية K8s سيادية.</p>

<p>يمكن قراءة الخبر نفسه بطريقتين. الأولى سطحية: “تبنّي الوكلاء يتسارع”. والثانية سؤال: “هل الأساس التشغيلي جاهز لحمل هذه السرعة؟”. والآن وقد انتقل عنق الزجاجة في التبنّي من الأداء إلى التشغيل، فإنّ من يجيب عن السؤال الثاني هو من يحوز الخطوة التالية.</p>

<h2 id="السؤال-الباقي">السؤال الباقي</h2>

<p>لا تتحدّد القدرة التنافسية للبنية التحتية في عصر الوكلاء بوحدة معالجة رسومية أسرع، بل بوجود مستوى تحكّم يمكن الوثوق به لتسليم العمل إليه. لقد بدأ التبنّي فعلاً، والخيار المتبقّي للممارسين هو ترك التشغيل للعُرف أو للمنصّة. اختارت Paxis الخيار الثاني. فالسحابة الأصيلة للوكلاء التي تعامل قدرات الوكيل وأدواته وسياساته وتدقيقه كموارد من الدرجة الأولى منذ البداية هي الجواب.</p>

<p>إن كنت تدرس كيفية إدخال الوكلاء إلى الإنتاج في ميدان ذي متطلّبات تدقيق وسيادة قويّة، مثل التمويل أو القطاع العام، فيمكنك التحقّق من ذلك مع ThakiCloud في مرحلة تجريبية. فإرساء مستوى التحكّم منذ البداية، بدل إضافته لاحقاً، يتبيّن أنّه المسار الأسرع.</p>

<h2 id="المصادر">المصادر</h2>

<ul>
  <li>Korea Midland Power تقدّم إحاطة صباحية يومية عن شذوذ المعدّات عبر HI-KOMI، وهو ذكاء اصطناعي وكيلي ذاتيّ يعمل على شبكة معزولة: <a href="https://www.hankyung.com/article/2026062934641">Hankyung</a></li>
  <li>DB Insurance تحدّد نسبة الخطأ في حوادث السيارات من فيديو كاميرا لوحة القيادة بالذكاء الاصطناعي، بمتوسّط 5 ثوانٍ ودقّة 92.4%: <a href="https://www.ajunews.com/view/20260624092401339">Ajunews</a></li>
  <li>AWS تُدمِج نشر الوكلاء داخل مواقع العملاء عبر تنظيم Forward Deployed Engineering باستثمار مليار دولار: <a href="https://www.aboutamazon.com/news/aws/aws-1-billion-forward-deployed-ai-engineers">About Amazon</a></li>
  <li>Microsoft تؤسّس تنظيماً مخصّصاً لنشر الذكاء الاصطناعي (Microsoft Frontier) بالتزام قدره 2.5 مليار دولار و6,000 شخص: <a href="https://techcrunch.com/2026/07/02/microsoft-launches-its-own-ai-deployment-company-with-2-5-billion-commitment/">TechCrunch</a></li>
</ul>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="agentops" /><category term="agent-native-cloud" /><category term="paxis" /><category term="agentops" /><category term="enterprise-ai" /><category term="governance" /><category term="sovereign-ai" /><category term="audit-log" /><category term="thakicloud" /><summary type="html"><![CDATA[يُظهر النصف الأول من عام 2026 وكلاء الذكاء الاصطناعي وهم ينزلون من منصّة العروض التوضيحية ليتولّوا المناوبة الليلية في اكتتاب التأمين وفي تشغيل محطات الطاقة. وما يعيقهم في الإنتاج ليس أداء النموذج بل جدار تشغيلي: القابلية للتدقيق، والسيادة، والتنفيذ الآمن. هنا نوضّح لماذا تعجز السُّحُب التقليدية عن تجاوز هذا الجدار، وكيف تختلف السحابة الأصيلة للوكلاء التي تعامل المهارات والأدوات والسياسات وسجلات التدقيق كموارد من الدرجة الأولى، من منظور Paxis.]]></summary></entry><entry xml:lang="ar"><title type="html">لا أكتب موجّهات، بل أكتب حلقات: هندسة الحلقات لوكلاء البرمجة</title><link href="https://thakicloud.github.io/ar/agentops/loop-engineering-coding-agents/" rel="alternate" type="text/html" title="لا أكتب موجّهات، بل أكتب حلقات: هندسة الحلقات لوكلاء البرمجة" /><published>2026-07-04T00:00:00+09:00</published><updated>2026-07-04T00:00:00+09:00</updated><id>https://thakicloud.github.io/ar/agentops/loop-engineering-coding-agents</id><content type="html" xml:base="https://thakicloud.github.io/ar/agentops/loop-engineering-coding-agents/"><![CDATA[<h2 id="نظرة-عامة">نظرة عامة</h2>

<p>انتشرت مؤخراً بين المطورين عبارة أثارت نقاشاً واسعاً: “لم أعد أُدخل موجّهات (Prompts) في Claude Code. أُشغّل حلقة تُدخل الموجّهات في Fable، ومهمتي الوحيدة هي كتابة تلك الحلقة.” العبارة استفزازية، لكن إذا نزعنا عنها المبالغة التسويقية، نجد فيها ملاحظة عملية ذات معنى حقيقي: وحدة العمل تنتقل من موجّه واحد إلى حلقة كاملة.</p>

<p>هذا التحول مختلف تماماً عن الحديث عن تحسّن النماذج. مهما كان النموذج قوياً، فإنه لا يستطيع إنجاز مهمة معقدة حتى النهاية من خلال طلب واحد ينتهي بموجّه واحد. لكن الأمر يتغير عندما يُبنى فوق بنية تكرارية يستدعي فيها النموذج أداة، ثم يستقبل نتيجتها كمُدخل جديد ليقرر الخطوة التالية. تُشغّل ThakiCloud مثل هذه الحلقات فعلياً في تطويرها الداخلي، إلى جانب تشغيل منصة AI/ML كخدمة (SaaS) قائمة على Kubernetes. لذلك فإن عبارة “كتابة حلقة” ليست بالنسبة لنا جملة رائجة، بل مهمة هندسية يومية. يستعرض هذا المقال ما تتكون منه هذه الحلقة فعلياً، وما الذي يجعلها موثوقة.</p>

<p><img src="/assets/images/loop-engineering-coding-agents-hero.png" alt="صورة توضيحية لمفهوم هندسة الحلقات لدى وكلاء البرمجة" /></p>

<h2 id="من-الموجّه-إلى-الحلقة-ما-الذي-تغيّر">من الموجّه إلى الحلقة: ما الذي تغيّر</h2>

<p>في عقلية كتابة الموجّهات، يحاول الإنسان انتزاع النتيجة المرجوة بأكبر قدر من الدقة من خلال تعليمة واحدة. الموجّه الجيد لا يزال مهماً، لكن حدود هذا الأسلوب واضحة: عندما تكون النتيجة خاطئة، يجب على الإنسان قراءتها بنفسه، وتحديد ما الذي انحرف، ثم إعادة صياغة الموجّه من جديد. إنها بنية يكون فيها الإنسان هو الحكم في كل تكرار، وهو من يعطي التعليمة التالية أيضاً.</p>

<p>أما عقلية كتابة الحلقات فتُسلّم مهمة التقييم وإعادة التوجيه إلى البنية نفسها. لا يُحدد الإنسان موجّهات فردية، بل يُعرّف “ما الهدف، وما الذي يجب مراقبته، ومتى يتوقف الأمر”. يتصرف النموذج داخل هذا الإطار، وتحكم أداة خارجية على النتيجة، ويصبح هذا الحكم هو المُدخل التالي للنموذج. ينتقل دور الإنسان من مراقبة كل جولة إلى تصميم حدود الحلقة وشروط إنهائها.</p>

<p>قد يبدو هذا الفرق صغيراً، لكنه يُحدث فارقاً كبيراً في النتيجة. في أسلوب الموجّهات، يكون الإنسان هو عنق الزجاجة، لأن التقدّم لا يحصل إلا بعد أن يقرأ الإنسان النتيجة كاملة. أما في أسلوب الحلقات، فعنق الزجاجة ليس الإنسان بل جودة شرط الإنهاء. فإذا كان شرط الإنهاء واضحاً، تتقدم الحلقة نحو التقارب حتى في غياب الإنسان، وإذا كان ضعيفاً، تقع حتى أقوى النماذج في تكرار عقيم لا طائل منه. لذلك فإن جوهر هندسة الحلقات ليس مهارة صياغة جمل الموجّه، بل القدرة على تصميم آلية تجعل الجهاز قادراً على الحكم بنفسه على ما يُعدّ نجاحاً.</p>

<h2 id="تشريح-الحلقة-تكرار-الملاحظة-والحكم-والتنفيذ">تشريح الحلقة: تكرار الملاحظة والحكم والتنفيذ</h2>

<p>الحلقة البرمجية التي تعمل بشكل جيد فعلياً تُكرر عادة الخطوات الأربع نفسها. يقترح النموذج تغييراً (Act)، ثم يُطبَّق هذا التغيير على قاعدة الكود ويُشغَّل أداة خارجية للحصول على نتيجة (Observe)، ثم يُحلَّل ذلك المخرَج لتحويله إلى سياق يوضح ما الذي فشل ولماذا (Learn)، ثم يُعاد إدخال هذا السياق إلى النموذج للحصول على الاقتراح التالي (Repeat). تستمر هذه الدورة حتى تجتاز بوابة الإنهاء أو تُستنفد الميزانية المخصصة.</p>

<pre><code class="language-mermaid">flowchart TB
    A[اقتراح النموذج للتغيير&lt;br/&gt;Act] --&gt; B[التطبيق على قاعدة الكود]
    B --&gt; C[تشغيل أداة خارجية&lt;br/&gt;اختبارات·مُجمّع·مدقق لغوي&lt;br/&gt;Observe]
    C --&gt; D[تحليل المخرَج&lt;br/&gt;رسالة الخطأ·السطر·سبب الفشل&lt;br/&gt;Learn]
    D --&gt; E{هل اجتازت&lt;br/&gt;بوابة الإنهاء؟}
    E -- "لا" --&gt; F[إعادة حقن السياق في النموذج&lt;br/&gt;Repeat]
    F --&gt; A
    E -- "نعم" --&gt; G[إنهاء الحلقة&lt;br/&gt;تقارب]
    D -.استنفاد الميزانية.-&gt; H[توقف·تسليم للإنسان]
</code></pre>

<p>الخطوة الثالثة، وهي التعلّم، مهمة بشكل خاص هنا. إذا لُخِّص مخرَج الأداة أو ضُغِط قبل إدخاله إلى النموذج، فإن الحلقة لا تتقارب بشكل جيد. يجب إدخال رسالة الخطأ التي يُصدرها المُجمّع، والملف والسطر اللذين فشلا، وتفاصيل عدم تطابق الأنواع كما هي، كسياق للموجّه التالي، حتى يستطيع النموذج استعادة “سبب الفشل” من دون ذاكرة بين الجلسات. هذا السجل قد يبدو مطوّلاً من منظور الإنسان، لكن هذا الإطناب بالنسبة للحلقة هو الإشارة الضرورية للتقارب.</p>

<h2 id="البوابات-الحتمية-هي-إشارة-المكافأة">البوابات الحتمية هي إشارة المكافأة</h2>

<p>أكثر نقطة تنحرف فيها هندسة الحلقات غالباً هي شرط الإنهاء. فإذا سألنا النموذج “هل انتهت هذه المهمة؟” وأوقفنا الحلقة بناءً على إجابته، فسينهي النموذج الحلقة مبكراً بتقرير ذاتي من نوع “يبدو أن المهمة اكتملت”. هذا ليس تحققاً حقيقياً. الحلقة الموثوقة تُسند قرار الإنهاء إلى أداة حتمية لا إلى النموذج: هل اجتازت الاختبارات؟ هل بُني المشروع دون أخطاء من المُجمّع؟ هل صمت مدقق الأنواع؟ إشارة النجاح أو الفشل هذه تلعب بالضبط دور إشارة المكافأة في التعلّم المعزَّز. من دون الحاجة إلى تدريب نموذج مكافأة منفصل، يحكم مُشغِّل الاختبارات والمُجمّع الموجودان أصلاً على “أن هذا الكود صحيح”.</p>

<p>رسّخت ThakiCloud هذا المبدأ فعلياً في حلقاتها الداخلية. مثال بارز هو pge-loop، الذي يُطبّق الفروقات (diff) التي يقترحها النموذج على الخلفية البرمجية المبنية بلغة Go، ثم يُشغّل الأمر <code class="language-plaintext highlighter-rouge">make test-short</code>، ويُعيد تغذية كامل مخرَج stderr كسياق للاقتراح التالي. شرط الإنهاء هنا ليس حكماً ذاتياً من النموذج، بل رمز خروج الاختبار. وبالمثل، يسعى Goal Mode بشكل مستقل نحو تحقيق الهدف حتى شرط الإنجاز، لكنه يتحقق من تقدّم كل خطوة عبر أمر تحقق محدد مسبقاً، وتشكّل الميزانية (عدد التكرارات والتكلفة والمهلة الزمنية) سقفاً أعلى. فهو لا يدور إلى ما لا نهاية، بل يتوقف عند التقارب أو عند استنفاد الميزانية. من دون هاتين الآليتين، أي بوابة الإنهاء الحتمية وسقف الميزانية، تصبح الحلقة أداة لا يمكن الوثوق بها.</p>

<p>عند استخدام fan-out تُضاف قاعدة إضافية. عندما تُطلَق عدة وكلاء فرعيين بالتوازي لجمع النتائج، يجب إغلاق الحلقة دائماً بمرحلة تحقق قبل دمج تلك النتائج. إن كان الناتج كوداً، تُستخدم بوابة الاختبار؛ وإن كان الناتج حكماً أو نتيجة بحث، تُطلَق عدة مُدقّقين متشككين من زوايا مختلفة ويُرشَّح الناتج عبر التصويت بينهم. دمج النتائج المتوازية مباشرة من دون تحقق يراكم مخرجات تبدو معقولة لكنها خاطئة. وغالباً ما يكون السبب الأول الذي يجب الشك فيه عندما تتراجع الجودة هو غياب مرحلة التحقق، لا مستوى النموذج.</p>

<h2 id="دلالات-التطبيق-على-منتجات-thakicloud">دلالات التطبيق على منتجات ThakiCloud</h2>

<p>ترتبط هندسة الحلقات ارتباطاً مباشراً بمنتج Paxis من ThakiCloud. Paxis هو مستوى تحكم Agent-Native Cloud يعمل فوق ai-platform، ويتعامل مع المهارات (Skills) والأدوات (Tools) والسياسات (Policies) وسجلات التدقيق (Audit Logs) كموارد من الدرجة الأولى. حتى لا تبقى الحلقة التي يكتبها الإنسان حبيسة بيئة تطوير شخصية، وتصبح بدلاً من ذلك مورداً على مستوى المنصة، يجب أن تُعرَض العناصر المكوّنة للحلقة بشكل قابل للإدارة. يختار Paxis نحو 960 مهارة عبر خوارزمية BM25 وينفّذها في صناديق رملية معزولة، ويمرّر كل سلوك عبر بوابات السياسات وسجلات التدقيق. بعبارة أخرى، عندما يصمم الإنسان “ما الذي يجب مراقبته ومتى يتوقف”، يوفر Paxis البنية التحتية التي تعزل تنفيذ تلك الحلقة وتسجّله وتتحكم فيه.</p>

<p>من هذا المنظور، تقابل البوابة الحتمية بوابة السياسات في Paxis بشكل طبيعي، ويقابل تنفيذ الأداة التنفيذ المعزول في الصندوق الرملي، ويقابل سجل ملاحظة الحلقة سجل التدقيق. والبنية التي تُحقّق فيها الحلقة من نفسها هي نفس المبدأ الذي تؤكد عليه Paxis تحت مسمى “إغلاق fan-out بالتحقق”.</p>

<p>من الناحية البنيوية، يكمّل منظور ai-platform هذا الحديث. تشغيل الحلقات بكثرة يعني بالضرورة زيادة في استدعاءات الاستدلال المتكررة وتشغيل الاختبارات. يستوعب ai-platform هذا الحمل المتكرر بكفاءة من حيث التكلفة عبر جدولة وحدات معالجة الرسوميات (GPU) القائمة على Kubernetes وKueue، وخدمة النماذج عبر vLLM، والعزل متعدد المستأجرين. فقط عندما تكون تكلفة الخدمة منخفضة يصبح تشغيل الحلقات بشكل متكرر مجدياً اقتصادياً، وهذه الجدوى الاقتصادية هي ما يجعل الوكيل قابلاً للتشغيل بشكل دائم. تتشكل هنا حلقة الربط التي تجعل خدمة منخفضة التكلفة (ai-platform) تُنتج جدوى اقتصادية للوكيل (Paxis). وبالنسبة للعملاء الذين لديهم متطلبات محلية (on-premise) وسيادية، فإن إمكانية تشغيل هذه الحلقة بأكملها داخل بنيتهم التحتية الخاصة تحمل أهمية خاصة.</p>

<h2 id="الحدود-والاعتراضات">الحدود والاعتراضات</h2>

<p>تصوير هندسة الحلقات كحل شامل لكل شيء ليس أمراً صادقاً. أولاً، الحلقة تصبح خطيرة في المهام التي لا يمكن فيها بناء بوابة إنهاء. فمن دون أمر يحكم تلقائياً على النجاح أو الفشل، تستهلك الحلقة الميزانية فقط من دون أن تعرف نقطة التقارب. في هذه الحالات، يكون الأسلوب الأحادي الذي يُنفَّذ دفعة واحدة أفضل، والأولى الاعتراف بذلك بصدق.</p>

<p>ثانياً، كلما تعمّقت الحلقة، يميل الإنسان إلى الوثوق بالنتيجة والتوقف عن المراجعة. موقف “الحلقة ستتحقق من الأمر على أي حال” هو أخفى أنماط الفشل. الأتمتة أداة مساعدة للتفكير لا بديلة عنه، ويجب على الإنسان أن يستمر في مراجعة عيّنات من المخرجات الأساسية بشكل دوري. وإذا لم يُرشّح المُدقّق أي شيء إطلاقاً، فهذا لا يعني أن كل شيء اجتاز التحقق، بل من المرجح أنه إشارة إلى عطل في المُدقّق نفسه.</p>

<p>ثالثاً، التكلفة. الحلقة تستهلك بحكم تعريفها استدعاءات استدلال متعددة. من دون سقف، تُستنفد الميزانية في لحظات، وإذا رُبط نموذج قوي بشكل دائم، تزداد التكلفة بشكل مضاعف لا خطي. في الممارسة العملية، يلزم توجيه (Routing) يستخدم نموذجاً رخيصاً في الاستكشاف والتنفيذ المتكرر، ولا يُخصَّص النموذج المكلف إلا لمرحلة التحقق التي تكون الدقة فيها حرجة. ينطبق هنا أيضاً مبدأ أن يكون العامل (Worker) رخيصاً والبوابة (Gate) وحدها مكلفة.</p>

<p>وخلاصة القول، عبارة “لا أكتب موجّهات بل أكتب حلقات” استفزازية، لكنها تحمل مضموناً حقيقياً. غير أن هذا المضمون لا ينبع من نموذج مبهر، بل من تصميم مُملّ ولكنه دقيق يجعل الجهاز قادراً على الحكم بنفسه على ما يُعدّ نجاحاً. الدرس نفسه استخلصته ThakiCloud من pge-loop وGoal Mode: الحلقة الجيدة تنبع من شرط إنهاء جيد.</p>

<h2 id="المصادر">المصادر</h2>

<ul>
  <li>ميلز دويتشر (Miles Deutscher)، منشور على X (تويتر سابقاً)، رأي حول حلقات وكلاء البرمجة</li>
  <li>ممارسات ThakiCloud الداخلية في هندسة الحلقات: pge-loop، Goal Mode (بوابة تحقق + سقف ميزانية)</li>
</ul>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="agentops" /><category term="ai-coding" /><category term="agentic" /><category term="loop-engineering" /><category term="claude-fable-5" /><category term="agentops" /><category term="verification" /><summary type="html"><![CDATA[قال أحد المطورين: “لم أعد أُدخل موجّهات (Prompts) في Claude Code. أُشغّل حلقة تُدخل الموجّهات في Fable، ومهمتي الوحيدة هي كتابة تلك الحلقة.” إذا نزعنا المبالغة عن هذه العبارة، فإنها تشير إلى تحوّل فعلي في وحدة العمل من الموجّه إلى الحلقة. نستعرض هندسة الحلقات التي تكرر الملاحظة والحكم والتنفيذ، وتجعل من المُجمّع والاختبارات إشارة مكافأة، من خلال حالتَي pge-loop وGoal Mode اللتين تُشغّلهما ThakiCloud فعلياً.]]></summary></entry><entry xml:lang="ar"><title type="html">العمل دون حدود معدّل على Fable 5: توجيه النماذج واستراتيجية ميزانية الرموز</title><link href="https://thakicloud.github.io/ar/dev/fable-model-routing-rate-limits/" rel="alternate" type="text/html" title="العمل دون حدود معدّل على Fable 5: توجيه النماذج واستراتيجية ميزانية الرموز" /><published>2026-07-04T00:00:00+09:00</published><updated>2026-07-04T00:00:00+09:00</updated><id>https://thakicloud.github.io/ar/dev/fable-model-routing-rate-limits</id><content type="html" xml:base="https://thakicloud.github.io/ar/dev/fable-model-routing-rate-limits/"><![CDATA[<p><img src="/assets/images/fable-model-routing-rate-limits-hero.png" alt="صورة تجريدية لتدفقات معالجة بأحجام متعددة تتجمع في عقدة قائد واحدة ثم تتفرّع من جديد" />
<em>تصوير للتوجيه، حيث يتدفّق العمل الثقيل والخفيف إلى نماذج مختلفة.</em></p>

<h2 id="نظرة-عامة">نظرة عامة</h2>

<p>الإمساك بنموذج برمجة واحد قوي وإلقاء كل مهمة عليه أمر مريح. المشكلة أن هذه الراحة تعود على شكل فاتورة ميزانية رموز وحدود معدّل. إذا استخدمت النموذج الأغلى حتى لأبسط المهام، فستنفد حصتك بحلول الوقت الذي تحتاج فيه فعلاً إلى استدلال صعب.</p>

<p>في أوائل يوليو 2026، شارك Theo مبتكر حزمة T3 كيف يشغّل Claude Fable 5 طوال اليوم دون بلوغ حدود المعدّل. الفكرة بسيطة. بدلاً من تكديس كل شيء على نموذج واحد، قسّم النموذج والجهد بحسب طبيعة العمل. في هذه المقالة نستعرض استراتيجياته الأربع مع اقتباسات حقيقية، ونضعها بجانب انضباط توجيه النماذج الذي تطبّقه ThakiCloud بالفعل في تشغيل Paxis وai-platform.</p>

<p>سبب الأهمية واضح. في عصر تعمل فيه الوكلاء بشكل مستقل لفترة طويلة، فإن كيفية تصميم تدفّق الرموز عبر الجلسة كاملة، لا جودة استدعاء نموذج واحد، هي ما يحدّد الإنتاجية والتكلفة الحقيقية.</p>

<h2 id="المشكلة-حدود-المعدّل-مسألة-تخصيص-لا-جودة">المشكلة: حدود المعدّل مسألة تخصيص لا جودة</h2>

<p>المستخدمون الذين يبلغون حدود المعدّل غالباً ما يفعلون ذلك لا لأن النموذج ضعيف بل لأن تخصيصهم أخرق. إذا شغّلت نموذج الطبقة العليا بأعلى جهد حتى لعمل منخفض الصعوبة مثل قراءة ملف واحد أو grep بسيط أو تلخيص سجل، فإن الرموز تحترق لا خطياً بل أسّياً. ورموز التفكير على وجه الخصوص تتراكم بشكل غير مرئي.</p>

<p>الرؤية الأساسية هي هذه. أفضل نموذج مورد محدود، وتحديد أين تنفقه هو بالضبط ما يعنيه التوجيه. نصائح Theo الأربع كلها المبدأ نفسه مطبَّقاً من زوايا مختلفة.</p>

<h2 id="استراتيجيات-theo-الأربع">استراتيجيات Theo الأربع</h2>

<h3 id="1-اجعل-الجهد-الافتراضي-high-واحتفظ-بـ-xhigh-وmax">1. اجعل الجهد الافتراضي high واحتفظ بـ xhigh وmax</h3>

<p>يقول Theo إنه يستخدم Fable على جهد “high” فقط في الوقت الحالي. بكلماته، xhigh “نهم للرموز”، وmax وextra هما “فرن بمخرجات أسوأ من الخيارات الأدنى”.</p>

<p>الدرس هنا أن رفع الجهد لا يرفع الجودة بشكل مطّرد. مع نمو رموز التفكير، قد يصبح المخرج مشتتاً أو يسلك التفافات مفرطة. لمعظم العمل العملي، high هو نقطة التوازن بين الجودة والتكلفة. احتفظ بـ xhigh وmax للمراحل التي تحتاج فعلاً إلى استدلال عميق.</p>

<h3 id="2-نسّق-codex-كمنفّذ-فرعي">2. نسّق Codex كمنفّذ فرعي</h3>

<p>الاستراتيجية الثانية هي جعل النماذج طبقات. علّم Theo نظام Claude Code أن يستدعي Codex (GPT-5.5) كمنفّذ فرعي لعمل التنفيذ. وبحسب ملاحظته، فإن GPT-5.5 قابل للتوجيه بدرجة عالية، لذا يستطيع Fable تعلّم كيفية توجيهه.</p>

<p>بعبارة أخرى، يعمل Fable كقائد يتولّى الحكم والتفرّع، بينما يُسنَد التنفيذ المتكرر عالي الحجم إلى منفّذ أرخص. بهذه الطريقة ينفق نموذج القائد الغالي رموزه على الحكم، ويخرج حجم التنفيذ من ميزانية أخرى.</p>

<h3 id="3-أعلن-أولوية-النماذج-في-claudemd">3. أعلن أولوية النماذج في CLAUDE.md</h3>

<p>الثالثة هي تصليب هذا التوجيه كعقد لا كارتجال. كتب Theo قسماً كبيراً في ملف CLAUDE.md حول أي نموذج يُقدَّم لأي عمل، وكيفية التخصيص عند تنسيق الوكلاء الفرعيين وسير العمل.</p>

<p>هذه النقطة مهمة بخاصة. إذا رسّخت قواعد التوجيه في مستند، فلن تضطر إلى القرار من جديد كل جلسة، ويشترك الفريق كله في انضباط التخصيص نفسه. تحويل موجّه متكرر إلى قاعدة مبدأ أساسي من مبادئ نظافة الموجّهات.</p>

<h3 id="4-أسنِد-العمل-كثيف-الرموز-واستردّ-النتائج-فقط">4. أسنِد العمل كثيف الرموز واستردّ النتائج فقط</h3>

<p>أخيراً، يشغّل Theo المهام كثيفة الرموز (استخدام الحاسوب، تحليل قاعدة الشيفرة الكامل ونحوها) بنماذج أخرى، ثم يجعل النتيجة فقط تُبلَّغ إلى Fable.</p>

<p>هذا يرتبط مباشرة بنظافة السياق الرئيسي. إذا صببت مخرَج استكشاف كبير مباشرة في سياق نموذج القائد، فإن كلفة إعادة قراءة ذلك السياق الكبير في كل دور لاحق تنمو خطياً. إذا تولّى منفّذ فرعي القراءة الثقيلة ومرّر ملخّصاً فقط، بقي سياق نموذج القائد نظيفاً.</p>

<p>مرسومة كتدفّق واحد، تبدو الاستراتيجيات الأربع هكذا.</p>

<pre><code class="language-mermaid">flowchart TB
    A[وصول المهمة] --&gt; B{تصنيف نوع المهمة}
    B --&gt;|الحكم التفرّع التنسيق| C[Fable 5 قائد بجهد high]
    B --&gt;|البحث grep قراءة الملفات| D[منفّذ منخفض الكلفة]
    B --&gt;|التنفيذ بالجملة| E[Codex GPT-5.5 منفّذ]
    D --&gt;|إعادة الملخّص فقط| C
    E --&gt;|إعادة المنتَج| C
    C --&gt; F{هل يلزم استدلال عميق؟}
    F --&gt;|نعم| G[الترقية إلى xhigh max باعتدال]
    F --&gt;|لا| H[الإبقاء على high]
    G --&gt; I[تركيب النتائج]
    H --&gt; I
</code></pre>

<h2 id="دلالات-لمنتجات-thakicloud">دلالات لمنتجات ThakiCloud</h2>

<p>تُقرأ نصائح Theo كتأكيد مرحّب به لأن منصة الوكلاء Paxis من ThakiCloud تقف بالفعل على المبدأ نفسه. Paxis هي مستوى تحكّم Agent-Native Cloud يعمل فوق ai-platform، ويتعامل مع المهارات والأدوات والسياسات وسجلات التدقيق كموارد من الدرجة الأولى. وضمنها، توجيه النماذج ليس زينة بل عمود التكلفة الفقري.</p>

<p>انضباط توجيه الوكلاء الفرعيين لدينا يستهدف الغاية نفسها التي تستهدفها استراتيجية Theo الرابعة. يذهب الاستكشاف وقراءة الملفات إلى الطبقة الأرخص، والتنفيذ والمراجعة إلى الطبقة الوسطى، وتذهب فقط الهندسة المعمارية والاستدلال المعقّد متعدد الخطوات إلى الطبقة العليا. لا يدفع الوكلاء الفرعيون المخرجات الكبيرة الخام إلى الأعلى بل يعيدون ملخّصاً ومسارات ملفات فقط. قاعدة إبقاء سياق نموذج القائد نظيفاً هي الممارسة نفسها التي وصفها Theo بـ “بلّغ النتائج فقط”.</p>

<p>الاستراتيجية الثانية لفصل القائد عن المنفّذ تلامس أيضاً تصميم Paxis. يختار مِهاز مهارات Paxis من أكثر من 960 مهارة بواسطة BM25 ويشغّلها في صناديق رمل معزولة، حيث تتولّى طبقة التنسيق الحكم الخفيف فقط ويُعزَل التنفيذ الثقيل إلى عمّال منفصلين. استخدام نموذج الحكم الغالي للتوجيه والتركيب فقط، ووضع العمل الثقيل الفعلي على عمّال أرخص، هو الصورة نفسها التي جعل فيها Theo نموذج Fable قائداً وCodex منفّذاً.</p>

<p>الاستراتيجية الثالثة، تصليب التوجيه في مستندات وسياسة، تُنفَّذ في Paxis كبوّابات سياسة وسجلات تدقيق. حين تثبّت أي عمل ينبغي أن يتدفّق إلى أي مورد كقاعدة صريحة لا كحكم ارتجالي، لا يتذبذب انضباط التخصيص حتى مع عمل وكيل مستقل لفترة طويلة.</p>

<p>في طبقة البنية التحتية، تعمل عدسة ai-platform جنباً إلى جنب. عند خدمة النماذج على وحدات معالجة رسومية قائمة على K8s وKueue، فإن تدفّق الطلبات منخفضة الصعوبة إلى نماذج صغيرة بأولوية دفعات منخفضة يوفّر وقت وحدة المعالجة، وهذا التوفير يعود إلى اقتصاديات الوكلاء. الكلفة الأدنى للخدمة تخلق هامشاً يحتمل توجيهاً أكثر جرأة. باختصار، الخدمة منخفضة الكلفة (ai-platform) تسند اقتصاديات تنسيق الوكلاء (Paxis).</p>

<h2 id="القيود-والاعتراضات">القيود والاعتراضات</h2>

<p>لهذا النهج نقاط ضعف أيضاً. أولاً، مع نمو تعقيد التوجيه، تظهر كلفة إدارة. نسج عدة نماذج معاً يعني أن لكل منها نافذة سياق وسعراً وتوافراً مختلفاً، ما يصعّب التنقيح. إذا أساء القائد قراءة مخرَج المنفّذ، تزداد الرحلات ذهاباً وإياباً وينتهي الأمر بإنفاق رموز أكثر.</p>

<p>ثانياً، “high هو الأفضل دائماً” ملاحظة شخصية من Theo وتتفاوت بحسب نوع المهمة. للأحكام المعمارية الصعبة حقاً أو تعقّب العلل الدقيق، يستحق الجهد الأعلى كلفته. القاعدة مجرد افتراضي، والعين للحكم على الاستثناءات ما زالت مطلوبة.</p>

<p>ثالثاً، التنسيق الذي يمزج نماذج من موردين مختلفين يوسّع تدفّق البيانات وحدود الأمان. حين تسلّم تحليل قاعدة الشيفرة إلى منفّذ خارجي، يجب أن تتحكّم بالضبط فيما يدخل سياق ذلك النموذج. لهذا بالضبط تمرّر Paxis كل فعل عبر بوّابات سياسة وسجلات تدقيق.</p>

<p>في الختام، حدود المعدّل ليست مشكلة تُدفَع بخطة أغلى بل تُحلّ بالتخصيص. ابدأ رخيصاً، واستخدم النموذج الغالي للحكم الثقيل فقط، وصلّب تلك القاعدة في مستندات وسياسة. هذا هو الاتجاه الذي تشير إليه نصائح Theo الأربع جميعها، والانضباط الذي تمارسه ThakiCloud كل يوم على Paxis.</p>

<h2 id="المصادر">المصادر</h2>

<ul>
  <li>Theo (@theo)، “I’ve been getting a TON done with Fable today and I’m not hitting rate limits”: <a href="https://x.com/theo/status/2072481845363822914">x.com/theo/status/2072481845363822914</a></li>
  <li>“T3 Stack creator Theo shares Fable AI workflow”، digg.com: <a href="https://digg.com/tech/wmowks0x">digg.com/tech/wmowks0x</a></li>
  <li>“Fable Is Back. Here’s How to Actually Code With It”، Wavect: <a href="https://wavect.io/blog/coding-with-claude-fable-5/">wavect.io/blog/coding-with-claude-fable-5</a></li>
</ul>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="dev" /><category term="claude-code" /><category term="model-routing" /><category term="cost-optimization" /><category term="agent-native" /><category term="paxis" /><summary type="html"><![CDATA[نحلّل نصائح سير العمل مع Claude Fable 5 التي شاركها Theo مبتكر T3: مستويات الجهد، وتنسيق Codex، وأولوية النماذج في CLAUDE.md، وإسناد المهام كثيفة الرموز. ونضعها بجانب انضباط توجيه النماذج الذي تستخدمه ThakiCloud بالفعل عبر Paxis وai-platform.]]></summary></entry><entry xml:lang="ar"><title type="html">ذكاء يعمل في المنزل: حاسوب الذكاء الاصطناعي الشخصي واقتصاديات التشغيل داخل المؤسسة</title><link href="https://thakicloud.github.io/ar/llmops/personal-ai-computer-onprem-vram/" rel="alternate" type="text/html" title="ذكاء يعمل في المنزل: حاسوب الذكاء الاصطناعي الشخصي واقتصاديات التشغيل داخل المؤسسة" /><published>2026-07-04T00:00:00+09:00</published><updated>2026-07-04T00:00:00+09:00</updated><id>https://thakicloud.github.io/ar/llmops/personal-ai-computer-onprem-vram</id><content type="html" xml:base="https://thakicloud.github.io/ar/llmops/personal-ai-computer-onprem-vram/"><![CDATA[<p>في الأيام القليلة الماضية انتشر بهدوء مشروع على خطوط زمنية المطورين. إنه “حاسوب الذكاء الاصطناعي الشخصي”: فبدلًا من استئجار واجهة برمجية سحابية، تقوم بتجميع جهاز ذكاء اصطناعي في المنزل أو المكتب وتشغّل النماذج مفتوحة الأوزان بالكامل على عتاد تملكه أنت. تصل الأدلة إلى 384GB من ذاكرة VRAM، وهو ما يطرح سؤالًا عمليًا للغاية: عند هذه السعة، ما النماذج التي يمكن تشغيلها محليًا فعلًا؟ هذا المقال موجّه إلى قادة الهندسة وفرق منصات تعلم الآلة الذين يقيّمون بنية الذكاء الاصطناعي داخل المؤسسة، وإلى علماء البيانات الراغبين في تشغيل النماذج محليًا. نستخدم الحساب للتأكد من كيفية تحديد ذاكرة VRAM لجدوى النماذج، ونتناول ما الذي يتغير عند توسيع جهاز شخصي واحد إلى تشغيل بمستوى المؤسسة، إلى جانب منظور منصة ai-platform لدى ThakiCloud.</p>

<p>لأبدأ بالخلاصة. تُحدَّد جدوى الذكاء الاصطناعي المحلي في معظمها بمتغير واحد: ذاكرة VRAM. وما يثبته البناء الشخصي هو أنه “ممكن تقنيًا”، لا أن “المؤسسة تستطيع تشغيله كما هو”. وهذه الفجوة هي بالضبط سبب وجود منصات التشغيل داخل المؤسسة.</p>

<h2 id="ما-هذه-التقنية">ما هذه التقنية</h2>

<p>المستودع في قلب النقاش هو <code class="language-plaintext highlighter-rouge">autonomous-ai/autonomous-computer</code>، وهو دليل مفتوح المصدر صادر برخصة MIT لبناء حاسوب ذكاء اصطناعي في المنزل من الصفر. ما يميزه أنه لا يشرح بالنص وحده. يأتي كل بناء مع قائمة مواد (BOM) تحمل الأسعار وروابط الشراء، وملفات ثلاثية الأبعاد (STL و STEP) لطباعة الهيكل أو تصنيعه، ومخطط أسلاك، وقيم ضبط BIOS، وصور تجميع خطوة بخطوة. أما جانب البرمجيات فيمتد من تثبيت نظام التشغيل وبرامج تعريف NVIDIA، مرورًا بثلاثة محركات استدلال (Ollama و vLLM و llama.cpp)، وصولًا إلى ربط وكيل محلي.</p>

<p>تُقدَّم ثلاثة تكوينات.</p>

<ul>
  <li><strong>Home</strong>: بطاقتا RTX 5090، بإجمالي 64GB من VRAM</li>
  <li><strong>Business</strong>: تكوين من 8 بطاقات GPU، بإجمالي نحو 256GB من VRAM</li>
  <li><strong>Team</strong>: أربع بطاقات RTX PRO 6000 Blackwell، بإجمالي 384GB من VRAM</li>
</ul>

<p>الفلسفة التي يؤكد عليها المشروع باستمرار هي “امتلك ذكاءك”. فالنموذج الذي تستأجره من السحابة قد يختفي بين ليلة وضحاها عند تغيّر سياسة أو إيقاف خدمة، بينما لا يحدث ذلك لنموذج يعمل في منزلك. إنه موقف يتعلق بتأمين سيادة البيانات والتحكم على مستوى العتاد، وهو ينسجم تمامًا مع تنامي الإقبال على التشغيل داخل المؤسسة.</p>

<p>يبدو التدفق الكلي على النحو التالي.</p>

<pre><code class="language-mermaid">flowchart TB
    A[تحديد الميزانية والنموذج المستهدف] --&gt; B[تقدير ميزانية VRAM]
    B --&gt; C{أي تكوين بناء}
    C --&gt;|64GB| D[Home&lt;br/&gt;بطاقتا RTX 5090]
    C --&gt;|256GB| E[Business&lt;br/&gt;8 بطاقات GPU]
    C --&gt;|384GB| F[Team&lt;br/&gt;4 RTX PRO 6000]
    D --&gt; G[اختيار محرك الاستدلال]
    E --&gt; G
    F --&gt; G
    G --&gt;|تشغيل محلي بسيط| H[Ollama / llama.cpp]
    G --&gt;|خدمة عالية الإنتاجية| I[vLLM]
    H --&gt; J[ربط الوكيل المحلي]
    I --&gt; J
</code></pre>

<h2 id="ذاكرة-vram-تحدد-الجدوى">ذاكرة VRAM تحدد الجدوى</h2>

<p>أيّ نموذج يعمل محليًا يعود عمليًا إلى ذاكرة VRAM وحدها. القاعدة التقريبية التي استقر عليها المجتمع واضحة. عند FP16 (نصف الدقة) تحتاج إلى نحو 2GB لكل مليار معامل؛ وعند التكميم من فئة INT4 (Q4) نحو 0.5GB؛ وفوق ذلك تضيف 15 إلى 20 بالمئة لذاكرة KV cache والتنشيطات وحمل إطار العمل. بعبارة أخرى، عند Q4 يكون الحد الأدنى من VRAM تقريبًا “عدد المعاملات (B) × 0.5 × 1.2”.</p>

<p>يعطي تطبيق هذه الصيغة على أحجام نماذج تمثيلية الجدول أدناه. وتتضمن هذه القيم حمل الـ 20 بالمئة.</p>

<table>
  <thead>
    <tr>
      <th>حجم النموذج</th>
      <th>VRAM عند Q4</th>
      <th>VRAM عند Q8</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>8B</td>
      <td>5GB</td>
      <td>10GB</td>
    </tr>
    <tr>
      <td>32B</td>
      <td>19GB</td>
      <td>38GB</td>
    </tr>
    <tr>
      <td>70B</td>
      <td>42GB</td>
      <td>84GB</td>
    </tr>
    <tr>
      <td>122B</td>
      <td>73GB</td>
      <td>146GB</td>
    </tr>
    <tr>
      <td>235B</td>
      <td>141GB</td>
      <td>282GB</td>
    </tr>
    <tr>
      <td>405B</td>
      <td>243GB</td>
      <td>486GB</td>
    </tr>
  </tbody>
</table>

<p>هذا الحساب ليس اختراعًا اعتباطيًا؛ بل يتقاطع مع أدلة منشورة. فتشغيل Llama 3 70B عند Q4_K_M يُبلَّغ عنه بأنه يحتاج نحو 40 إلى 43GB، وهو ما يطابق القيمة المحسوبة 42GB. ويُقال إن نموذجًا من فئة 122B مثل Qwen 3.5 122B يحتاج 70 إلى 81GB عند Q4، والقيمة المحسوبة 73GB تقع ضمن هذا النطاق. أما Llama 3.1 405B فيصل إلى 243GB عند Q4، وهو ما يطابق الجدول تمامًا. وللإشارة، فإن Q4_K_M هو المعيار المجتمعي الذي يكاد لا يُميَّز عن Q8 في معظم المهام، مع ارتفاع في الحيرة (perplexity) بنحو 0.2 إلى 0.5 فقط مقارنةً بـ FP16.</p>

<h2 id="ما-الذي-يشغّله-كل-بناء-فعليًا">ما الذي يشغّله كل بناء فعليًا</h2>

<p>بمطابقة متطلبات VRAM المحسوبة على خطوط السعة للتكوينات الثلاثة، تتضح الصورة.</p>

<p><img src="/assets/images/personal-ai-computer-onprem-vram-results.png" alt="ذاكرة VRAM المطلوبة حسب حجم النموذج والتكميم، مع خطوط سعة التكوينات الثلاثة" /></p>

<p>يعمل النموذج على تكوين معيّن حين يقع عموده تحت خط سعة ذلك التكوين. وباختصار:</p>

<ul>
  <li><strong>Home (64GB)</strong>: يستوعب بأريحية 70B عند Q8 و 122B عند Q4. وهذا يكفي للتجارب الشخصية ومساعدة البرمجة لفريق صغير.</li>
  <li><strong>Business (256GB)</strong>: يمكنه دفع نموذج من فئة 235B قريبًا من Q8، وهو مناسب لإبقاء عدة نماذج متوسطة مقيمة في آنٍ واحد لأغراض التوجيه.</li>
  <li><strong>Team (384GB)</strong>: يحمّل 405B عند Q4 (243GB) ويبقى لديه 141GB. وهذا الفائض هو ما يمتص فعليًا ذاكرة KV cache للسياقات الطويلة والطلبات المتزامنة.</li>
</ul>

<p>هناك نقطة يسهل إغفالها هنا. الأرقام في الجدول ليست سوى “الحد الأدنى اللازم لتحميل الأوزان”. في الاستخدام الفعلي، ومع نمو طول السياق وعدد المستخدمين المتزامنين، تتضخم ذاكرة KV cache بأسرع من الخطي وتلتهم ميزانية VRAM. فتكوين “يكاد يتسع” فيه 405B وآخر “يخدمه بمساحة فائضة” قصتان مختلفتان تمامًا.</p>

<h2 id="دلالات-لـ-thakicloud">دلالات لـ ThakiCloud</h2>

<p>ما يثبته حاسوب الذكاء الاصطناعي الشخصي قوي لكنه محدود أيضًا، لأنه لا يصح إلا ضمن مقدمات جهاز واحد ومستخدم واحد وتشغيل يدوي. وفي لحظة توسيع هذا “الجهاز الواحد في المنزل” إلى حجم المؤسسة، تظهر مجموعة مختلفة تمامًا من المشكلات، وهذا بالضبط هو المجال الذي تعالجه منصة <strong>ai-platform</strong> لدى ThakiCloud.</p>

<p>تصف منصة ai-platform وحدات GPU وتجدولها باستخدام Kueue فوق Kubernetes، وتخدم النماذج بتعدد المستأجرين عبر vLLM. في البناء الشخصي يحتكر شخص واحد أربع بطاقات GPU، أما في المؤسسة فتتنافس فرق متعددة ونماذج متعددة على مجمّع GPU نفسه. وما يلزم حينها هو عزل المستأجرين، والاصطفاف العادل، والجدولة القائمة على الأولوية، ومراقبة الاستخدام والتكلفة. فالقرار اليدوي في البناء الشخصي بـ”تحميل هذا النموذج فقط الآن” هو ما تُؤتمِته المنصة عبر السياسة والمجدول.</p>

<p>وتشير الاقتصاديات في الاتجاه نفسه. فإذا كان “امتلك ذكاءك” في البناء الشخصي هو منطق تأمين سيادة البيانات والتحكم عبر العتاد، فإن منصة ai-platform تحقق المنطق نفسه على نطاق المؤسسة. إن النشر داخل المؤسسة والسيادي، وانخفاض تكلفة الخدمة لكل وحدة، والتحكم في البيانات عبر الاستضافة الذاتية، أمور تحمل وزنًا خاصًا في بيئات العملاء التي يجب أن تلبي المتطلبات التنظيمية المحلية. كما أن رفع معدل استغلال وحدات GPU من فئة RTX PRO 6000، التي يصعب على فرد تبريرها، عبر مشاركتها بين أعباء عمل كثيرة، هو أمر لا تقدر عليه سوى منصة.</p>

<p>وإن كنت تشغّل وكلاء فوق نماذج محلية، فإن منظور <strong>Paxis</strong> لدى ThakiCloud يتقاطع أيضًا. فـ Paxis هي مستوى تحكم من نوع Agent-Native Cloud يعمل فوق منصة ai-platform، وينفّذ المهارات في صناديق رمل معزولة ويمرّر كل فعل عبر بوابة سياسة وسجل تدقيق. أرفق مستوى تحكمك الخاص بنموذج يعمل على عتادك الخاص، وستمتد فلسفة البناء الشخصي في “امتلاك الذكاء” إلى حوكمة على مستوى المؤسسة.</p>

<h2 id="الحدود-والحجج-المضادة">الحدود والحجج المضادة</h2>

<p>قبل تبنّي رومانسية البناء الشخصي، تستحق بعض الحقائق الانتباه.</p>

<p>أولًا، تكلفة العتاد نفسه وعبء تشغيله. فتكوين من أربع بطاقات RTX PRO 6000 Blackwell يحمل نفقات رأسمالية أولية كبيرة، وتتبعه باستمرار الطاقة والحرارة والضوضاء والصيانة. كما أن الجهاز الواحد هو نقطة فشل واحدة.</p>

<p>ثانيًا، هناك حالات لا تزال السحابة فيها منطقية بوضوح. فأعباء العمل المتقطعة ذات الاستخدام غير المنتظم، والمهام التي تتطلب فعلًا أحدث نموذج متقدم، والخدمات العالمية منخفضة الكمون، يصعب خدمتها من صندوق واحد داخل المؤسسة. ونقطة التعادل للتشغيل داخل المؤسسة لا تصح إلا على مقدمة “استغلال مرتفع ومستقر”.</p>

<p>ثالثًا، تكميم Q4 ليس مجانيًا. ففي المتوسط يكون فقدان الجودة ضئيلًا، لكن في المهام الحساسة للدقة مثل البرمجة أو الرياضيات قد يظهر التدهور. وكما ذُكر، فإن السياقات الطويلة والتزامن العالي يستنزفان ميزانية VRAM عبر ذاكرة KV cache، مما يخلق وضعًا “تتسع فيه الأوزان لكن الخدمة لا تتسع”.</p>

<p>في النهاية، حاسوب الذكاء الاصطناعي الشخصي نقطة انطلاق ممتازة وإثبات مفهوم قوي. لكن كي تنعم مؤسسة بأكملها بالتحكم الذي يقدّمه جهاز شخصي واحد، وبطريقة مستقرة، فهي تحتاج إلى طبقة منصة فوقه تضيف العزل والجدولة والمراقبة والحوكمة. إن الإجابة على السؤال الذي يطرحه البناء الشخصي (“هل يمكنك امتلاك ذكائك؟”) على نطاق المؤسسة هي المشكلة التي تحلّها منصات الذكاء الاصطناعي داخل المؤسسة.</p>

<h2 id="المصادر">المصادر</h2>

<ul>
  <li><a href="https://github.com/autonomous-ai/autonomous-computer">autonomous-ai/autonomous-computer (GitHub)</a></li>
  <li><a href="https://pasqualepillitteri.it/en/news/4998/autonomous-computer-build-home-ai-locally">Autonomous Computer: Build Your Own Home AI (writeup)</a></li>
  <li><a href="https://www.modemguides.com/blogs/ai-infrastructure/best-local-ai-models-by-vram-2026">Best Local AI Models by VRAM: 8GB to 384GB (2026)</a></li>
  <li><a href="https://www.spheron.network/blog/gpu-memory-requirements-llm/">GPU Memory Requirements for LLMs (Spheron)</a></li>
  <li><a href="https://localaimaster.com/blog/ai-pc-build-guide">Build an AI PC in 2026: Complete Hardware Guide (Local AI Master)</a></li>
  <li>شارَكه أصلًا <a href="https://x.com/tom_doerr">@tom_doerr، أدلة بناء حاسوب الذكاء الاصطناعي الشخصي</a></li>
</ul>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="llmops" /><category term="on-premise" /><category term="vram" /><category term="gpu" /><category term="self-hosting" /><category term="vllm" /><category term="open-weights" /><summary type="html"><![CDATA[انطلاقًا من أدلة بناء حاسوب الذكاء الاصطناعي الشخصي التي شاركها tom_doerr والتي تصل إلى 384GB من ذاكرة VRAM، نحسب كيف تحدد ذاكرة VRAM النماذج التي يمكن تشغيلها فعليًا، ونوضح ما يلزم لتوسيع هذا الجهاز المنزلي الواحد إلى تشغيل بمستوى المؤسسة من منظور منصة ai-platform لدى ThakiCloud.]]></summary></entry><entry xml:lang="ar"><title type="html">أداة Paper Assistant Tool من جوجل: عميل ذكاء اصطناعي يراجع أخطاء الأبحاث العلمية</title><link href="https://thakicloud.github.io/ar/research/google-pat-automated-scientific-review/" rel="alternate" type="text/html" title="أداة Paper Assistant Tool من جوجل: عميل ذكاء اصطناعي يراجع أخطاء الأبحاث العلمية" /><published>2026-07-04T00:00:00+09:00</published><updated>2026-07-04T00:00:00+09:00</updated><id>https://thakicloud.github.io/ar/research/google-pat-automated-scientific-review</id><content type="html" xml:base="https://thakicloud.github.io/ar/research/google-pat-automated-scientific-review/"><![CDATA[<h2 id="نظرة-عامة">نظرة عامة</h2>

<p>تُعد المراجعة العلمية من الأقران (peer review) عنق زجاجة منذ زمن طويل. حجم الأبحاث المقدمة يتضخم كل عام، بينما لا يزداد الوقت المتاح للمراجعين. والنتيجة أن أخطاء مهمة تمر عبر المراجعة وتُنشر، ثم يُصار لاحقا إلى تصحيحها أو سحبها. أداة Paper Assistant Tool (PAT) التي كشفت عنها جوجل مؤخرا تستهدف هذه المشكلة مباشرة. تستقبل PAT الورقة العلمية الكاملة بعد اكتمالها، وتفحص النتائج النظرية، وتتحقق من التجارب، وتقترح تحسينات، وتشير إلى العيوب المحتملة، ضمن إطار مراجعة قائم على العملاء (agentic).</p>

<p>ما يجعل هذا البحث مثيرا للاهتمام هو أنه يتجاوز مجرد “تلخيص الورقة بواسطة نموذج لغوي كبير”. فقد صُممت PAT وهي تدرك حدود الطلب الواحد أو أخذ العينات البسيط، واختارت التوجه نحو توسيع الاستدلال نفسه. تُشغّل ThakiCloud منصة SaaS للذكاء الاصطناعي وتعلم الآلة قائمة على كوبرنيتس، ولديها بالفعل خط أنابيب داخلي لأتمتة مراجعة الأبحاث. لذلك فإن هذا البحث ليس شأنا خارجيا بالنسبة لنا، بل مرجع مباشر لتصميم حلقات التحقق التي نتعامل معها يوميا. يستعرض هذا المقال ماهية PAT وكيفية عملها، وما الذي اكتشفته فعليا في النشر الحقيقي، وما الذي يعنيه هذا التصميم لمنتجات ThakiCloud.</p>

<p><img src="/assets/images/google-pat-automated-scientific-review-hero.png" alt="صورة توضيحية لعميل مراجعة الأبحاث العلمية آليا" /></p>

<h2 id="ما-هو-هذا-البحث">ما هو هذا البحث</h2>

<p>الخيار التصميمي الجوهري في PAT هو توسيع الاستدلال (inference scaling). وبشكل ملموس، تستخدم الأداة Gemini Deep Think لتقوم باستدلال عميق عبر مراحل متعددة بدلا من إعطاء إجابة من طلب واحد. مراجعة الأبحاث في جوهرها عملية تحليل معقدة تمتد لوقت طويل. فللحكم على ما إذا كان إثبات نظرية (theorem) صحيحا فعلا، وما إذا كان إعداد التجربة يدعم النتائج، وما إذا كانت هناك تناقضات مع الأبحاث السابقة المستشهد بها، لا تكفي استجابة واحدة. تنفذ PAT هذا الحكم عبر تقسيمه إلى مراحل استدلال متعددة.</p>

<p>كما صُممت PAT لتكون أكثر من مجرد أداة حكم بالقبول أو الرفض، بل مساعدا يقرأ الورقة ويحدد عيوبا محددة ويقترح تحسينات. فهي تعمل كمساعد أولي للمؤلفين، يرفع من وضوح الورقة ويرصد الأخطاء قبل التقديم، وتعمل كمساعد للمراجعين، يكتب الملخصات ويشير إلى العيوب المحتملة مع ترك القرار النهائي للإنسان. بعبارة أخرى، تحدد الأداة موقعها بوضوح كمساعد للحكم البشري وليس بديلا عنه.</p>

<pre><code class="language-mermaid">flowchart TB
    A[إدخال الورقة العلمية الكاملة] --&gt; B[Gemini Deep Think&lt;br/&gt;توسيع الاستدلال]
    B --&gt; C[التحقق من النتائج النظرية&lt;br/&gt;فحص الإثباتات والمعادلات]
    B --&gt; D[التحقق من التجارب&lt;br/&gt;اتساق الإعداد والنتائج]
    B --&gt; E[مقارنة الأبحاث السابقة&lt;br/&gt;كشف التناقض والتكرار]
    C --&gt; F[تحديد العيوب + اقتراح تحسينات]
    D --&gt; F
    E --&gt; F
    F --&gt; G{مرحلة التعاون}
    G -- "مساعدة أولية" --&gt; H[ملاحظات للمؤلف&lt;br/&gt;تعديل قبل التقديم]
    G -- "مساعدة في المراجعة" --&gt; I[ملخص وعيوب للمراجعين&lt;br/&gt;القرار النهائي للإنسان]
</code></pre>

<h2 id="النتائج-الأساسية">النتائج الأساسية</h2>

<p>قيست أداء PAT على معيار SPOT، وهو مجموعة بيانات مكونة من أوراق علمية سُحبت أو تأكد وجود أخطاء فيها. في هذا المعيار، سجلت PAT دقة كشف بلغت 89.7% للأخطاء الرياضية والمنطقية، وهو تحسن بنحو 34% مقارنة بخط الأساس بدون تدريب مسبق (zero-shot). وهذا يعني أن توسيع الاستدلال التقط جزءا كبيرا من الأخطاء التي كانت تفوت الطلب الواحد.</p>

<p>الأكثر إثارة للإعجاب هو نتائج النشر الفعلي. استُخدمت PAT في تجربتين تجريبيتين ضمن مؤتمري STOC 2026 وICML 2026، وراجعت أكثر من 4,700 ورقة مقدمة. وخلال هذه العملية، اكتُشفت أخطاء نظرية ذات دلالة في أكثر من ثلث أوراق ICML، ويُذكر أن 31% من المؤلفين دُفعوا لإجراء تجارب جديدة [تقديري: بحسب ما أعلنته الورقة البحثية]. إذا صحت هذه الأرقام، فهذا يعني أن المراجعة الآلية تجاوزت بالفعل مرحلة العرض التجريبي في المختبر وبدأت تؤثر في عمليات المؤتمرات الفعلية.</p>

<p>بطبيعة الحال، هذه الأرقام مقدمة من جهة مؤلفي الورقة نفسها، لذا ينبغي قراءتها بحذر إلى أن تُؤكد بإعادة إنتاج مستقلة. ومع ذلك، فإن تقديم كل من المعيار (SPOT) والنشر الفعلي (STOC/ICML) معا، إضافة إلى قياس ليس فقط اكتشاف الأخطاء بل أيضا تغيّر سلوك المؤلفين (إجراء تجارب جديدة)، يعكس منهجية جادة.</p>

<h2 id="تصنيف-التعاون-بين-الذكاء-الاصطناعي-والإنسان-في-أربع-مراحل">تصنيف التعاون بين الذكاء الاصطناعي والإنسان في أربع مراحل</h2>

<p>من الإسهامات الأخرى التي يقدمها هذا البحث تصنيف طريقة تعاون الذكاء الاصطناعي مع الإنسان في التقييم العلمي إلى أربع مراحل متدرجة. تختلف كل مرحلة بحسب مقدار الحكم الذي يُفوَّض للذكاء الاصطناعي، ويناقش المؤلفون المفاضلات (trade-offs) في كل مرحلة.</p>

<p>الموقع الحالي للتجربتين التجريبيتين يقع في مرحلة محافظة نسبيا. يعمل الذكاء الاصطناعي كمساعد أولي يرفع وضوح الورقة ويرصد الأخطاء قبل التقديم، وكمساعد يكتب ملخصات للمراجعين ويحدد العيوب المحتملة مع ترك سلطة القرار النهائي للإنسان. تكمن فائدة هذا التصنيف في أنه يجعلنا ننظر إلى المراجعة الآلية لا كثنائية “كل شيء أو لا شيء”، بل كطيف يمكن ضبط مستوى التفويض فيه. يمكن تصميم المراحل بحيث يبقى القرار النهائي عالي المخاطر بيد الإنسان، بينما تُفوَّض المهام التكرارية والآلية للذكاء الاصطناعي.</p>

<h2 id="الدلالات-على-تطبيقات-منتجات-thakicloud">الدلالات على تطبيقات منتجات ThakiCloud</h2>

<p>ترتبط فلسفة التصميم في هذا البحث ارتباطا مباشرا بـ Paxis من ThakiCloud. Paxis هي مستوى تحكم للسحابة الأصلية للعملاء (Agent-Native Cloud) يعمل فوق ai-platform، ويتخذ من إغلاق تفرع المهام (fan-out) بالتحقق مبدأ جوهريا. رفض PAT للطلب الواحد ورفعها لمعدل كشف الأخطاء عبر توسيع الاستدلال ينبع من نفس الوعي الذي يقوم عليه أسلوب Paxis في عدم دمج نتائج العملاء الفرعيين المتوازيين مباشرة، بل تصفيتها عبر مرحلة تحقق خصومية (adversarial). فبنية إطلاق عدة مدققين متشككين من زوايا مختلفة ثم حسم العيوب بالتصويت تتطابق تماما مع فحص PAT المتقاطع للإثباتات والتجارب عبر مراحل استدلال متعددة.</p>

<p>عمليا، تُشغّل ThakiCloud بالفعل خط أنابيب لأتمتة مراجعة الأبحاث. يستقبل هذا الخط أوراق arXiv، وينتج مراجعة أقران عميقة، ويحوّل النتائج إلى مستندات يمكن للفريق الاطلاع عليها، ويربط بنود العمل المستخلصة من المراجعة بمهام تحسين النظام. تقدم نتائج PAT اتجاهين لهذا الخط. أولا، لرفع جودة الكشف قد يكون توسيع مراحل الاستدلال أكثر فعالية من رفع فئة النموذج نفسه. ثانيا، لا تكون مخرجات المراجعة الآلية مفيدة فعليا إلا إذا كانت تحديدا لعيوب محددة واقتراحات تحسين، لا مجرد حكم بالقبول أو الرفض.</p>

<p>من الناحية البنيوية، تكمل عدسة ai-platform هذه الصورة. توسيع الاستدلال يعني بالضرورة زيادة تكلفة الاستدلال. فمراجعة ورقة واحدة بعمق عبر مراحل متعددة تتطلب كما أكبر من الرموز (tokens) والحوسبة. تستوعب ai-platform هذا الحمل الاستدلالي المتكرر بكفاءة اقتصادية عبر جدولة وحدات معالجة الرسوميات (GPU) القائمة على كوبرنيتس وKueue، وخدمة النماذج عبر vLLM، والعزل متعدد المستأجرين. تشغيل حمل عمل يراجع كميات كبيرة من الأبحاث بشكل مستمر واقتصادي يتطلب هذه البنية التحتية للخدمة كشرط مسبق. وبالنسبة للمؤسسات البحثية ذات المتطلبات المحلية (on-premises) والسيادية، فإن القدرة على مراجعة الأبحاث الحساسة غير المنشورة داخل بنيتها التحتية الخاصة دون إرسالها إلى جهة خارجية تشكل ميزة تنافسية مهمة أيضا.</p>

<h2 id="القيود-والحجج-المضادة">القيود والحجج المضادة</h2>

<p>قراءة هذا البحث بتفاؤل مطلق أمر محفوف بالمخاطر. أولا، معظم الأرقام المُبلغ عنها تستند إلى إعلانات جهة المؤلفين أنفسهم. من الأسلم فهم أرقام مثل نسبة الكشف البالغة 89.7% أو اكتشاف الأخطاء في ثلث أوراق ICML كحد أعلى إلى أن تُؤكد بإعادة إنتاج مستقلة. وعلى وجه الخصوص، كون معيار SPOT مكونا من أوراق مسحوبة أو بها أخطاء يعني أنه قد يختلف عن توزيع الأبحاث المقدمة فعليا، مما يستدعي الحذر عند التعميم.</p>

<p>ثانيا، هناك خطر الإيجابيات الزائفة (false positives) في المراجعة الآلية. فإذا كان ما حدده الذكاء الاصطناعي كخطأ هو في الواقع منهج مشروع، فقد يفرض عبئا غير ضروري على المؤلف أو يثبط بحثا مشروعا. لذلك يُعد تصميم إبقاء القرار النهائي بيد الإنسان أمرا لا غنى عنه، وإذا انهار هذا الخط الفاصل، فقد تخفض الأتمتة من جودة المراجعة بدلا من رفعها.</p>

<p>ثالثا، كلما تعمقت أتمتة المراجعة، قد ينشأ تراخ إدراكي (cognitive complacency) لدى المراجعين يجعلهم يقبلون حكم الذكاء الاصطناعي دون تمحيص. الموقف القائل “الذكاء الاصطناعي راجعه بالفعل، فلا بد أنه سليم” هو نمط الفشل الأكثر خفاء. المراجعة الآلية أداة تساعد الحكم البشري ولا تحل محله، ويبقى الحكم الجوهري مسؤولية الإنسان في نهاية المطاف. يبدو أن إبقاء PAT مرحلة التعاون محافظة وترك سلطة القرار النهائي للإنسان تصميم واعٍ لهذا الخطر.</p>

<p>باختصار، تُعد PAT مثالا مهما يُظهر أن المراجعة العلمية الآلية بدأت تتجاوز مرحلة العرض التجريبي لتدخل عمليات المؤتمرات الفعلية. غير أن قوتها لا تأتي من نموذج واحد لامع، بل من تصميم حذر يوسّع الاستدلال عبر مراحل متعددة ويترك الحكم النهائي للإنسان. وهذا يتفق مع الدرس الذي تعلمته ThakiCloud من خط أنابيب مراجعة الأبحاث وحلقة التحقق في Paxis. التحقق الجيد ينبع من البنية الجيدة.</p>

<h2 id="المصادر">المصادر</h2>

<ul>
  <li>Towards Automating Scientific Review with Google’s Paper Assistant Tool، arXiv:2606.28277: <a href="https://arxiv.org/abs/2606.28277">arxiv.org/abs/2606.28277</a></li>
  <li>Hugging Face Papers: <a href="https://huggingface.co/papers/2606.28277">huggingface.co/papers/2606.28277</a></li>
</ul>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="research" /><category term="research" /><category term="agents" /><category term="peer-review" /><category term="gemini" /><category term="verification" /><category term="llmops" /><summary type="html"><![CDATA[كشفت جوجل عن أداة مراجعة قائمة على العملاء تسمى PAT، تقرأ الورقة العلمية كاملة للتحقق من النتائج النظرية والتأكد من التجارب واكتشاف الأخطاء المحتملة. من خلال توسيع الاستدلال في Gemini Deep Think، تتجاوز الأداة قيود الطلب الواحد، وقد راجعت أكثر من 4,700 ورقة بحثية في تجربتين تجريبيتين في مؤتمري STOC وICML واكتشفت أخطاء نظرية في عدد كبير من الأبحاث. نستعرض إلى أين وصلت المراجعة العلمية الآلية، وما تعنيه هذه النتائج لخط أنابيب مراجعة الأبحاث في ThakiCloud ولحلقة التحقق في Paxis.]]></summary></entry><entry xml:lang="ar"><title type="html">قراءة دليل الموجّهات من Anthropic: استراتيجية خاصة بكل نموذج لـ Fable 5 وSonnet 5 وOpus 4.8</title><link href="https://thakicloud.github.io/ar/tutorials/anthropic-prompting-guide-latest-models/" rel="alternate" type="text/html" title="قراءة دليل الموجّهات من Anthropic: استراتيجية خاصة بكل نموذج لـ Fable 5 وSonnet 5 وOpus 4.8" /><published>2026-07-04T00:00:00+09:00</published><updated>2026-07-04T00:00:00+09:00</updated><id>https://thakicloud.github.io/ar/tutorials/anthropic-prompting-guide-latest-models</id><content type="html" xml:base="https://thakicloud.github.io/ar/tutorials/anthropic-prompting-guide-latest-models/"><![CDATA[<p><img src="/assets/images/anthropic-prompting-guide-latest-models-hero.png" alt="صورة تجريدية لتعليمات مبنيّة تتراكم وتتجمّع في مخرَج واحد مرتّب" />
<em>تصوير لكيفية تجمّع التعليمات الواضحة والبنية في مخرَج يمكن التنبّؤ به.</em></p>

<h2 id="نظرة-عامة">نظرة عامة</h2>

<p>كتابة الموجّهات جيداً لا تزال ثمانية أعشار حسن استخدام النموذج. مع ازدياد قوة النماذج تتبع التعليمات المرنة إلى حدّ ما، لكن انتزاع شكل وجودة مستقرّين لا يزال يحتاج إلى عقد واضح.</p>

<p>تحتفظ Anthropic بمستند رسمي لأفضل ممارسات الموجّهات لنماذجها الأحدث. يغطّي هذا الدليل النماذج الحالية بما فيها Claude Fable 5 وClaude Sonnet 5 وClaude Opus 4.8، ويفصل أين يتصرّف كل نموذج بشكل مختلف، وأي التقنيات تنطبق عموماً على كل النماذج، وما ينبغي إصلاحه عند الانتقال من جيل أسبق. في هذه المقالة نعرض بنيته وتقنياته الأساسية، ونربطه بكيفية تعامل ThakiCloud مع الموجّهات كعقود لا كارتجال داخل منصة الوكلاء Paxis.</p>

<h2 id="ما-هذا-الدليل">ما هذا الدليل</h2>

<p>مستند الموجّهات من Anthropic منظّم في ثلاثة أجزاء كبيرة.</p>

<p>الأول إرشاد خاص بالنماذج. يشير إلى أين يستجيب Fable 5 وSonnet 5 وOpus 4.8 بشكل مختلف، لتعرف أن الموجّه نفسه قد يحتاج إلى تعديل بحسب النموذج. الثاني تقنيات تنطبق عموماً على كل النماذج الحالية. يغطّي مدى واسعاً من المبادئ العامة إلى تنسيق المخرجات واستخدام الأدوات والتفكير وتصميم الأنظمة الوكيلة. الثالث اعتبارات الترحيل، يرشد إلى كيفية مراجعة الموجّهات المنقولة من جيل أسبق.</p>

<p>مرسومة كصورة، تبدو هذه البنية الثلاثية هكذا.</p>

<pre><code class="language-mermaid">flowchart TB
    A[دليل الموجّهات] --&gt; B[إرشاد خاص بالنماذج]
    A --&gt; C[تقنيات مشتركة]
    A --&gt; D[الترحيل]
    B --&gt; B1[فروق سلوك Fable 5 Sonnet 5 Opus 4.8]
    C --&gt; C1[تعليمات واضحة]
    C --&gt; C2[أمثلة متعددة]
    C --&gt; C3[سلسلة التفكير CoT]
    C --&gt; C4[البنية بوسوم XML]
    C --&gt; C5[موجّهات الأدوار]
    C --&gt; C6[تسلسل الموجّهات]
    C --&gt; C7[التفكير الممتد استخدام الأدوات]
    D --&gt; D1[ترحيل موجّهات الجيل الأسبق]
</code></pre>

<p>بمعزل عن المستند، تنشر Anthropic أيضاً دليلاً تفاعلياً لهندسة الموجّهات في تسعة فصول، لتتعلّم بتشغيل الأمثلة والتمارين مباشرة.</p>

<h2 id="التقنيات-الأساسية">التقنيات الأساسية</h2>

<p>التقنيات التي يشدّد عليها الدليل ليست حيلاً برّاقة بل أساسيات مكرّرة. مرتّبة بحسب الأثر العملي:</p>

<p>التعليمات الواضحة أولاً. اكتب تحديداً ماذا تفعل، وبأي شكل تنتجه، وما تتّخذه معياراً للتقييم. بدلاً من طلب غامض مثل “ساعدني”، حدّد نتيجة واحدة لكل فعل. تحديد شكل المخرَج وحده يرفع الجودة أكثر من غيره.</p>

<p>الأمثلة المتعددة ثانياً. أظهر النبرة والصيغة اللتين تريدهما في مثالين أو ثلاثة فيتّبع النموذج ذلك الإيقاع. حين يكون شكل المخرَج معقّداً بخاصة، فإن إرفاق مثال واحد أدقّ بكثير من وصفه بالكلمات.</p>

<p>سلسلة التفكير ثالثاً. طلب استدلال خطوة بخطوة قبل الجواب يرفع الدقة في الاستدلال المعقّد. غير أن التفكير يكلّف رموزاً، فاستخدمه فقط للعمل الذي يحتاج فعلاً إلى استدلال.</p>

<p>البنية بوسوم XML رابعاً. فصل التعليمات والسياق والأمثلة وبيانات الإدخال بوسوم يمنع النموذج من الخلط بين دور كل جزء. الأثر كبير بخاصة عند التعامل مع سياق طويل.</p>

<p>موجّهات الأدوار خامساً. إعطاء النموذج منظوراً محدّداً أو دور خبير ينتج مفردات وحكماً يلائمان ذلك السياق. وهو مفيد للمراجعة والتدقيق وتحليل مجال محدّد.</p>

<p>تسلسل الموجّهات سادساً. تقسيم طلب كبير واحد إلى عدة مراحل وتمرير مخرَج كل مرحلة إلى التالية يثبّت جودة كل مرحلة أكثر من مطالبة كل شيء دفعة واحدة.</p>

<p>أخيراً هناك التفكير الممتد واستخدام الأدوات وتصميم الأنظمة الوكيلة. التفكير الممتد ميزة تخصّص ميزانية للاستدلال الداخلي، ويغطّي استخدام الأدوات وتصميم الوكلاء الحلقة التي يستدعي فيها النموذج أدوات خارجية ويأخذ النتيجة ليقرّر الفعل التالي. هذه المنطقة التي كبر وزنها في الدليل الأحدث.</p>

<h2 id="دلالات-لمنتجات-thakicloud">دلالات لمنتجات ThakiCloud</h2>

<p>هذا الدليل عملي لنا لأن منصة الوكلاء Paxis من ThakiCloud تتعامل مع الموجّهات بهذه الطريقة بالضبط. Paxis مستوى تحكّم Agent-Native Cloud يعمل فوق ai-platform، ويدير المهارات والأدوات والسياسات وسجلات التدقيق كموارد من الدرجة الأولى. وضمنها، الموجّه ليس شيئاً مرتجلاً يُؤلَّف من جديد كل مرة بل عقد مُحزَّم في مهارة وخاضع للتحكّم في الإصدارات.</p>

<p>تقنية الدليل الأولى، التعليمات الواضحة، تتداخل مباشرة مع مبدأ تصميم مِهاز مهارات Paxis. تتراكم القدرات لا في مِهاز رفيع بل في مهارات سميكة، وتحدّد كل مهارة صراحةً الإدخال والمعالجة والمخرَج وحتى التعافي من الفشل. إذا جعلت الشيفرة تملك شكل المخرَج ومعايير تقييمه، ركّز النموذج على توليد المحتوى فقط ولم يتذبذب التنسيق.</p>

<p>البنية بـ XML وتسلسل الموجّهات يلامسان تنسيق DAG متعدد الوكلاء. تختار Paxis من أكثر من 960 مهارة بواسطة BM25 وتشغّلها في صناديق رمل معزولة، والتسلسل الذي يقسّم مهمة كبيرة إلى مراحل ويمرّر مخرَج كل مرحلة إلى الأمام هو القواعد الأساسية لهذا التنسيق. جعل كل مرحلة مهارة مستقلة يتيح إعادة تشغيل المرحلة الفاشلة فقط، ما يرفع دقة التعافي.</p>

<p>موجّهات الأدوار واستخدام الأدوات يتّحدان مع بوّابات السياسة وسجلات التدقيق. الحلقة التي يستدعي فيها وكيل فرعي أُعطي دوراً محدّداً أدوات ويأخذ النتائج ليقرّر الفعل التالي تصبح مستقلّة بأمان فقط حين يمرّ كل فعل عبر بوّابات سياسة وسجلات تدقيق. ما يسمّيه الدليل تصميم الأنظمة الوكيلة يُترجَم لنا إلى مشكلة التنفيذ المستقلّ القابل للتدقيق.</p>

<p>باختصار، مبادئ الموجّهات الجيدة ومبادئ تصميم منصة وكلاء متينة تشير إلى المكان نفسه جوهرياً. قلّل درجات الحرية واملأ هيكلاً مُتحقَّقاً منه بالمحتوى لترفع متوسط الجودة. يمارس هذا الدليل ذلك المبدأ على مستوى الموجّه، وتمارسه Paxis على مستوى المنصة.</p>

<h2 id="القيود-والاعتراضات">القيود والاعتراضات</h2>

<p>لهذا الدليل تحفّظات أيضاً. أولاً، الإرشاد الخاص بالنماذج يشيخ مع الوقت. حين يُطلَق نموذج أو يُحدَّث، قد يستجيب موجّه نجح بالأمس بشكل مختلف اليوم، فاقرأ الدليل كلقطة للحظة الحالية لا كعقيدة.</p>

<p>ثانياً، معرفة تقنيات كثيرة لا تصنع موجّهاً جيداً. تكديس وسوم XML وسلسلة التفكير وموجّهات الأدوار دفعة واحدة قد يجعل التعليمات ثقيلة ويزيد الرموز فقط. لكل تقنية، معرفة متى لا تستخدمها مهمّة بقدر معرفة متى تستخدمها.</p>

<p>ثالثاً، التفكير الممتد ليس مجانياً. رموز التفكير كلفة، وتشغيل أقصى تفكير لكل مهمة إهدار. كما في منظور توجيه النماذج المتناول سابقاً، يجب أيضاً تخصيص ميزانية التفكير بحسب صعوبة المهمة.</p>

<p>في الختام، قيمة هذا الدليل ليست في تعليم سحر جديد. إنها في شحذ الحكم على متى وكيف تجمع الأساسيات. وتصليب ذلك الحكم في مهارات وسياسة كي لا تعيده كل مرة هو مهمّة المنصة.</p>

<h2 id="المصادر">المصادر</h2>

<ul>
  <li>“Prompting best practices”، Claude Platform Docs: <a href="https://platform.claude.com/docs/en/build-with-claude/prompt-engineering/claude-prompting-best-practices">platform.claude.com/docs/en/build-with-claude/prompt-engineering/claude-prompting-best-practices</a></li>
  <li>“Prompt engineering overview”، Anthropic Docs: <a href="https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview">docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview</a></li>
  <li>“Anthropic’s Interactive Prompt Engineering Tutorial”، GitHub: <a href="https://github.com/anthropics/prompt-eng-interactive-tutorial">github.com/anthropics/prompt-eng-interactive-tutorial</a></li>
</ul>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="tutorials" /><category term="prompt-engineering" /><category term="claude" /><category term="developer-experience" /><category term="agent-native" /><category term="paxis" /><summary type="html"><![CDATA[نستعرض دليل Anthropic الرسمي لأفضل ممارسات الموجّهات للنماذج الأحدث. فروق النماذج، والتقنيات الأساسية (الوضوح، الأمثلة، XML، سلسلة التفكير، الأدوار، التسلسل، التفكير الممتد)، والترحيل. ونربطه بكيفية تصليب ThakiCloud للموجّهات كعقود داخل مِهاز مهارات Paxis.]]></summary></entry><entry xml:lang="en"><title type="html">You Are Not Adopting Agents, You Are Missing a Control Plane to Run Them</title><link href="https://thakicloud.github.io/en/agentops/enterprise-agents-need-control-plane/" rel="alternate" type="text/html" title="You Are Not Adopting Agents, You Are Missing a Control Plane to Run Them" /><published>2026-07-04T00:00:00+09:00</published><updated>2026-07-04T00:00:00+09:00</updated><id>https://thakicloud.github.io/en/agentops/enterprise-agents-need-control-plane</id><content type="html" xml:base="https://thakicloud.github.io/en/agentops/enterprise-agents-need-control-plane/"><![CDATA[<h2 id="from-demo-to-night-shift">From Demo to Night Shift</h2>

<p>Read a single day of domestic AI news from the first half of this year and the pattern is clear. Insurers are pushing AI past chat support into core work like accident fault assessment and underwriting. Korea Midland Power has moved beyond generative AI to an autonomous, agentic AI that actually executes work across plant operations. Running on an air-gapped network, it automatically compiles equipment anomalies and briefs them every morning. Microsoft and Amazon Web Services are each building dedicated organizations, thousands of people strong, to embed agents inside customer sites.</p>

<p>They share one thing: the question has changed. Until last year the question in the meeting room was “should we adopt this.” The question practitioners are wrestling with now is “how do we run this safely.” As agents step off the demo stage and take the night shift, the center of gravity has shifted from performance to operations.</p>

<h2 id="the-bottleneck-is-not-the-model">The Bottleneck Is Not the Model</h2>

<p>Let me clear away the common misconception first: the idea that a better model will solve it. Put an agent in the field and the thing that blocks it is not the model’s reasoning ability. It is three operational walls.</p>

<p>The first is unauditability. If you cannot reconstruct after the fact why the agent made a decision, and which tools it called in what order, then in heavily regulated domains like finance or the public sector, production approval simply never comes. Insurance underwriting automation stands exactly on this line. Right or wrong, a system that cannot explain its decision path will not survive in front of a supervisor.</p>

<p>The second is sovereignty and supply chain. The point that recent sovereign-AI coverage drives home is the core issue: model sovereignty alone is no longer enough. You must also verify the provenance and integrity of the open-source packages, datasets, and agent tooling layer on which the model actually runs. The more a financial firm handles sensitive medical and personal data, the more network isolation and on-prem become preconditions rather than negotiating points.</p>

<p>The third is safe execution. The moment an agent runs code and calls external tools, an unisolated execution environment is itself a seed of incident. A single wrong tool call can lead to data exfiltration or an irreversible change.</p>

<p>None of these three walls disappears by scaling the model one notch. They are all questions of where you place operations.</p>

<h2 id="why-conventional-clouds-cannot-solve-it">Why Conventional Clouds Cannot Solve It</h2>

<p>Over the last fifteen years, the cloud succeeded at abstracting virtual machines, databases, and networks into first-class resources. Spinning up a server on demand, attaching permissions, and leaving logs became standardized at the platform level. But put an agent on top and the story changes.</p>

<p>The core concepts of an agent are not servers. They are: which capability it uses, which tools it can access, under which policy it operates, and what it did. In conventional clouds these four remain not first-class resources but side effects scattered through application code. Audit logs are left to each team, policy is buried in prompt sentences, and tool permissions are managed through API keys scattered here and there.</p>

<p>The result is that control rests on practice rather than on the platform. When teams change and people leave, that practice leaves with them. “We do it that way by convention” is not an answer that holds up in front of a regulator. Control has to be reproducible and enforced, and that is the platform’s responsibility, not that of individual code.</p>

<h2 id="control-as-platform-not-practice">Control as Platform, Not Practice</h2>

<p>The premise Paxis chose is simple: the first-class resources of the agent era are not virtual machines but Skills, Tools, Policies, and Audit Logs. Just as conventional clouds handle servers and networks, Paxis raises these four into resources the platform manages directly.</p>

<p>Skills treats an agent’s capabilities as versioned resources. Registering, verifying, and revoking a capability happens at the platform level, not inside an individual project. Tools defines tool access declaratively. Which agent may call which tool and when is judged by policy up front. Policies specifies autonomy explicitly. Because execution proceeds only through a defined approval gate, the line an agent must not cross is embedded in the execution path rather than in a document. Audit Logs is the default gateway every action passes through. Reconstruction after the fact is the default, not the exception.</p>

<p><img src="/assets/images/enterprise-agents-need-control-plane-diagram.svg" alt="A control-plane structure in which every agent action passes a policy gate and audit log and runs on top of sovereign Kubernetes" /></p>

<p><em>Every agent action is checked at the policy gate against autonomy and approval rules; only allowed execution proceeds through skills, tools, and an isolated sandbox. Regardless of the outcome, every action is recorded in the audit log, and the whole process runs on top of sovereign Kubernetes that is on-prem and air-gapped.</em></p>

<p>Mapped onto the three walls, it lines up like this:</p>

<table>
  <thead>
    <tr>
      <th>Wall in the field</th>
      <th>Limit of the conventional approach</th>
      <th>The Paxis response</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>Unauditability</td>
      <td>Logging that differs per team, decision path not reconstructable</td>
      <td>Every tool call and decision passes Audit Logs; reconstruction is the default</td>
    </tr>
    <tr>
      <td>Sovereignty and supply chain</td>
      <td>Only the model is controlled; the skill, tool, and data layers are a blind spot</td>
      <td>Skills and Tools registered and verified as first-class resources, running on-prem on sovereign K8s</td>
    </tr>
    <tr>
      <td>Safe execution</td>
      <td>Unisolated tool calls, permissions scattered across API keys</td>
      <td>Only execution that passes the policy gate runs in an isolated sandbox</td>
    </tr>
  </tbody>
</table>

<p>The point is that when an agent schedules its own work, runs code in an isolated sandbox, and pulls knowledge from a team wiki, every one of those actions must pass through the policy gate and the audit log. Control rests on the structure of the platform, not on the diligence of a person.</p>

<h2 id="mapping-it-straight-onto-todays-news">Mapping It Straight Onto Today’s News</h2>

<p>For an insurer, underwriting automation makes auditable execution a condition of approval. If no decision path remains, it will not clear the regulatory bar, and Audit Logs fills that requirement. The argument that sovereign AI must widen into supply-chain sovereignty reads as a demand to verify the provenance and integrity of not just the model but the skill and tool layers in the deployment pipeline. The network isolation and on-prem that financial firms require connect directly to the premise of running agents on sovereign K8s infrastructure.</p>

<p>You can read the same news two ways. One is the surface: “agent adoption is accelerating.” The other is the question: “is the operational foundation ready to carry that speed.” Now that the adoption bottleneck has moved from performance to operations, whoever answers the second question takes the next step.</p>

<h2 id="the-question-that-remains">The Question That Remains</h2>

<p>Infrastructure competitiveness in the agent era is not decided by one faster GPU. It is decided by whether there is a control plane you can trust to hand work to. Adoption has already begun, and the choice left to practitioners is whether to leave operations to practice or to a platform. Paxis chose the latter. An Agent-Native Cloud that treats an agent’s capabilities, tools, policies, and audits as first-class resources from the start is the answer.</p>

<p>If you are weighing how to put agents into production in a field with strong audit and sovereignty requirements, like finance or the public sector, you can validate it together with ThakiCloud at the pilot stage. Laying the control plane from the start, instead of bolting it on later, turns out to be the faster path.</p>

<h2 id="sources">Sources</h2>

<ul>
  <li>Korea Midland Power briefs equipment anomalies every morning with HI-KOMI, an autonomous agentic AI on an air-gapped network: <a href="https://www.hankyung.com/article/2026062934641">Hankyung</a></li>
  <li>DB Insurance determines automobile accident fault from dashcam video with AI, averaging 5 seconds at 92.4% accuracy: <a href="https://www.ajunews.com/view/20260624092401339">Ajunews</a></li>
  <li>AWS embeds agent deployment inside customer sites with a $1 billion Forward Deployed Engineering organization: <a href="https://www.aboutamazon.com/news/aws/aws-1-billion-forward-deployed-ai-engineers">About Amazon</a></li>
  <li>Microsoft stands up a dedicated AI deployment organization (Microsoft Frontier) with a $2.5 billion, 6,000-person commitment: <a href="https://techcrunch.com/2026/07/02/microsoft-launches-its-own-ai-deployment-company-with-2-5-billion-commitment/">TechCrunch</a></li>
</ul>]]></content><author><name>{&quot;name&quot;=&gt;nil, &quot;avatar&quot;=&gt;nil, &quot;bio&quot;=&gt;nil, &quot;location&quot;=&gt;&quot;Seoul, Korea&quot;, &quot;email&quot;=&gt;&quot;info@thakicloud.co.kr&quot;, &quot;uri&quot;=&gt;nil, &quot;home&quot;=&gt;nil, &quot;links&quot;=&gt;[{&quot;label&quot;=&gt;&quot;Website&quot;, &quot;icon&quot;=&gt;&quot;fas fa-fw fa-link&quot;, &quot;url&quot;=&gt;&quot;https://thakicloud.co.kr&quot;}, {&quot;label&quot;=&gt;&quot;GitHub&quot;, &quot;icon&quot;=&gt;&quot;fab fa-fw fa-github&quot;, &quot;url&quot;=&gt;&quot;https://github.com/thakicloud&quot;}]}</name><email>info@thakicloud.co.kr</email></author><category term="agentops" /><category term="agent-native-cloud" /><category term="paxis" /><category term="agentops" /><category term="enterprise-ai" /><category term="governance" /><category term="sovereign-ai" /><category term="audit-log" /><category term="thakicloud" /><summary type="html"><![CDATA[The first half of 2026 shows AI agents stepping off the demo stage and onto the night shift, in insurance underwriting and on power plant operations. What blocks them in production is not model performance but an operational wall: auditability, sovereignty, and safe execution. Here is why conventional clouds cannot clear that wall, and how an Agent-Native Cloud that treats Skills, Tools, Policies, and Audit Logs as first-class resources is different, from the Paxis point of view.]]></summary></entry></feed>