LLM OPS

Mercury: Diffusion 기반 초고속 언어 모델의 혁신

Inception Labs에서 개발한 Mercury는 기존 autoregressive 모델 대비 최대 10배 빠른 추론 속도를 달성하며, 코딩 분야에서 새로운 속도-품질 프론티어를 개척하는 diffusion 기반 LLM입니다.

AG-UI: AI 에이전트와 프론트엔드를 연결하는 혁신적인 프로토콜

AG-UI는 AI 에이전트와 사용자 인터페이스 간의 상호작용을 표준화하는 가볍고 이벤트 기반의 프로토콜입니다. LangGraph, CrewAI, Mastra 등 다양한 에이전트 프레임워크를 지원하며, 실시간 스트리밍, 양방향 상태 동기화, 생성형 UI 등의 기능을 제공합니다.

무료로 LLM 파인튜닝하기: Unsloth Notebooks 완전 가이드

LLM(Large Language Model) 파인튜닝을 무료로, 그리고 쉽게 시작할 수 있는 방법을 찾고 계신가요? Unsloth Notebooks는 100개 이상의 Jupyter 노트북을 통해 다양한 LLM을 Google Colab과 Kaggle에서 무료로 파인튜닝할 수 있는 ...

AI 개발자를 위한 필수 컬렉션: Awesome LLM Apps

AI 개발에 관심이 있는 개발자들에게 정말 유용한 오픈소스 프로젝트를 소개하려고 합니다. Awesome LLM Apps는 RAG, AI 에이전트, 멀티 에이전트 팀, MCP, 음성 에이전트 등을 활용한 LLM 애플리케이션들을 한곳에 모아놓은 큐레이션 컬렉션입니다.

LLM Tool Calling 완전 정복 - Claude & GPT-4 실전 가이드

AI 모델이 단순한 텍스트 생성을 넘어 실제 도구를 사용하여 복잡한 작업을 수행할 수 있게 하는 Tool Calling은 현대 AI 시스템의 핵심 기능입니다. Claude와 GPT-4의 Tool Calling 활용법부터 IDE 통합, 데스크톱 자동화까지 실전에서 바로 적용할 수 있...

Google A2A 프로토콜로 구축하는 안전한 에이전틱 AI 시스템

에이전틱 AI의 급속한 발전과 함께, 여러 에이전트가 협력하여 복잡한 작업을 수행하는 멀티 에이전트 시스템이 주목받고 있습니다. 하지만 이러한 시스템에서 가장 중요한 과제는 에이전트 간의 안전하고 표준화된 통신입니다. Google이 발표한 Agent-to-Agent(A2A) 프로토...

Qwen3-Embedding 파인튜닝 완전 가이드

이 포스트에서는 Qwen3-Embedding 모델을 사용자 정의 검색 및 추천 작업에 맞게 파인튜닝하는 방법을 자세히 알아보겠습니다. DeepSpeed와 LoRA 기법을 활용한 효율적인 미세 조정 과정을 단계별로 설명드리겠습니다.

Evalchemy: LLM 자동 평가의 새로운 표준

LLM 개발과 배포에서 가장 중요한 과정 중 하나인 모델 평가를 자동화하고 표준화하는 혁신적인 도구, Evalchemy를 소개합니다. ML Foundations에서 개발한 이 프레임워크는 다양한 벤치마크를 통한 LLM 자동 평가를 간편하고 효율적으로 만들어줍니다.

DeepEval 소개

DeepEval: LLM 시스템 평가를 위한 프레임워크 분석

MLOps 현장 속으로

UC Berkeley 인터뷰 연구로 본 성공 전략, 난제, 그리고 미래