OSS

DeepSeek-R1-0528-Qwen3-8B: 오픈소스 LLM의 새로운 지평

DeepSeek가 최근 출시한 DeepSeek-R1-0528-Qwen3-8B는 오픈소스 대규모 언어 모델(LLM)의 새로운 이정표를 세웠습니다. 이 모델은 단일 GPU에서도 실행 가능하면서도 뛰어난 성능을 보여주는 혁신적인 모델입니다.

Gemma 3n E2B - 모바일에서 돌아가는 멀티모달 AI 혁신

Google DeepMind가 2025년 새해를 맞아 공개한 Gemma 3n E2B는 AI 모델의 새로운 패러다임을 제시합니다. 스마트폰에서도 돌아가는 멀티모달 AI라는 혁신적인 컨셉으로, 텍스트, 이미지, 비디오, 오디오를 모두 처리할 수 있으면서도 극도로 경량화된 모델입니다.

Lingshu: 의료 분야를 위한 통합 멀티모달 파운데이션 모델

최근 멀티모달 대규모 언어 모델(MLLM)들이 일반적인 시각적 요소들을 이해하는 데 인상적인 성능을 보여주고 있지만, 의료 분야에서의 활용은 여전히 제한적입니다. 이러한 문제를 해결하기 위해 알리바바 DAMO Academy에서 의료 전문 MLLM인 Lingshu를 개발했습니다.

Qwen2.5-Omni: 알리바바 클라우드의 차세대 멀티모달 AI 모델

알리바바 클라우드의 Qwen 팀이 최근 발표한 Qwen2.5-Omni는 텍스트, 오디오, 비전, 비디오를 통합적으로 처리할 수 있는 엔드-투-엔드 멀티모달 AI 모델입니다. 이 모델은 실시간 음성 생성 기능까지 지원하여 더욱 자연스러운 인간-AI 상호작용을 가능하게 합니다.

Qwen3-Embedding & Reranker 시리즈 완전 가이드

Alibaba에서 발표한 Qwen3-Embedding과 Qwen3-Reranker 시리즈가 다국어 텍스트 임베딩과 관련도 랭킹 분야에서 새로운 기준을 제시하고 있습니다. 119개 언어를 지원하며 MMTEB, MTEB, MTEB-Code에서 최고 성능을 달성한 이 모델들을 자세히 살...

OpenThoughts3: 추론 모델의 새로운 SOTA 데이터 레시피

수학, 코딩, 과학 분야의 추론 능력에서 새로운 기준을 제시하는 OpenThoughts3이 공개되었습니다. OpenThinker3-7B 모델은 해당 규모에서 SOTA 오픈 데이터 추론 모델로, 강화학습 없이 순수 지도학습만으로 놀라운 성능을 달성했습니다.