Gemma 3n E2B - 모바일에서 돌아가는 멀티모달 AI 혁신
Google DeepMind가 2025년 새해를 맞아 공개한 Gemma 3n E2B는 AI 모델의 새로운 패러다임을 제시합니다. 스마트폰에서도 돌아가는 멀티모달 AI라는 혁신적인 컨셉으로, 텍스트, 이미지, 비디오, 오디오를 모두 처리할 수 있으면서도 극도로 경량화된 모델입니다.
Google DeepMind가 2025년 새해를 맞아 공개한 Gemma 3n E2B는 AI 모델의 새로운 패러다임을 제시합니다. 스마트폰에서도 돌아가는 멀티모달 AI라는 혁신적인 컨셉으로, 텍스트, 이미지, 비디오, 오디오를 모두 처리할 수 있으면서도 극도로 경량화된 모델입니다.
최근 멀티모달 대규모 언어 모델(MLLM)들이 일반적인 시각적 요소들을 이해하는 데 인상적인 성능을 보여주고 있지만, 의료 분야에서의 활용은 여전히 제한적입니다. 이러한 문제를 해결하기 위해 알리바바 DAMO Academy에서 의료 전문 MLLM인 Lingshu를 개발했습니다.
OpenAI의 CEO 샘 알트만이 자신의 블로그에 “The Gentle Singularity(젠틀 특이점)”라는 제목의 글을 발표했습니다. 이 글에서 그는 현재 AI 발전 상황과 앞으로의 전망에 대한 깊이 있는 통찰을 제공합니다.
같은 날, 같은 주제로 정반대 글을 쓴 두 개발자. Glyph Lefkowitz의 회의론과 Armin Ronacher의 낙관론을 통해 본 2025년 AI 담론의 진짜 모습
LLM(Large Language Model) 파인튜닝을 무료로, 그리고 쉽게 시작할 수 있는 방법을 찾고 계신가요? Unsloth Notebooks는 100개 이상의 Jupyter 노트북을 통해 다양한 LLM을 Google Colab과 Kaggle에서 무료로 파인튜닝할 수 있는 ...