“에르되시 문제를 풀어도 AGI가 아니다”

2026년 1월, 다보스 세계경제포럼(WEF)에 두 사람이 나란히 앉았습니다. DeepMind의 데미스 허사비스(Demis Hassabis)와 Anthropic의 다리오 아모데이(Dario Amodei)였습니다. 당시 분위기는 뜨거웠습니다. 대형 언어 모델이 수학 올림피아드 문제를 풀고, 바둑에서 인간을 압도하고, 단백질 구조를 예측하는 시대였으니까요. 업계 여기저기서 AGI가 코앞이라는 말이 나왔습니다.

허사비스는 달리 말했습니다.

“오늘날의 시스템은 AGI와 전혀 가깝지 않습니다. 에르되시 문제를 몇 개 풀든 상관없습니다.” (원문 일부: “Today’s systems are nowhere near [AGI]” — Fortune, 2026년 1월 23일)

에르되시 문제는 세계에서 가장 까다로운 수학 난제 중 하나입니다. AI가 그것을 푼다면 분명 인상적입니다. 그래도 허사비스는 그것이 AGI의 기준이 아니라고 잘라 말했습니다. 왜일까요.

이 질문이 이 글의 출발점입니다. AI 연구자만의 이야기가 아닙니다. AI를 도입하고, AI 팀을 꾸리고, AI 제품을 만드는 조직이라면 모두 해당됩니다.


허사비스가 그은 선: “이해”와 “패턴 매칭”

허사비스가 AGI의 기준으로 제시한 것은 ‘에르되시 문제 풀기’가 아닙니다. 그가 제시한 기준은 더 높습니다. 다수 매체가 보도한 이른바 “아인슈타인 테스트”입니다. 기존에 없던 물리 이론을 독창적으로 제안할 수 있는 능력, 즉 통계적 패턴 재현이 아니라 실질적인 이해(understanding)를 갖춘 시스템이어야 한다는 것입니다.

그렇다면 오늘의 LLM은 어디쯤 있을까요. 아무리 방대한 데이터를 학습하고 정교한 추론을 흉내 내도, 그것이 “이해”인지 “통계적 패턴 재현”인지는 여전히 열린 질문입니다. 허사비스 본인도 같은 다보스 패널에서 “한두 번의 돌파구가 더 필요하다”고 말했습니다. 타임라인은 “5~10년”이었습니다.

이야기는 거기서 끝나지 않습니다.


4개월 만에 바뀐 타임라인: 자극적 표현의 의도적 사용

다보스 발언으로부터 약 4개월 뒤인 2026년 5월 26일, Google I/O 직후 Axios와의 인터뷰에서 허사비스는 다른 뉘앙스로 말했습니다. “AGI가 아마도 향후 5년 안에 도달할 것”이라는 표현이었습니다. 일부 매체는 “3~4년 내 AGI”로 요약했고, 그 발언은 빠르게 퍼졌습니다.

그런데 허사비스는 같은 인터뷰에서 이렇게 덧붙였습니다. “내가 사용한 표현 중 일부는 의도적으로 자극적이었습니다.” (원문: “some of the terms I used were a little bit provocative” — Axios, 2026-05-26)

1월의 신중한 발언과 5월의 상향된 타임라인. 같은 사람이, 같은 해에, 다른 맥락에서 한 말입니다. 어느 쪽이 ‘진짜’ 허사비스의 생각일까요.

아마도 둘 다입니다. 그 긴장감 자체가, 기대 관리를 문화로 삼아야 하는 이유를 보여줍니다.


하이프 사이클이 조직에 남기는 상처

AI 분야는 유독 과대광고 사이클이 빠릅니다. 가트너의 하이프 사이클을 찾아보지 않아도, 지난 10여 년간 “이번엔 다르다”는 말이 몇 번 반복됐는지 기억하실 겁니다. 딥러닝 혁명, 챗봇 시대, GPT-3, ChatGPT, 에이전트 AI… 매 사이클마다 조직들은 흥분해서 투자하고, 현실의 벽에 부딪히고, 실망하고, 다음 사이클을 기다렸습니다.

이 패턴이 조직에 남기는 상처는 세 가지입니다.

첫째, 신뢰 자본의 소진입니다. “AI가 이 문제를 6개월 안에 해결할 것”이라고 발표했다가 실패하면, 다음에 정말로 의미 있는 AI 도입 제안을 해도 사람들은 귀를 닫습니다. 리더십의 신뢰도는 한번 깎이면 되돌리기 어렵습니다.

둘째, 실패 정의의 왜곡입니다. 과도한 기대치로 시작하면, 실제로는 상당한 성과를 거뒀어도 “실패”로 낙인찍힙니다. 팀은 정당한 성취감 대신 패배감을 안고 다음 프로젝트로 넘어갑니다. 번아웃과 이직이 뒤따릅니다.

셋째, 방향 상실입니다. 하이프에 편승해 시작한 프로젝트는 방향을 잡기 어렵습니다. “AGI 같은 AI를 만들어라”는 지시는 팀에게 아무것도 알려주지 않습니다. 무엇을 만들어야 하는지, 어떻게 성공을 측정하는지, 언제 충분하다고 볼 수 있는지, 이 질문들에 답이 없으면 팀은 표류합니다.


허사비스가 실천하는 것: 로드맵의 철학

DeepMind의 궤적을 보면 기대 관리를 어떻게 실천하는지 읽힙니다.

AlphaGo(2016)는 바둑이라는 명확하게 정의된 문제를 목표로 했습니다. AlphaFold(2020)는 단백질 구조 예측이라는 검증 가능한 과학적 문제를 풀었습니다. AGI는? 허사비스에게 그것은 아직 “한두 번의 돌파구”가 필요한 미래의 과제입니다.

이 로드맵의 패턴은 일관됩니다. 각 단계는 현재 역량으로 달성 가능한 목표를 먼저 정하고, 그것을 실제로 달성하면서 다음 단계를 준비합니다. “5년 안에 AGI”라는 슬로건 대신 “이번 단계에서 무엇을 증명할 것인가”를 묻는 방식입니다.

그렇다고 보수적인 태도라고 보기는 어렵습니다. 허사비스가 2026년 5월에 “자극적인 표현을 의도적으로 사용했다”고 인정한 것은, 그가 야심 찬 언어로 기대를 높이는 것의 가치를 알고 있다는 뜻이기도 합니다. 핵심은 그것이 ‘의도적’이었다는 점입니다. 어디까지가 확실하고 어디서부터가 의도된 도발인지, 본인이 정확히 알고 있다는 것입니다.


기대 관리 문화란 무엇인가

AI 조직에서 “기대 관리”는 종종 부정적으로 들립니다. “기대를 낮춰라”, “실망을 미리 예방해라” 같은 방어적 자세로 오해받습니다. 허사비스의 접근은 그런 것이 아닙니다.

정직한 기대 관리는 세 가지로 정리됩니다.

1. 현재 역량과 미래 가능성을 구분하는 언어를 사용하십시오. “이 모델은 X를 할 수 있습니다”와 “이 방향으로 가면 X가 가능해질 것입니다”는 다른 발언입니다. 팀원, 이사회, 고객에게 이 두 가지를 명확히 구분해서 말하는 것이 신뢰의 기반입니다. 허사비스가 “오늘의 시스템”과 “한두 번의 돌파구 이후 시스템”을 구분한 것처럼 말입니다.

2. 성공 기준을 측정 가능하게 정의하십시오. “AI 도입으로 업무 효율을 높인다”는 목표는 성공 여부를 알 수 없습니다. “AI 도입 후 6개월 시점에 X 업무 처리 시간을 30% 단축한다”는 목표는 달성 여부가 명확합니다. AlphaFold가 단백질 구조 예측 정확도를 기존 최고 수준 대비 수치로 정의하고 성공을 측정했듯, AI 프로젝트도 마찬가지입니다.

3. 모르는 것을 모른다고 말할 수 있는 문화를 만드십시오. 허사비스가 “자극적인 표현이었다”고 인정할 수 있었던 것은, 그런 인정이 오히려 신뢰를 높인다는 것을 알기 때문입니다. 조직 안에서 “아직 모릅니다”, “예상보다 어렵습니다”, “타임라인을 조정해야 합니다”라고 말할 수 없다면, 사람들은 좋은 소식만 위로 올리고 나쁜 소식은 숨깁니다. 그 숨겨진 문제는 어느 날 한꺼번에 터집니다.


환멸 주기를 깨는 방법

AI 도입에서 가장 흔한 실패 패턴은 단순합니다. 흥분해서 시작 → 과도한 기대 → 현실의 저항 → 실망 → “AI는 역시 별것 없다” → 다음 하이프까지 투자 중단.

이 주기를 깨려면 중간 단계가 필요합니다. 흥분해서 시작하되 달성 가능한 첫 단계를 정의하고, 그 단계를 실제로 달성하고, 성과를 가시화한 뒤 다음 단계로 넘어가는 것입니다.

이것이 “작게 생각하라”는 말은 아닙니다. DeepMind는 AlphaGo에서 시작해 AlphaFold를 만들었고, 지금은 AGI를 향해 가고 있습니다. 목표는 크지만 각 단계는 현실적으로 설계됩니다.

이 접근이 실제로 작동하는 조직은 공통된 습관이 있습니다. 새로운 AI 도입을 시작할 때 “이것이 성공한 상태는 어떤 모습인가”를 먼저 묻습니다. 6개월 후 그 질문에 답할 수 있는지를 확인합니다. 실패했을 때는 “왜 기대와 달랐는가”를 사후에 기록합니다. 그 기록이 다음 프로젝트의 기대 설정을 조금 더 현실적으로 만듭니다.


조직에의 함의: 현실주의를 시스템으로 만들어라

허사비스의 현실주의가 개인의 덕목에 그친다면, 그 사람이 떠날 때 함께 사라집니다. 기대 관리가 조직 문화가 되려면 시스템이 필요합니다.

ThakiCloud에서도 이 문제를 자주 마주합니다. AI 플랫폼을 만드는 회사로서, 고객에게 AI의 가능성을 설명하는 일과 그 한계를 정직하게 이야기하는 일 사이에서 매일 긴장을 느낍니다. 한쪽으로 기울면 과대 약속이 되고, 다른 쪽으로 기울면 기회를 놓칩니다.

저희가 시도하고 있는 것 중 하나는 프로젝트 시작 시점에 “이 단계에서 달성하지 못하는 것”의 목록을 명시적으로 작성하는 것입니다. 무엇을 하겠다는 목록보다 무엇을 하지 않겠다는 목록이 기대를 현실에 맞추는 데 더 효과적이라는 것을 경험으로 배웠습니다.

허사비스가 “오늘의 시스템은 AGI와 전혀 가깝지 않다”고 말할 수 있는 것은 AI의 미래에 비관적이어서가 아닙니다. 그는 AlphaFold로 생물학의 지형을 바꾼 사람입니다. 현재 시스템의 한계를 명확히 말하는 것은, 다음 단계의 돌파구를 향해 방향을 잡고 있기 때문입니다.

현실주의는 꿈을 포기하는 게 아닙니다. 그 꿈까지의 거리를 정확히 재는 것입니다.


결론: 정직함이 가장 강한 문화 자산이다

AI 분야에서 가장 쉬운 일은 흥분시키는 것입니다. “AGI가 3년 안에 온다”, “이 모델이 모든 것을 바꾼다”, “지금 올라타지 않으면 늦는다”. 이런 말은 투자를 끌어모으고, 채용 문의를 늘리고, 미디어의 주목을 받습니다.

가장 어려운 일은 그 흥분 속에서 “그러나 지금 이것은 아직 가능하지 않습니다”라고 말하는 것입니다.

허사비스는 2026년 1월 다보스에서 그 어려운 말을 했습니다. 에르되시 문제를 풀어도 AGI가 아니라고, 한두 번의 돌파구가 더 필요하다고. 그리고 5월에는 자극적인 표현을 의도적으로 사용했다고 스스로 인정했습니다.

이 두 태도가 함께 작동할 때 조직의 신뢰는 쌓입니다. 한계를 명확히 말하는 것, 과장했을 때 그것을 인정하는 것. 한 번의 과대광고로 얻는 단기 관심보다 꾸준히 쌓인 정직함이 훨씬 강한 문화 자산입니다.

AI 조직을 이끄는 사람들에게 허사비스의 접근은 하나의 기준점이 됩니다. 현재의 AI는 무엇을 할 수 있는가. 무엇은 아직 할 수 없는가. 다음 단계는 무엇이며, 어떤 돌파구를 필요로 하는가. 이 세 가지 질문에 정직하게 답하는 문화가, AGI가 오든 오지 않든 지속 가능한 AI 조직의 기반이 됩니다.


출처

  • Fortune (2026-01-23): “DeepMind’s Demis Hassabis, Anthropic’s Dario Amodei, Yann LeCun at AI Davos” — https://fortune.com/2026/01/23/deepmind-demis-hassabis-anthropic-dario-amodei-yann-lecun-ai-davos/
  • WEF Radio Davos Podcast (2026-01): “AI & AGI — Dario Amodei, Demis Hassabis” — https://www.weforum.org/podcasts/radio-davos/episodes/ai-agi-dario-amodei-demis-hassabis/
  • Axios (2026-05-26): “DeepMind CEO Demis Hassabis on AGI timeline” — https://www.axios.com/2026/05/26/deepmind-ceo-demis-hassabis
  • Sherwood News: “Google DeepMind’s Hassabis: AGI is 3 to 4 years away” — https://sherwood.news/tech/google-deepminds-hassabis-agi-is-3-to-4-years-away/
  • CryptoBriefing: “DeepMind Hassabis AGI Einstein Test” — https://cryptobriefing.com/deepmind-hassabis-agi-einstein-test/