여러분이 수학 문제를 풀 때를 생각해보세요.
처음엔 선생님이 단계별로 풀이 과정을 보여주죠.
"첫 번째로 이렇게 하고, 두 번째로 저렇게 해서..." 하지만 정말 수학을 잘하게 되려면 어떻게 해야 할까요?
바로 스스로 다양한 방법을 시도해보고, 틀려도 다시 도전하면서 자신만의 풀이법을 찾아가는 것이겠죠.
최근 중국의 한 AI 회사가 만든 'DeepSeek-R1'이라는 인공지능이 바로 이런 방식으로 학습했다.
그리고 그 연구 결과가 세계 최고 과학 저널인 Nature에 실리면서 전 세계가 주목하고 있다.

기존 AI는 어떻게 배웠을까?
지금까지 대부분의 AI는 마치 여러분이 모범답안을 그대로 따라 쓰는 것처럼 학습했다.
인간이 "이 문제는 이렇게 풀어야 해"라고 단계별로 보여준 수많은 예시를 보고 따라 배우는 거죠.
마치 요리책을 보고 그대로 따라 하는 것과 비슷해요.
DeepSeek-R1은 뭐가 다를까?
하지만 DeepSeek-R1은 완전히 다른 방식을 택했다. 인간의 풀이 과정은 전혀 보여주지 않고,
오직 "정답이 맞으면 칭찬, 틀리면 다시 시도"라는 방식으로만 학습시켰어요.
마치 여러분이 요리책 없이 직접 재료를 조합해보면서 맛있는 요리법을 찾아가는 것처럼요.
놀라운 건 이렇게 학습한 AI가 스스로 정말 똑똑한 전략들을 개발해낸 것:
- 자신의 답을 다시 한 번 검토하기
- 다른 방법으로도 풀어보기
- 막히면 다른 접근법 시도하기
얼마나 대단한 결과일까?
미국 수학 올림피아드 문제에서 15.6%밖에 못 맞히던 것이 86.7%까지 맞힐 수 있게 되었어요.
더 놀라운 건 이 모든 걸 단 3억 원 정도의 비용으로 해냈다는 것이다.
다른 회사들이 수백억 원을 쓰는 것에 비하면 정말 적은 비용이죠.
우리에게 주는 교훈
이 연구가 우리에게 주는 메시지는 명확하다.
진정한 학습은 단순히 정답을 외우는 게 아니라,
스스로 시행착오를 겪으면서 자신만의 방법을 찾아가는 것이라는 점이라는 것.
https://www.nature.com/articles/s41586-025-09422-z
'AI' 카테고리의 다른 글
| [ AI/LLM ]Less is More: Recursive Reasoning with Tiny Networks(Feat. Samsung) (0) | 2025.11.02 |
|---|---|
| [ AI/MCP ] REFRAG: RAG (0) | 2025.10.16 |
| [ AI/anthropic-4 ]모델이 계산을 이해하는 방식 (feat. Claude 3.5 Haiku) (5) | 2025.07.27 |
| [ AI/학습 ]우리는 어떻게 언어를 배우는 가?(Feat.글) (4) | 2025.07.21 |
| [ AI/Chat-GPT ] AI Assistant 모델의 대중화 ?(Feat. Agent) (3) | 2025.07.18 |