AI가 80년 묵은 수학 문제를 푼 게 코드를 짜는 우리에게 의미하는 것
핵심 요약 (TL;DR)
5월 20일 OpenAI의 Greg Brockman이 자사 모델이 80년간 안 풀린 Erdős 1946 평면 단위거리(planar unit distance) conjecture를 자율적으로 반증했다고 발표했습니다. 모델은 기존 geometry 트릭이 아니라 algebraic number theory(대수적 수론)로 문제를 옮겨 새 family of constructions를 찾았고, Hacker News에서는 500점 넘는 토론·340개 넘는 댓글로 'interpolation vs extrapolation' 대논쟁이 벌어졌습니다. 바이브코더 입장에서 의미는 'AI를 copilot이 아니라 co-discoverer로 쓰는 워크플로우'가 정당화됐다는 점입니다.
'AI가 발견을 한다'는 말의 다른 의미
저는 솔직히 처음에 그 트윗을 봤을 때 회의적이었습니다. '80년 묵은 수학 문제를 풀었다'는 표현은 너무 자주 쓰이는 마케팅 카피잖아요. 그런데 자료를 따라가보니, 이번 사건의 핵심은 '어떤 conjecture가 깨졌는가'가 아니라 '어떤 식으로 깨졌는가' 였습니다.
문제는 Paul Erdős가 1946년에 던진 평면 단위거리 관련 conjecture입니다. 약 80년간 수학자들은 정사각 격자(square grid)와 비슷한 구조가 최적일 거라고 믿어왔죠. OpenAI의 내부 general-purpose 모델은 이 가정을 뒤집었습니다. 그것도 더 좋은 grid를 찾는 식이 아니라, 문제를 algebraic number theory로 옮겨서 새 family of constructions를 만들어냈죠. 외부 수학자 그룹의 검증이 같이 진행됐고, Brockman은 X에서 이렇게 표현했습니다(공식 OpenAI 페이지는 일부 시점에 접근 제약이 있었으므로 인용 시 직접 재확인을 권장합니다).
"This is the first time AI has autonomously solved a prominent open problem central to a field of mathematics."
Hacker News가 양분된 진짜 이유
같은 발표를 두고 Hacker News에서는 500점 넘는 토론이 벌어졌고, 댓글은 340개를 넘었습니다. 흥미로운 건 의견이 거의 정확히 두 갈래로 나뉘었다는 점이에요.
한쪽은 '이건 진짜 발견이다'였습니다. 톱 댓글 중 하나(m-hodges)는 "기존 자료를 recombine한다고 발견에서 disqualify되는 건 아니다. 인간 수학자도 그렇게 한다"고 했죠.
반대쪽은 '이건 search이지 creativity가 아니다'였습니다. "LLM은 permutation machine이지 새 framework를 발명하는 기계가 아니다", "미적분이나 일반상대성 같은 새 수학 framework는 LLM이 아직 못 만든다", "counterexample을 찾는 건 search 문제지 theory-crafting이 아니다" 같은 반론이 나왔습니다.
저는 양쪽 다 일리가 있다고 봅니다. 그런데 두 논쟁이 비껴가는 한 가지가 있어요. 둘 다 '발견이냐 아니냐'만 묻고 있다는 점입니다. 정작 바이브코더한테 중요한 질문은 그게 아닐 수 있다는 거죠.
바이브코더한테 진짜 의미 있는 변화
이번 사건이 바이브코딩에 의미하는 건, 'AI가 발견한다'가 아니라 '문제를 다른 도메인으로 옮기는 능력'이 외부 검증을 받았다는 점입니다. geometry 문제를 algebraic number theory로 reformulate한 것 — 이게 코드 워크플로우에서 어떻게 닮은꼴로 나타날지 생각해보세요.
- 알고리즘 reformulation: 그래프 문제를 행렬 곱으로, 검색을 인덱스로, 동적 프로그래밍을 메모이제이션으로 — 이 변환을 에이전트한테 맡기는 게 정당화되는 흐름이 생깁니다
- 데이터 스키마 redesign: '이걸 다른 모양으로 모델링하면 어떻게 될까'를 에이전트한테 던지고, 사람은 결과를 검증하는 워크플로우
- 테스트 케이스 생성: counterexample 찾기는 결국 이번 Erdős 작업과 같은 종류의 search입니다. 코드의 corner case를 찾으라고 시키는 게 정량적으로 더 신뢰할 만해진다는 의미
지금까지 우리가 'copilot'이라 부른 건 사람이 그린 박스 안에서 자동 완성을 하는 도구였습니다. 이번 사건의 무게는 그 박스를 에이전트가 직접 다시 그리게 둘 수 있다는 가능성이에요. 거기에 OpenAI의 Mythos급 limited-access 모델이 붙고, Anthropic이 4월 7일에 발표한 17년 묵은 FreeBSD CVE 자율 발견까지 같은 방향을 가리킨다면, 우리는 곧 'best 모델은 API로 안 나오는' 시대로 갈 수도 있습니다.
FAQ
Q. 이 모델을 일반 사용자도 쓸 수 있나요?
A. 발표 시점 기준 어떤 모델인지는 부분 공개입니다. 'general-purpose internal model'이라는 표현이 쓰였고, API/제품 노출 시점은 미정입니다. Anthropic Mythos처럼 limited-access로 갈 가능성이 큽니다.
Q. '자율'이라는 표현이 진짜 자율인가요?
A. 사람의 prompt와 sub-goal 설정이 어디까지 들어갔는지는 공개 자료만으로는 확정하기 어렵습니다. '외부 수학자 검증 완료'는 결과의 정합성에 대한 검증이지, 프로세스의 자율성에 대한 검증과는 다른 거죠.
Q. 그래서 내 코드 작업이 당장 바뀌나요?
A. 당장은 아닙니다. 다만 다음 6개월~1년 사이에 '문제 자체를 다른 도메인으로 옮기는 에이전트 워크플로우'가 정식 제품으로 나오면, 그때 익숙해질 준비를 지금부터 해두는 게 맞습니다. 알고리즘 문제 하나를 골라서 '이걸 다른 방식으로 모델링해줘'를 에이전트한테 던져보는 것부터요.
박스 안에서 자동완성하던 시대가 박스를 다시 그리는 시대로 넘어가는 중일까요? 그 답은 다음 빅 lab의 발표가 아니라, 지금 본인 노트북에서 한 번 시도해보는 데서 시작될 가능성이 큽니다.
소스: OpenAI 공식 · Brockman X 트윗 · Hacker News 토론 · Interesting Engineering 정리
댓글 0
아직 댓글이 없습니다