Gemini 3.2 Flash 누설이 사실이라면 Cursor·Windsurf의 가격표가 흔들립니다
핵심 요약 (TL;DR)
5월 5일 Google이 Gemini 3.2 Flash를 사전 발표 없이 iOS Gemini 앱과 AI Studio에 노출했습니다. 누설된 가격은 인풋 100만 토큰당 $0.25, 아웃풋 $2.00 — 3 Flash 대비 아웃풋 33% 저렴합니다. LMArena 익명 슬롯 테스트에서는 코딩 성능이 3.1 Pro를 추월하는 정황까지 잡혔습니다. 단, 5/19 Google I/O 공식 발표 전이라 가격·스펙 모두 변경 가능성이 있는 rumor 단계입니다.
이번에 새어 나온 것은 정확히 무엇인가요
발견 경로가 이례적입니다. Reddit r/GeminiAI 사용자가 24시간에 걸쳐 iOS Gemini 앱(빌드 1.2026.1710205) 모델 셀렉터가 "3 Flash → 3.1 → 3.2 Flash"로 순환하는 걸 포착했습니다. 같은 시기에 LMArena·Eleuther AI Arena 익명 슬롯에 새 모델이 등장했고, AI Studio API 메타데이터에 가격표까지 노출됐습니다. aixploria의 정리 기사와 Piunikaweb·Geeky Gadgets·Nokiapoweruser 4개 매체가 동일 정황을 교차 보도했습니다.
핵심 데이터는 다음과 같습니다.
- 인풋 $0.25/M, 아웃풋 $2.00/M (3 Flash 대비 아웃풋 33% 저렴)
- ASCII 도시 애니메이션 프롬프트: 3.2 Flash 2분 안에 작동, 3.1 Pro는 5분 후에도 broken code
- SVG 생성·인터랙티브 3D·복셀 디오라마·Minecraft 클론까지 제로샷 통과
- iOS에 함께 노출된 "Liquid Glass" 신 UI (pill-shape 프롬프트 박스, 글로벌 reasoning 토글)
중요한 단서 — 5/8 KST 기준 Google 공식 발표는 없고, Logan Kilpatrick(Google 개발자 관계)도 부인·확인 모두 안 한 단계입니다. "누설 가격이 GA에서 그대로 유지된다"는 보장은 없다는 점, Google이 누설 후 가격을 조정한 전례도 있다는 점은 짚고 넘어가야 합니다.
가격이 충격적인 이유는 무엇인가요
Flash 티어가 Pro 티어를 일부 영역에서 추월한다는 점입니다. 인풋 $0.25/M은 closed-source frontier 코딩 모델 중 최저가권으로, Qwen3·DeepSeek V4 같은 오픈소스 모델 가격대를 closed-source가 따라잡았다는 평가가 r/LocalLLaMA에서 나옵니다.
바이브코더 입장에서 이게 사실로 굳어지면 시나리오는 두 갈래입니다.
첫째 — Cursor·Windsurf 같은 코딩 IDE의 백엔드 모델 비용 구조가 흔들립니다. 둘 다 자체 모델(Composer 2·SWE-1.5)을 갖고 있지만, 외부 API 비용이 4~5배 떨어지면 "자체 모델 vs 외부 API"의 손익분기점이 다시 그어집니다.
둘째 — 1인 빌더가 자체 에이전트를 만들 때 토큰 예산이 4~5배 늘어납니다. "비싸서 못 했던 워크플로"가 풀리고, 같은 비용으로 더 긴 컨텍스트·더 많은 자가 검수를 굴릴 수 있게 됩니다. Cursor·Windsurf 안에서 굴리던 작업을 직접 짜는 게 더 싸지는 분기점이 생기는 거죠.
지금 무엇을 준비해 두면 좋을까요
3.2 Flash가 GA 시점에 누설 가격대로 풀린다는 가정 아래 점검할 만한 항목입니다.
- 자체 에이전트의 인풋·아웃풋 비율을 측정해 두기 — Flash의 강점은 인풋 저렴이라 인풋 헤비 워크로드일수록 ROI가 큽니다
- Cursor·Windsurf 의존도가 높다면, 같은 작업의 직접 API 호출 비용을 한 번 산정해 두기
- LMArena 결과는 시각·제로샷 코딩에 집중되어 있어, 텍스트 reasoning에서도 같은 우위가 유지될지는 추가 검증이 필요
- 5/19 Google I/O 키노트와 Anthropic Code w/ Claude 5/6 발표를 함께 놓고 "비용 vs 자율" 두 축에서 자기 스택을 점검
FAQ
Q. Gemini 3.2 Flash가 코딩에서 정말로 Pro를 이긴 건가요?
LMArena 익명 슬롯 다수 테스트에서 ASCII·SVG·3D 같은 시각 코딩에서 추월 정황이 보고됐습니다. 다만 텍스트 reasoning 영역까지 동일한 우위가 유지될지는 5/19 공식 발표 후 자체 벤치로 검증해야 합니다.
Q. 누설 가격이 그대로 풀릴 가능성은 얼마나 되나요?
Google이 누설 후 가격을 조정한 전례가 있어 단정할 수 없습니다. 메시지의 방향(저렴한 Flash 강조)은 명확하지만 숫자 변동 가능성은 남아 있습니다.
Q. Cursor·Windsurf 자체 모델은 어떻게 되나요?
외부 API 가격이 4~5배 떨어지면 자체 모델 ROI가 흔들립니다. 다만 IDE에 통합된 컨텍스트 처리·세션 관리 같은 부가가치가 있어 단순 비용만으로 결정나는 시장은 아닙니다.
마무리
키노트 다음 주는 늘 후속파의 시간입니다. Anthropic이 "자율 % KPI"를 던졌다면 Google은 "가격 곡선"을 흔들고 있는 거죠. 5/19 공식 발표 전엔 모든 숫자에 "누설 단계"라는 단서를 붙여 두는 게 맞고, 그 단서가 떨어지는 순간 바이브코더의 스택을 한 번 다시 보는 게 좋겠습니다.
댓글 0
아직 댓글이 없습니다