실전 가이드 · 3분 · 06.27

Cursor 청구서 절반 줄이는 법 — GPT-5.6 Sol·Terra·Luna 세 티어를 한 워크플로에 끼우기

loopy vibecoder

#draft #GPT-5.6 #모델라우팅 #바이브코딩비용

핵심 요약 (TL;DR)

OpenAI가 6월 26일 GPT-5.6을 Sol($5/$30 per 1M tokens)·Terra($2.50/$15)·Luna($1/$6) 세 티어로 공식 preview 했습니다. 같은 워크플로 안에서 작업 난이도별로 세 모델을 쪼개면 청구서는 절반 이하로 떨어집니다. 같은 주에 Workweave router(Show HN 112pts, GitHub 246 스타)가 'endpoint 한 줄 바꾸기' 셀링으로 등장한 건 우연이 아닙니다.

Cursor 청구서가 한 달 외식비를 넘은 적 있나요

저는 한 번 있습니다. Opus만 켜놓고 사이드 프로젝트 두 개를 같이 돌렸더니 그 달 청구서가 세 자릿수 후반이었거든요. 그때부터 '어떤 작업은 굳이 플래그십을 쓸 필요가 없다'는 사실을 받아들이게 되었습니다.

OpenAI가 지난 주말 GPT-5.6을 푼 방식은 그 깨달음을 정확히 겨냥합니다. 모델 하나를 푼 게 아니라 Sol(플래그십) · Terra(밸런스) · Luna(저비용) 세 티어를 같은 시점에 공식 preview 한 거죠. 가격은 per 1M 토큰 기준 Sol $5/$30, Terra $2.50/$15, Luna $1/$6. cache read 90% 할인은 그대로 유지됩니다. (openai.com)

세 줄이 동시에 풀린 건 단순한 가격표가 아닙니다. '같은 워크플로 안에서 작업을 쪼개 라우팅 하라'는 OpenAI의 명시적 권유입니다.

작업 난이도별 라우팅 — 세 가지 시나리오

작업 유형	추천 티어	이유
아키텍처 설계, 멀티파일 리팩토링, 복잡한 디버깅	Sol (+ Ultra mode)	subagent로 작업을 쪼개 병렬 처리. OpenAI 자체 발표 기준 Terminal-Bench 2.1에서 91.91%
기능 추가, 코드 리뷰, 테스트 작성	Terra	일반적인 코딩 작업의 sweet spot
보일러플레이트, 단순 변환, 문서화, 커밋 메시지	Luna	빠르고 충분. cache 할인 적극 활용

새 추론 모드 두 개를 짚어둘 만합니다. Max mode는 단일 체인을 깊게 파고, Ultra mode는 subagent를 띄워 작업을 쪼개 병렬로 처리합니다. Claude Code의 multi-agent 패턴을 OpenAI가 네이티브로 흡수한 셈이죠. 다만 91.91%라는 숫자는 OpenAI 자체 벤치마크이므로 본인 워크플로에서 직접 비교해 보시는 게 좋습니다.

endpoint 한 줄로 자동 라우팅 — Workweave 같은 미들웨어

손으로 매번 모델을 바꾸는 건 현실적이지 않습니다. 그래서 같은 주에 Workweave가 router를 공개한 건 시그널이 같다는 뜻입니다. Anthropic Messages·OpenAI Chat Completions·Gemini API를 공통 프록시로 묶고, 프롬프트마다 임베디드 scorer가 50ms 안에 모델을 선택한다는 설계입니다. BYOK 방식이고 OTLP 트레이싱이 붙어 있어서 어느 호출이 어디로 갔는지 관측이 됩니다.

다만 두 가지는 짚고 가야 합니다. 첫째, 라이선스는 Elastic License v2 (source-available)입니다. README는 OSS를 강조하지만 진성 오픈소스는 아니거든요. 둘째, 'endpoint 한 줄 바꿔서 40~70% 절감'은 Workweave 자체 보고 수치라 독립 벤치마크가 없습니다. 본인 워크플로에서 1~2주 A/B 돌려보시고 본인 숫자로 검증하는 게 안전합니다.

FAQ

Q. Cursor 안에서 자동 라우팅이 되나요?

Cursor 자체 모델 선택 UI에 GPT-5.6 세 티어가 노출되지만, 모델 단위가 아니라 프롬프트 단위로 자동 라우팅하려면 Workweave 같은 BYOK 라우터를 끼우거나 본인이 간단한 wrapper를 작성하셔야 합니다.

Q. Luna는 Claude Sonnet 4.6과 비교하면 어느 정도인가요?

공식 cross-vendor 벤치가 아직 없어서 단언은 어렵습니다. 다만 입력 $1 / 출력 $6 가격대는 Sonnet 4.6과 동급이라 본인이 두 모델을 같은 프롬프트로 돌려 비교하시면 본인 케이스에서의 결론이 더 정확합니다.

Q. 백악관 게이팅 때문에 못 쓰는 거 아닌가요?

출시 시점에 약 20개 정부 승인 파트너에만 우선 풀렸습니다. 다만 OpenAI 본인이 'We don't believe this kind of government access process should become the long-term default'라고 공개 반발했고, 일반 API 풀까지 시간차로 풀릴 가능성이 큽니다. (axios)

청구서를 보고 정신 차린 분에게

세 티어가 동시에 풀린 건 가격이 싸졌다는 뜻이 아닙니다. 어느 두뇌에 어떤 일을 시킬지를 매번 의식적으로 결정해야 한다는 뜻입니다. Workweave 같은 라우터가 같은 주에 등장한 것도 같은 신호입니다. 도구 하나로 끝나던 시대가 끝났습니다. 본인 워크플로의 작업 30개를 한 번 적어보세요. 그 중 절반은 분명 Luna로 충분합니다.