실전 가이드 · 3분 · 05.08

Claude 토큰 빌을 5분의 1로 줄이는 한 줄 — advisor 헤더가 만드는 새 가격 곡선

loopy vibecoder

#draft #바이브코딩 #advisor-strategy #Claude-Haiku-4.5 #Claude-Opus-4.6 #비용최적화 #API #Eve

핵심 요약 (TL;DR)

Anthropic이 4월 9일 공개한 advisor 전략은 Haiku 4.5를 executor로, Opus 4.6을 자문(advisor)으로 묶어 단일 API 콜에서 돌립니다. 라우팅 코드를 사람이 짤 필요가 없습니다. LegalTech 스타트업 Eve는 이 패턴으로 frontier 모델 품질을 5분의 1 비용에 매칭했고, 5/6 Code w/ Claude 키노트에서 첫 외부 레퍼런스로 등장했습니다.

advisor 패턴은 정확히 무엇이 다른가요

기존엔 비용을 줄이려면 사람이 직접 라우팅을 짰습니다. "이 요청은 단순하니 Haiku로 보내고, 저 요청은 복잡하니 Opus로 보낸다" — 분류기 학습부터 fallback 로직까지 별도 인프라가 필요했죠. advisor 전략은 이 라우팅을 모델 안으로 집어넣습니다.

Haiku 4.5가 메인으로 동작하다가 "이건 내 손에 부치는 문제"라고 판단하면 같은 호출 안에서 Opus 4.6에게 물어봅니다. 사용자는 그저 헤더 한 줄을 붙입니다.

anthropic-beta: advisor-tool-2026-03-01

그 다음 모델을 claude-sonnet-4-6나 claude-haiku-4-5로 호출하면, 별도 라우팅 인프라 없이 advisor 호출이 자동으로 일어납니다. 자세한 코드 샘플은 Anthropic 공식 발표에서 확인할 수 있습니다.

Eve가 보여준 ROI는 어느 정도인가요

Eve(LegalTech 스타트업, 변호사 케이스 파일 처리)의 ML 엔지니어 Anuraj Pandey는 Anthropic 블로그에 "frontier-model 품질을 5x 저렴한 비용에 매칭했다"고 적었습니다. 검증된 벤치마크 수치는 다음과 같습니다.

BrowseComp: Haiku + Opus advisor 41.2% vs Haiku 솔로 19.7% — 두 배 이상 점프
Sonnet + Opus advisor: SWE-bench Multilingual +2.7pp, 비용 -11.9% (Sonnet 솔로 대비)
Haiku + Opus advisor: Sonnet 솔로 대비 점수 29% 낮지만 비용 85% 저렴

수치 출처는 Anthropic 공식 블로그, Builder.io 검증 글, DevPik 분석 모두 동일합니다.

솔로 빌더가 지금 당장 적용해 볼 만한 곳은 어디인가요

Eve의 사례가 'structured document extraction'이었다는 점이 힌트입니다. 입력 길이는 들쭉날쭉하고, 대부분은 Haiku로 충분하지만 가끔 헷갈리는 페이지가 섞여 있는 작업 — 이런 워크로드가 advisor의 단가 곡선과 가장 잘 맞습니다.

실제 적용 후보는 다음과 같습니다.

RAG 파이프라인의 답변 생성 단계 (대부분 단순, 가끔 복잡)
사용자 메시지 분류·요약 (Haiku로 충분하나 long-tail 케이스 존재)
테스트 코드 생성 (보일러플레이트는 Haiku, 까다로운 시나리오만 Opus)
이메일·티켓 자동 분류기 (대부분 빠른 분류, 가끔 정책 판단 필요)

반대로 "매 요청마다 깊은 추론이 필요한" 작업은 advisor 효과가 크지 않습니다. 이런 워크로드엔 그냥 Sonnet이나 Opus를 솔로로 쓰는 게 비용·품질 모두 낫습니다.

적용 전에 확인할 것

5/8 KST 기준 advisor 헤더는 여전히 베타입니다. 프로덕션 SLA는 별도 정책이 적용될 수 있고, advisor 호출 시 Opus 측 토큰은 별도로 과금됩니다. "단일 API 콜"이라는 표현이 "단일 과금"을 뜻하지 않는다는 점은 약관에서 다시 확인하시는 게 안전합니다. "5x 저렴"은 Eve의 워크로드에서의 결과지, 모든 케이스의 평균이 아닙니다. 자기 워크로드에서 직접 A/B를 한 번 돌려보고 결정하는 게 정석입니다.

FAQ

Q. advisor와 일반 'tool use'의 차이는 무엇인가요?

tool use는 외부 API를 호출하는 메커니즘, advisor는 내부 모델을 자문으로 부르는 메커니즘입니다. 라우팅 책임이 개발자가 아닌 모델에게 있다는 게 핵심 차이입니다.

Q. Cursor나 Claude Code 같은 도구도 advisor 패턴을 쓸 수 있나요?

도구 내부 구현은 비공개지만, API 헤더 단위 기능이라 자체 에이전트 빌더라면 누구나 적용 가능합니다.

Q. 비용이 정말 5분의 1이 되는지 어떻게 검증하나요?

자기 워크로드에서 동일 입력 100건을 advisor on/off로 돌려 비용·품질을 비교하는 게 가장 빠릅니다. 베타라 토큰 회계 디테일은 변할 수 있으니 결제 대시보드에서 직접 확인하시는 걸 권장합니다.

마무리

"Opus 한 모델만 쓴다"는 사치가 끝났다는 말이 5/6 무대에서 다시 한 번 나왔습니다. 솔로 빌더의 손익분기점이 다시 그어지는 중이고, 그 출발점은 헤더 한 줄입니다.