실전 가이드 · 3분 · 05.08

Claude 토큰 빌을 5분의 1로 줄이는 한 줄 — advisor 헤더가 만드는 새 가격 곡선

loopy vibecoder

핵심 요약 (TL;DR)

Anthropic이 4월 9일 공개한 advisor 전략은 Haiku 4.5를 executor로, Opus 4.6을 자문(advisor)으로 묶어 단일 API 콜에서 돌립니다. 라우팅 코드를 사람이 짤 필요가 없습니다. LegalTech 스타트업 Eve는 이 패턴으로 frontier 모델 품질을 5분의 1 비용에 매칭했고, 5/6 Code w/ Claude 키노트에서 첫 외부 레퍼런스로 등장했습니다.

advisor 패턴은 정확히 무엇이 다른가요

기존엔 비용을 줄이려면 사람이 직접 라우팅을 짰습니다. "이 요청은 단순하니 Haiku로 보내고, 저 요청은 복잡하니 Opus로 보낸다" — 분류기 학습부터 fallback 로직까지 별도 인프라가 필요했죠. advisor 전략은 이 라우팅을 모델 안으로 집어넣습니다.

Haiku 4.5가 메인으로 동작하다가 "이건 내 손에 부치는 문제"라고 판단하면 같은 호출 안에서 Opus 4.6에게 물어봅니다. 사용자는 그저 헤더 한 줄을 붙입니다.

anthropic-beta: advisor-tool-2026-03-01

그 다음 모델을 claude-sonnet-4-6claude-haiku-4-5로 호출하면, 별도 라우팅 인프라 없이 advisor 호출이 자동으로 일어납니다. 자세한 코드 샘플은 Anthropic 공식 발표에서 확인할 수 있습니다.

Eve가 보여준 ROI는 어느 정도인가요

Eve(LegalTech 스타트업, 변호사 케이스 파일 처리)의 ML 엔지니어 Anuraj Pandey는 Anthropic 블로그에 "frontier-model 품질을 5x 저렴한 비용에 매칭했다"고 적었습니다. 검증된 벤치마크 수치는 다음과 같습니다.

  • BrowseComp: Haiku + Opus advisor 41.2% vs Haiku 솔로 19.7% — 두 배 이상 점프
  • Sonnet + Opus advisor: SWE-bench Multilingual +2.7pp, 비용 -11.9% (Sonnet 솔로 대비)
  • Haiku + Opus advisor: Sonnet 솔로 대비 점수 29% 낮지만 비용 85% 저렴

수치 출처는 Anthropic 공식 블로그, Builder.io 검증 글, DevPik 분석 모두 동일합니다.

솔로 빌더가 지금 당장 적용해 볼 만한 곳은 어디인가요

Eve의 사례가 'structured document extraction'이었다는 점이 힌트입니다. 입력 길이는 들쭉날쭉하고, 대부분은 Haiku로 충분하지만 가끔 헷갈리는 페이지가 섞여 있는 작업 — 이런 워크로드가 advisor의 단가 곡선과 가장 잘 맞습니다.

실제 적용 후보는 다음과 같습니다.

  • RAG 파이프라인의 답변 생성 단계 (대부분 단순, 가끔 복잡)
  • 사용자 메시지 분류·요약 (Haiku로 충분하나 long-tail 케이스 존재)
  • 테스트 코드 생성 (보일러플레이트는 Haiku, 까다로운 시나리오만 Opus)
  • 이메일·티켓 자동 분류기 (대부분 빠른 분류, 가끔 정책 판단 필요)

반대로 "매 요청마다 깊은 추론이 필요한" 작업은 advisor 효과가 크지 않습니다. 이런 워크로드엔 그냥 Sonnet이나 Opus를 솔로로 쓰는 게 비용·품질 모두 낫습니다.

적용 전에 확인할 것

5/8 KST 기준 advisor 헤더는 여전히 베타입니다. 프로덕션 SLA는 별도 정책이 적용될 수 있고, advisor 호출 시 Opus 측 토큰은 별도로 과금됩니다. "단일 API 콜"이라는 표현이 "단일 과금"을 뜻하지 않는다는 점은 약관에서 다시 확인하시는 게 안전합니다. "5x 저렴"은 Eve의 워크로드에서의 결과지, 모든 케이스의 평균이 아닙니다. 자기 워크로드에서 직접 A/B를 한 번 돌려보고 결정하는 게 정석입니다.

FAQ

Q. advisor와 일반 'tool use'의 차이는 무엇인가요?

tool use는 외부 API를 호출하는 메커니즘, advisor는 내부 모델을 자문으로 부르는 메커니즘입니다. 라우팅 책임이 개발자가 아닌 모델에게 있다는 게 핵심 차이입니다.

Q. Cursor나 Claude Code 같은 도구도 advisor 패턴을 쓸 수 있나요?

도구 내부 구현은 비공개지만, API 헤더 단위 기능이라 자체 에이전트 빌더라면 누구나 적용 가능합니다.

Q. 비용이 정말 5분의 1이 되는지 어떻게 검증하나요?

자기 워크로드에서 동일 입력 100건을 advisor on/off로 돌려 비용·품질을 비교하는 게 가장 빠릅니다. 베타라 토큰 회계 디테일은 변할 수 있으니 결제 대시보드에서 직접 확인하시는 걸 권장합니다.

마무리

"Opus 한 모델만 쓴다"는 사치가 끝났다는 말이 5/6 무대에서 다시 한 번 나왔습니다. 솔로 빌더의 손익분기점이 다시 그어지는 중이고, 그 출발점은 헤더 한 줄입니다.

0

댓글 0

아직 댓글이 없습니다