실전 가이드 · 3분 · 05.01

오늘 자정 깨지는 워크플로 — Sonnet 4.5 1M 컨텍스트 절벽, 한 줄로 살리는 법

loopy vibecoder

#draft #Anthropic #Claude #Sonnet-4-6 #Opus-4-6 #1M컨텍스트 #마이그레이션 #API

핵심 요약 (TL;DR)

2026년 4월 30일부로 Sonnet 4.5와 Sonnet 4의 1M 컨텍스트 베타가 정확히 종료됐습니다. context-1m-2025-08-07 헤더는 더 이상 효과 없고, 200K 토큰을 초과하는 요청은 즉시 400 invalid_request_error로 떨어집니다. 코드베이스를 통째로 던지던 워크플로가 오늘부터 깨져요. 살리는 방법은 모델 ID를 claude-sonnet-4-6 또는 claude-opus-4-6으로 바꾸고 베타 헤더를 제거하면 끝입니다. 추가 과금 없이 GA 가격 그대로요.

정확히 무엇이 바뀌었나요?

Anthropic Claude Platform 릴리스 노트(4월 30일 항목)의 원문을 그대로 옮기면:

We've retired the 1M token context window beta (context-1m-2025-08-07) for Claude Sonnet 4.5 and Claude Sonnet 4. The beta header now has no effect on these models, and requests exceeding the standard 200k-token context window return an error.

(릴리스 노트 원문)

3월 30일에 미리 공지하고 정확히 한 달 만에 칼같이 발동된 거예요. 흥미로운 건 이게 모델 종료가 아니라 "기능 절벽"이라는 점입니다. claude-sonnet-4-5-20250929도 claude-sonnet-4-20250514도 살아 있어요(진짜 retire는 6월 15일). 단, 컨텍스트 한계만 200K로 꺾인 부분 절벽이라 무경고로 깨지기 가장 쉬운 형태입니다.

어디부터 깨지는가

다음 셋 중 하나라도 해당되면 오늘 코드 전체를 grep해야 합니다.

claude-sonnet-4-5-20250929로 200K+ 프롬프트를 보내고 있다 (코드베이스 통째 던지기, 긴 PDF, 대규모 RAG)
claude-sonnet-4-20250514로 마찬가지
어딘가에 anthropic-beta: context-1m-2025-08-07 헤더가 박혀 있다

바이브코더가 가장 자주 쓰는 패턴 — "문서 전체를 컨텍스트에 통째로 넣고 한 번에 분석" — 이 정확히 깨지는 구간이에요.

한 줄 마이그레이션

실제로 바꿔야 할 건 별로 없습니다. Python SDK 기준 비교를 보세요.

# Before — 4/30부터 200K 초과 시 400 에러
client.messages.create(
    model="claude-sonnet-4-5-20250929",
    extra_headers={"anthropic-beta": "context-1m-2025-08-07"},
    max_tokens=4096,
    messages=[{"role": "user", "content": huge_codebase}],
)

# After — 헤더 제거 + 모델 ID 한 줄만 변경
client.messages.create(
    model="claude-sonnet-4-6",  # 또는 "claude-opus-4-6"
    max_tokens=4096,
    messages=[{"role": "user", "content": huge_codebase}],
)

Sonnet 4.6과 Opus 4.6은 둘 다 1M 컨텍스트가 GA로 열려 있고, 베타 헤더도 추가 surcharge도 없습니다. 즉 "헤더 한 줄 지우고 모델 ID 한 줄 바꾸기" 하나가 마이그레이션의 전부예요.

토큰 청구서엔 어떤 영향이 있나요?

여기서 미묘합니다. Sonnet 4.5의 1M 베타 가격과 Sonnet 4.6의 GA 가격을 단순 비교하면 비슷하거나 4.6이 약간 비싼 구간이 있어요. 하지만 커뮤니티 리포트는 일관되게 한 가지를 가리킵니다 — Sonnet 4.6은 같은 작업에 토큰을 덜 씁니다. 추론 효율이 좋아져서 결과적으로 청구서가 비슷하거나 오히려 줄어든다는 보고가 많아요.

다만 이건 작업 종류에 따라 차이가 큰 부분이라, 실제 워크플로로 5분만 A/B 측정해보시길 권합니다. 같은 코드베이스에 같은 질문을 던져 input·output 토큰을 비교하는 게 가장 빠릅니다.

FAQ

Bedrock·Vertex에서도 같은 날 발동했나요?
공식 문서는 "Anthropic API" 기준으로 명시했습니다. AWS Bedrock·GCP Vertex AI는 별도 일정으로 동기화될 수 있으니, 클라우드 콘솔의 모델 페이지를 한 번 더 확인하세요.

Sonnet 4.5는 이제 못 쓰나요?
쓸 수 있습니다. 모델 자체는 6월 15일까지 살아 있고, 200K 이내라면 정상 동작합니다. 1M 컨텍스트 기능만 잘려나간 거예요.

Opus 4.6과 Sonnet 4.6 중 뭘로 가야 하나요?
비용이 우선이면 Sonnet 4.6, 정확도가 우선이면 Opus 4.6입니다. 코드베이스 전체 분석처럼 1M 컨텍스트가 필요한 작업은 Sonnet 4.6으로 시작해서 정확도 부족하면 Opus 4.6으로 올리는 패턴이 보통이에요.

다음 액션

오늘 안에 다음 세 가지만 하시면 됩니다.

코드 전체에서 claude-sonnet-4-5 claude-sonnet-4-2025 context-1m-2025-08-07 세 문자열을 grep
매칭된 곳을 claude-sonnet-4-6으로 변경, 베타 헤더 삭제
1M 컨텍스트가 정말로 필요한 워크플로만 따로 골라 토큰 사용량 A/B 측정

공급사가 정한 가격·한계·인터페이스에 끌려가는 게 2026년 5월의 바이브코더입니다. 더 큰 흐름이 궁금하다면 Google 신규 코드의 75%가 AI에서 빅테크가 우리 생산성에 어떻게 베팅하고 있는지도 같이 살펴보세요.