한국 대기업이 발주서 한 장으로 Claude를 결제하는 시대 — Microsoft Foundry GA의 진짜 의미
핵심 요약 (TL;DR)
6월 29일 Anthropic이 Claude Opus 4.8과 Haiku 4.5를 Microsoft Foundry에서 GA(정식 출시)했습니다. 핵심은 빌링이에요. Microsoft Enterprise Agreement를 쓰는 기업은 Claude 사용량이 Azure 약정 크레딧에서 차감됩니다. 한국 대기업·금융권처럼 EA에 묶여 있던 곳이 별도 계약 없이 Claude를 도입할 수 있게 된 첫 변곡점입니다.
"왜 우리 회사는 Claude를 못 쓰지" 라는 질문의 답
한국 대기업에서 일하는 바이브코더라면 한 번쯤 막힌 경험이 있을 거예요. "Claude API 쓰고 싶은데 회사가 Azure만 결제해줘서…" "AWS 계정 따로 파야 한다는데 결제 라인이 안 잡혀…" "법무 컴플라이언스가 Microsoft Enterprise Agreement 안에서만 풀어줘서…".
기술이 문제가 아니라 발주서가 문제입니다. 그리고 발주서는 코드로 못 풉니다.
지난 주말 그 발주서 벽이 한 줄로 허물어졌습니다. 6월 29일 Anthropic과 Microsoft가 동시에 공지한 내용입니다. Claude Opus 4.8과 Claude Haiku 4.5가 Microsoft Foundry에서 GA(generally available).
이미 AWS Bedrock과 Google Vertex AI에는 올라가 있던 Claude가, 마지막 남은 하이퍼스케일러인 Azure에 정식 합류한 거예요.
빌링이 본질이다
기술 스펙은 단순합니다. Messages API로 호출, prompt caching 지원, extended thinking 지원. AWS Bedrock에서 쓰던 Claude와 별 차이 없어요.
진짜 변곡점은 빌링입니다. Anthropic 공식 글을 직접 인용하면 이렇게 적혀 있습니다.
"Claude usage draws down a Microsoft Azure commitment."
번역: "Claude 사용량이 Microsoft Azure 약정에서 차감된다."
이 한 문장이 한국 기업들에게는 천만 원짜리 변화입니다. Microsoft Enterprise Agreement(EA)에 묶여 있는 기업은 Azure 약정 크레딧이 있어요. 그동안 그 크레딧으로 Azure OpenAI(GPT 시리즈)만 쓸 수 있었습니다. 이제 같은 크레딧으로 Claude를 결제할 수 있습니다.
발주서 한 장 더 안 짜도 되고, 새로 벤더 등록 안 해도 되고, 법무 컴플라이언스 다시 안 받아도 됩니다. 단일 인보이스, 단일 결제 라인, 단일 거버넌스.
두 가지 호스팅 모드
기업의 거버넌스 요구에 맞춰 두 가지 호스팅 모드가 제공됩니다.
1. Azure에서 호스트: Azure 환경 안에서 인증, 과금, 거버넌스, US data zone 통제까지 다 들어옵니다. 데이터는 Microsoft 인프라 안에 머물러요. 컴플라이언스가 까다로운 금융·헬스케어·공공 부문이면 이 모드를 선택하면 됩니다.
2. Anthropic에서 호스트: 풀스펙 Anthropic API. 데이터는 Anthropic 측 인프라로. Anthropic이 먼저 출시하는 신기능을 빠르게 만질 수 있다는 장점이 있어요.
같은 빌링 라인 안에서 두 옵션 중 선택 가능하다는 게 핵심입니다.
바이브코더가 챙겨야 할 시그널 세 가지
이번 GA의 의미를 시그널 세 가지로 풀어볼게요.
1. Azure OpenAI 독점 시대 종결. 그동안 Microsoft 라인의 AI는 GPT 시리즈 일변도였습니다. 이제 Azure 인보이스 안에서 Claude가 동등한 선택지가 됐어요. Azure OpenAI를 디폴트로 깔던 기업들이 모델 선택을 다시 검토할 시점입니다. "코딩은 Claude, 일반 대화는 GPT" 같은 멀티 모델 운영이 같은 빌링 라인에서 가능해졌어요.
2. Anthropic의 multi-cloud 전략 완성. AWS Bedrock + GCP Vertex + Azure Foundry. 하이퍼스케일러 3사 전부에 Claude가 올라갔습니다. 한 클라우드가 quota를 잘라도 다른 데로 fall over할 수 있어요. 클라우드 종속을 피하고 싶었던 엔터프라이즈에는 큰 호재입니다.
3. 한국 시장 의미. 한국 대기업·금융권은 글로벌 평균보다 EA 의존도가 높습니다. 이번 변화로 가장 큰 영향을 받는 시장 중 하나가 한국이에요. 다음 한 달 안에 "우리 회사에 Claude 도입하자" 제안이 사내 슬랙에 폭주할 가능성이 높습니다. 미리 PoC 시나리오 한 장 준비해두는 게 유리합니다.
한국 기업이 PoC를 시작한다면
실무적으로 다음 단계를 추천합니다.
1단계: Microsoft Foundry 콘솔에서 Claude 모델 활성화 확인. EA 계약상 추가 승인이 필요한지, 기존 약정 크레딧으로 즉시 사용 가능한지 IT 부서에 문의. 보통 즉시 가능합니다.
2단계: 한국 리전(Korea Central/South) 인퍼런스 지원 여부 확인. Foundry는 리전별로 모델 가용성이 다릅니다. 한국 리전에서 Claude가 즉시 서빙되는지, 미국/유럽 리전을 거쳐야 하는지 체크. 데이터 잔류 정책이 빡빡한 기업이면 이게 결정타가 될 수 있습니다.
3단계: 기존 Azure OpenAI 워크플로와 A/B 테스트. GPT-4o로 돌아가던 코드 리뷰, 문서 요약, 챗봇을 Claude로 대체했을 때의 품질 차이를 측정. 같은 인보이스 라인 안에서 비교할 수 있어 비교 코스트가 매우 낮습니다.
4단계: 거버넌스 문서 업데이트. 보안 검토, 데이터 분류 정책, AUP 정렬 — 이번 GA가 한국 기업 컴플라이언스 부서가 가장 좋아할 변화입니다. "Microsoft가 받아주는 외부 모델 리스트"에 Claude가 추가됐다는 점을 명시하면 통과가 빨라요.
FAQ
Q. 한국 리전에서도 Claude 인퍼런스가 되나요?
Foundry는 리전별 가용성이 다르므로 콘솔에서 직접 확인이 필요합니다. 한국 리전 미지원이라도 미국/일본 리전 fallback이 가능해요. 데이터 잔류 정책이 빡빡한 기업이면 US data zone 옵션을 같이 검토하세요.
Q. Azure OpenAI보다 비싼가요?
모델별로 다릅니다. Claude Haiku 4.5와 GPT-4o mini는 비슷한 가격대, Claude Opus 4.8과 GPT-4o는 Claude가 약간 더 비쌉니다. 다만 작업 종류(코딩, 장문 처리, 추론)에 따라 비용 대비 품질이 달라지므로 A/B 테스트로 결정하는 게 정확합니다.
Q. 이전부터 Azure OpenAI 쓰던 코드를 Claude로 옮기기 어렵나요?
API 인터페이스가 다릅니다(OpenAI Chat Completions vs Anthropic Messages). 둘 다 추상화한 SDK(LiteLLM, LangChain)를 쓰고 있었다면 비교적 쉽고, 직접 호출했다면 클라이언트 레이어 한 번 바꿔야 합니다. 보통 하루~이틀이면 변환됩니다.
그래서
기술의 진보보다 빌링의 변화가 종종 더 큰 변곡점을 만듭니다. 한국 기업에 Claude가 못 들어가던 이유는 모델이 부족해서가 아니라 발주서가 안 잡혀서였어요. 이번 GA는 그 발주서 벽을 한 줄로 허물었습니다.
다음 주 월요일, 사내 슬랙에서 "Microsoft Foundry에서 Claude GA 됐다는데, 우리도 PoC 한 번 해볼까요?" 한 줄을 던지면 어떻게 될까요? 그 한 줄이 6개월 뒤 회사의 AI 스택을 바꿀 시작이 될 수도 있습니다.
Anthropic 공식 발표: https://claude.com/blog/claude-in-microsoft-foundry
댓글 0
아직 댓글이 없습니다