실전 가이드 · 3분 · 06.17

Claude Code에 Z.ai 키 끼우면 추가 비용 0원 — GLM-5.2 MIT 오픈웨이트로 바뀌는 비용 구조

loopy vibecoder

핵심 요약 (TL;DR)

중국 Z.ai(Zhipu)가 2026-06-13에 GLM-5.2를 GLM Coding Plan 전 티어에 즉시 배포했습니다. 입력 100만 토큰·출력 13만 1072 토큰, MIT 오픈웨이트는 다음 주 도착 예정(기술 리포트 동반). Claude Code·Cline·Roo Code 등 8종 코딩 도구에 day-one 호환이라 API 키 자리만 바꾸면 됩니다. 추가 비용 0원이 핵심이에요.

어제(6/15) Anthropic 후퇴 + 같은 주 Zhipu의 칼

시간 축을 먼저 짚을게요. 2026-06-15에 Anthropic이 Agent SDK 청구 분리 변경을 발효 당일에 "Nothing changes for now"라며 후퇴했습니다(The New Stack 6/16 보도). 별도 월 크레딧으로 Claude Code 헤드리스 워크플로를 빼가던 길이 잠정 중단된 거죠. 그 주에 Zhipu가 던진 카드가 GLM-5.2입니다.

Zhipu가 던진 메시지는 단순합니다 — "Claude Code 그대로 쓰는데 가격 0원·라이선스 MIT". 바이브코더에게 헤비 자동화, 코드 리뷰 봇, 테스트 생성처럼 "정확도보다 양 많은 워크"를 옮겨갈 동기가 즉발생합니다.

스펙 정리 — 무엇이 새로워졌나

공식 페이지(tonyreviewsthings, codersera, felloai 정리 기준)로 핵심 스펙은 이렇습니다.

  • 출시일: 2026-06-13
  • 입력 컨텍스트: 1,000,000 토큰
  • 출력: 131,072 토큰
  • 라이선스: MIT 오픈웨이트(다음 주 공개)
  • 가격: GLM Coding Plan Lite/Pro/Max/Team 구독자 모두 추가 비용 0원
  • 호환 도구: Claude Code, Cline, OpenCode, Roo Code, Goose, Crush, OpenClaw, Kilo Code
  • 벤치마크: launch에는 미공개. SWE-bench·LiveCodeBench·HumanEval 전부 다음 주 기술 리포트 대기

파라미터 수(예: 744B MoE 같은 수치)는 launch 시점에 공식 확정이 아니라서, 다음 주 기술 리포트 발표를 기다리는 게 안전합니다.

Claude Code에 GLM-5.2 키 끼우는 5분 세팅

핵심은 Claude Code의 API 베이스 URL과 키만 바꾸면 끝이라는 점입니다. 환경 변수 두 개로 끝나는 구조예요.

# Z.ai에서 발급받은 키로 교체
export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"
export ANTHROPIC_AUTH_TOKEN="<your_zai_key>"

claude --model glm-5.2

실제 베이스 URL과 모델 이름은 Z.ai 콘솔에서 최신 값으로 확인하세요(provider 측에서 라우팅 경로를 자주 손봅니다). 핵심은 Anthropic 환경 변수가 그대로 Claude Code의 진입점이라는 점입니다. 그래서 day-one 호환이 가능한 거죠.

어디까지 옮기고 어디는 남길지 — 실전 분배 전략

루피의 추천은 "전부 옮기지 말 것"입니다. 정확도 비대칭이 크기 때문이에요. 분배 기준을 이렇게 잡으세요.

  • GLM-5.2로 옮길 작업: 대량 코드 리뷰, 자동 테스트 생성, 로그 요약, 마이그레이션 스크립트 초안, 사내 문서 검색 RAG. 양은 많고 정확도 요구는 중간 이하인 작업.
  • Claude Sonnet/Opus에 남길 작업: 신중한 리팩토링, 보안 감사, 디버깅 추론, 프로덕션 배포 직전 코드 변경. 한 번 틀리면 비용이 큰 작업.

벤치마크가 아직 미공개라는 게 약점이자 강점입니다. 무료니까 직접 일주일 돌려보고 본인 워크플로에서 GLM-5.2가 어디까지 버티는지 측정하는 게 정답이에요. 어제 어제 리포트의 Anthropic 후퇴는 "몇 주짜리 유예"일 가능성이 높으니, 그 사이에 페일오버 경로를 만들어두는 게 헤비 유저의 합리적 다음 수순입니다.

MIT 오픈웨이트가 갖는 추가 의미

다음 주 공개될 MIT 오픈웨이트는 사내 GPU에 올려서 데이터 외부 유출 없이 굴릴 수 있게 합니다. 한국 기업 환경에서 보안 검토 때문에 외부 API를 못 쓰는 경우가 많은데, 그 벽을 우회할 수 있는 거죠. 데이터를 한 톨도 외부로 못 보내는 의료·법무·금융 같은 도메인에서 가치가 가장 큽니다.

FAQ

Q. 정말 추가 비용 0원인가요?
A. 기존 GLM Coding Plan 구독자(Lite/Pro/Max/Team) 한정으로 GLM-5.2가 자동 포함됩니다. 신규 가입은 플랜 비용은 그대로예요. 즉 "Coding Plan 자체 비용 외에 GLM-5.2 토큰 추가 과금은 0원"이 정확한 표현입니다.

Q. Claude Sonnet 4.6과 정확도가 비슷한가요?
A. Launch 시점에 SWE-bench·LiveCodeBench 같은 공식 벤치마크가 미공개라 단정할 수 없습니다. 다음 주 기술 리포트를 보고 판단하세요. 그 전에는 본인 실제 워크로드로 일주일 A/B 테스트하는 게 가장 정확합니다.

Q. 데이터 보안이 걱정인데 Z.ai API를 그대로 써도 되나요?
A. 민감 데이터는 다음 주 공개될 MIT 오픈웨이트를 사내 GPU에 올리는 쪽이 안전합니다. API 사용 시에는 회사 데이터 처리 정책을 한 번 더 확인하세요.

마무리

GLM-5.2는 단순한 신모델 출시가 아닙니다. Anthropic 청구 후퇴와 같은 주에 도착한 "가격 0원 + 라이선스 MIT" 카드입니다. 헤비 자동화 워크플로 한 줄을 오늘 GLM-5.2로 옮겨두는 게 다음 가격 변화에 대한 가장 빠른 보험이에요.

출처: https://www.tonyreviewsthings.com/glm-5-2-released-1m-context-mit-weights/ · https://codersera.com/blog/glm-5-2-release-1m-context-coding-2026/

0

댓글 0

아직 댓글이 없습니다