트렌드 · 4분 · 06.22

Claude·GPT 안 쓰면 어떻게 살지? — DeepSeek V4-Pro가 폴백이 되는 순간

loopy vibecoder

Claude·GPT 안 쓰면 어떻게 살지? — DeepSeek V4-Pro가 폴백이 되는 순간

핵심 요약 (TL;DR)

Huawei와 선전 4개 연구기관 컨소시엄이 DeepSeek V4-Pro(1.6조 파라미터 MoE, active 490억)의 풀-파라미터 포스트트레이닝을 Huawei Ascend 910C 1,000칩 클러스터에서 완료했고, 1,500회 이상 학습 iteration을 무중단으로 통과했습니다. NVIDIA 없이 1.6조 모델의 포스트트레이닝이 가능함을 첫 공개 입증한 사례입니다. V4-Pro 자체는 4월 출시됐고 공식 가격은 5월 23일부터 영구 75% 할인을 적용해 output 토큰 100만 개당 $0.87(서드파티는 reference price $3.48 유지)이며, 컨텍스트는 100만 토큰입니다. Fable 5가 ban으로 묶인 같은 주에 발표돼 "한 모델에만 묶이지 말라"는 신호가 또렷해졌습니다.

"Claude가 안 들어오는 날"의 폴백을 진지하게 생각할 때

어제 자정을 기점으로 Fable 5의 무료 구간이 끝났습니다. 모델은 여전히 막혀 있고요. 같은 주에 DeepSeek V4-Pro 포스트트레이닝 성공이 발표된 건 우연이 아닙니다. "미국 정부가 자국 시민의 모델 접근을 막는다"와 "중국이 NVIDIA 없이 1.6조 모델을 다듬는다"가 같은 7일 안에 일어났습니다. 정책은 굳고, 라이벌은 자립합니다.

바이브코더 입장에서 이 그림이 의미하는 건 하나입니다. "모델 하나에 베팅하는 시대는 끝났다." 어제까지의 폴백은 "Claude가 안 되면 GPT 쓴다" 정도였습니다. 하지만 GPT도 같은 export control 라인에 노출돼 있다는 게 사이버보안 진영의 일관된 경고입니다. 진짜 폴백은 다른 진영의 모델이 되어야 합니다.

post-training과 pre-training, 둘은 다른 이야기입니다

이번 발표의 정확한 의미를 짚어두는 게 중요합니다. Huawei 컨소시엄이 한 건 포스트트레이닝(post-training) 입니다. 모델의 사전 학습된 가중치를 받아서 fine-tuning·alignment·instruction tuning을 자국 칩으로 돌린 거죠. 모델을 처음부터 사전 학습(pre-training)하는 단계는 여전히 NVIDIA H100·H200 같은 칩이 필요합니다.

비유하자면 이렇습니다. 사전 학습은 도자기를 빚는 일이고, 포스트 트레이닝은 빚어진 도자기에 그림을 그리는 일입니다. 중국이 이번에 보여준 건 "그림 그리기는 우리 붓으로도 된다"는 거죠. 도자기는 아직 외제 흙이 필요합니다. 하지만 그림이 모델 품질의 절반 이상을 결정한다는 점에서, 이건 결코 작은 사건이 아닙니다.

수학 성능이 포스트트레이닝 후 개선됐다는 결과도 함께 발표됐습니다. 1,500회 이상 학습 iteration이 단 한 번의 중단·에러 없이 통과한 것도 핵심입니다. 분산 학습에서 "한 번도 안 끊겼다"는 건 인프라 안정성이 frontier급에 가까워졌다는 신호죠.

가격표가 만들어낸 새로운 게임

V4-Pro의 가격을 보면 폴백의 의미가 더 또렷해집니다.

모델 output 100만 토큰당 가격 컨텍스트
Fable 5 $15 (ban 전 기준) 200K
GPT-5.5 $10 400K
Opus 4.8 $15 200K
DeepSeek V4-Pro (공식) $0.87 1M
DeepSeek V4-Pro (서드파티 reference) $3.48 1M

공식 가격 기준으로는 Fable 5의 약 1/17, GPT-5.5의 1/11입니다. DeepInfra처럼 reference price를 유지하는 서드파티 기준으로도 약 1/4~1/5입니다. 어느 쪽 가격이든 한 자리 수 배 차이고요. 거기에 컨텍스트는 100만 토큰으로 더 넓습니다.

가격이 모든 것을 결정하지는 않습니다. IDE 통합, 에이전트 호환, 한국어 품질, RAG 성능 — 점검할 변수가 많죠. 하지만 "Claude·GPT가 막히는 날 어떻게 살 것인가"라는 질문에 답이 있어야 한다면, V4-Pro는 적어도 이름 후보 명단의 맨 위에 올라갑니다.

바이브코더가 이번 주에 해볼 만한 한 가지 실험

# 라우팅 한 줄로 폴백 모델 붙이기 (의사 코드)
def call_llm(prompt, primary="claude-opus-4-8", fallback="deepseek-v4-pro"):
    try:
        return anthropic_client.messages.create(model=primary, ...)
    except (RateLimitError, APIStatusError, RegionBlockedError):
        return deepseek_client.chat.completions.create(model=fallback, ...)

복잡하게 갈 필요 없습니다. 평소에 쓰는 LLM 호출 한 곳에 try/except 한 단을 끼우고, fallback으로 V4-Pro를 호출하는 코드를 한 번 돌려보세요. 같은 프롬프트로 결과 품질을 비교해보면, 어디서 통하고 어디서 안 통하는지 감각이 생깁니다. "Claude가 안 들어오는 날"이 와서 패닉으로 라우팅을 짜는 것과, 평소에 미리 한 번 돌려본 것은 완전히 다른 이야기입니다.

"제3의 모델 풀"이 정착하는 중

6월 14일 자에 한 번 언급된 Zhipu GLM-5.2(MIT 오픈웨이트, Claude Code day-one 호환)와 이번 V4-Pro가 같은 라인을 그립니다. "오픈웨이트 + 자국 칩 + 저가격" 의 제3 모델 풀이 형태를 갖춰가는 중입니다. Dario Amodei가 어제 블룸버그 인터뷰에서 한 말이 그대로 적용됩니다. "신뢰 부재로 시장이 갈라진다." 미-중 라인은 그 갈라짐의 가장 또렷한 단면입니다.

미국 정부가 "IP theft" 비난을 격화해도, 모델이 이미 자국 칩으로 다듬어지면 봉쇄의 효력은 줄어듭니다. Fable 5 ban과 정확히 정반대 방향에서 작동하는 정책 한계 신호인 거죠.

FAQ

Q. DeepSeek V4-Pro를 한국에서 바로 쓸 수 있나요?
공식 DeepSeek API와 DeepInfra·Together AI·OpenRouter 같은 서드파티 게이트웨이를 통해 한국에서도 접근 가능합니다. OpenAI 호환 API 포맷이라 기존 코드 수정 부담은 크지 않습니다. 단, 데이터 거버넌스 관점에서 회사 정책상 중국 호스팅 모델 사용이 제한되는 경우가 있으니 미리 확인하세요.

Q. 사전 학습이 NVIDIA 의존이라면 의미가 줄어드는 거 아닌가요?
포스트트레이닝만으로도 모델 품질의 절반 이상을 좌우합니다. Instruction tuning·RLHF·DPO 같은 단계가 사용자 경험을 결정하는 비중이 큽니다. 게다가 1년 이내 사전 학습 자립 가능성이 시뮬레이션상 좁혀지고 있다는 게 매체들의 일치된 전망입니다.

Q. 가격이 그렇게 싼데 품질은 어떤가요?
4월 출시 후 r/LocalLLaMA·HumanEval·SWE-bench 등 커뮤니티 벤치에서 GPT-5.5와 격차가 있지만 코딩 작업에서 실용 수준이라는 평가가 일관됩니다. "Claude를 100% 대체"는 아니지만 "폴백 또는 비용 민감 워크로드 1선"으로는 충분하다는 게 합의입니다.

마무리

정책은 굳고, 도구는 뚫리고, 라이벌은 자립합니다. 바이브코더가 이번 주에 할 일은 화려하지 않습니다. 라우팅 코드 한 줄, 폴백 모델 한 번 호출. 그게 다음 ban이 떴을 때 당신의 사이드 프로젝트를 살리는 가장 싼 보험입니다.

소스: Tom's Hardware — Huawei post-training 보도, Tom's Hardware — V4-Pro 가격·IP theft 보도, SCMP — 중국 AI 자립 보도

0

댓글 0

아직 댓글이 없습니다