트렌드 · 3분 · 05.27

OpenRouter 1위가 DeepSeek-V4-Flash인 진짜 이유 — 중국 모델이 미국을 4주 연속 추월

loopy vibecoder

#draft #DeepSeek-V4-Flash #OpenRouter #모델-라우팅 #Claude-Code #가성비 #중국-AI #fallback-route

핵심 요약 (TL;DR)

5월 18-24일 주간 OpenRouter 통계에서 전 세계 28.9조 토큰이 호출됐고, DeepSeek-V4-Flash가 단일 모델 3.43조 토큰으로 Anthropic·OpenAI·Google을 모두 제치고 1위를 차지했습니다. 중국 모델 합계 9.223조 토큰이 미국 모델 4.93조를 4주 연속 거의 2배로 앞섰고, 결정적 요인은 1M context와 input $0.10/M·output $0.20/M의 압도적 가성비입니다.

"사람들이 진짜 돈 내고 부르는" 모델은 뭔가

LMSYS Arena 순위, Polymarket 베팅, 트위터 화제성 — 모델 평가의 척도는 여러 가지지만, 가장 정직한 신호 하나는 OpenRouter weekly stats입니다. 실제로 invocation이 일어나야 카운트되고, 거의 모든 invocation이 유료 결제 또는 크레딧 소진을 동반하기 때문이죠. 사람들이 입으로 좋다고 말하는 모델이 아니라, 실제 워크로드를 던지는 모델이 무엇인지 보여줍니다.

5월 18-24일 주간 통계는 그래서 충격적이었습니다. 전 세계 28.9조 토큰(전주 대비 +7.4%, 5주 연속 성장) 중 DeepSeek-V4-Flash가 단일 모델로 3.43조 토큰을 차지하며 1위. Anthropic Claude Sonnet/Opus도, OpenAI GPT-5.5도, Google Gemini 3.5도 모두 그 밑에 자리잡았어요.

중국 9.223조 vs 미국 4.93조

더 큰 그림에서 보면 변화는 더 또렷합니다. 같은 주 중국 모델 합계 9.223조 토큰(+19.89%) vs 미국 모델 4.93조 토큰(+16.27%). 단순히 한 모델이 1위인 게 아니라, 중국 모델들이 OpenRouter 전체 top 10 중 6자리를 차지하며 합계 점유율 45% 이상을 가져갔습니다. Xiaomi·Alibaba·MiniMax·Zhipu·DeepSeek·StepFun. 한 주의 우연이 아니라 4주 연속 추월입니다.

미국 매체와 정책 담론에서 자주 듣는 "중국 AI는 따라잡는 중"이라는 서사와, OpenRouter가 보여주는 현실은 같은 방향을 가리키지 않습니다. 실제 워크로드에서는 이미 추월이 끝났다는 게 숫자의 말인 거죠.

input $0.10·output $0.20·1M context

DeepSeek-V4-Flash가 1위에 오른 이유는 단순합니다. 가성비와 context 길이의 조합이 압도적이거든요. 스펙을 정리해보면 이렇습니다. 284B MoE 아키텍처(활성 13B), 1M token context, input $0.10/M·output $0.20/M(OpenRouter의 다수 provider 평균).

Claude Sonnet 4.6과 단가만 비교하면 input 30배·output 15배 저렴합니다. 1M context까지 동일하게 지원하면서 가격이 한 자릿수 차이가 아닌 두 자릿수 차이로 벌어진다는 점이, 에이전트 워크플로처럼 토큰을 대량 소비하는 패턴에서 결정적 차이를 만듭니다. 50K 라인 코드베이스를 통째 던지는 작업을 매일 반복하는 사람이라면, "Sonnet 한 번 vs Flash 30번"의 트레이드오프가 매주 계산서에 찍히는 거예요.

"기본 Sonnet, fallback Flash"가 표준이 되는 이유

Claude Code·Cursor·Windsurf는 모두 OpenRouter route 또는 fallback을 지원합니다. 5월 들어 인디 개발자 커뮤니티에서 사실상 표준이 된 패턴은 이렇습니다. 기본 모델은 Sonnet 4.6 또는 Opus 4.7로 두고, 토큰을 많이 쓰는 reasoning·exploration 단계는 DeepSeek-V4-Flash로 라우팅합니다. 정확도가 결정적인 production 코드 생성에는 Claude, 탐색과 brainstorming처럼 정확도보다 양이 중요한 단계에는 Flash.

여기에 6월 Mythos가 enterprise로 풀리면 3-route 구조가 자연스러워집니다. Sonnet/Opus(기본), Mythos(복잡한 reasoning·enterprise tier만), Flash(대량 탐색). 한국 바이브코더가 이번 주 안에 점검해야 할 셋업이 정확히 이 구조예요.

물론 트레이드오프는 있습니다. geopolitical risk와 데이터 거버넌스 우려가 따라오거든요. 본인 코드가 DeepSeek 서버를 거치는 게 회사 정책상 가능한지, 고객 데이터가 포함된 호출은 미국 모델로 강제 라우팅되는지 같은 정책 레이어가 별도로 필요합니다. Karpathy의 "China is now the open-source AI" 발언이 화제가 된 것도 결국 이 트레이드오프를 직시한 코멘트인 거죠.

FAQ

Q. DeepSeek-V4-Flash를 한국에서 바로 쓸 수 있나요?
OpenRouter 계정만 있으면 API로 즉시 호출 가능합니다. Claude Code·Cursor 같은 IDE에서는 OpenRouter route 설정만 추가하면 default 또는 fallback으로 잡을 수 있습니다.

Q. 가격 차이가 큰데 성능 차이는 어느 정도인가요?
탐색·요약·draft 생성 같은 작업에서는 Sonnet 4.6과 체감 차이가 크지 않다는 평가가 많습니다. 복잡한 multi-file refactor나 정확한 production 코드 생성에서는 Claude 계열이 여전히 우위를 유지하는 것으로 보고됩니다.

Q. 회사 환경에서 사용해도 안전한가요?
데이터 거버넌스 정책 확인이 필수입니다. 고객 데이터·개인정보가 포함된 호출은 정책상 미국 모델로 강제 라우팅하는 게 안전합니다. 본인 회사의 third-party AI 모델 사용 가이드라인을 먼저 검토하세요.

OpenRouter weekly stats가 보여주는 건 단순한 1위 교체가 아니라, "어떤 모델을 default로 박을 것인가"라는 매주의 질문이 본격적으로 시작됐다는 신호입니다. 본인의 라우팅 정책을 이번 주 안에 한 번 다시 적어보세요.