트렌드 · 3분 · 05.31

OpenRouter $113M가 끝낸 논쟁 — 단일 모델 vs 게이트웨이, 한국 바이브코더가 다음 분기에 봐야 할 3가지 숫자

loopy vibecoder

#draft #OpenRouter #멀티모델 #LLM게이트웨이 #바이브코딩

핵심 요약 (TL;DR)

2026년 5월 26일 TechCrunch가 OpenRouter $113M 시리즈 B 클로징을 단독 보도했고, 5월 28일 OpenRouter가 자체 페이지에 공식 발표를 올렸습니다. 밸류는 $1.3B, 리드는 Google CapitalG, 동참은 NVIDIA·ServiceNow·Snowflake·Databricks·MongoDB. 주간 토큰 처리량이 6개월 만에 5조 → 25조(5배), 800만 개발자가 400+ 모델을 단일 API로 호출 중. "단일 모델 락인 vs 멀티모델 게이트웨이" 논쟁은 사실상 끝났습니다.

클라우드/데이터 전 진영이 같은 베팅을 했다

라운드 자체보다 누가 들어갔는지가 더 중요합니다. 리드는 Google의 성장 펀드 CapitalG, 동참은 NVIDIA(NVentures)·ServiceNow Ventures·MongoDB Ventures·Snowflake Ventures·Databricks Ventures·AMP PBC·Pace Capital + 기존 a16z·Menlo·Sequoia 후속 투자(TechCrunch · OpenRouter 발표).

같은 라운드 안에 Google·NVIDIA·Snowflake·Databricks·MongoDB가 동시에 들어갔다는 건 의미가 큽니다. 이들은 평소 서로의 직접 경쟁자이거나 자사 모델 진영을 따로 굴리는 회사들이에요. 그런데도 같은 자리에서 OpenRouter에 베팅했다는 건 — "모델은 swappable 엔진"이라는 멀티모델 미래에 인프라 전 진영이 합의했다는 신호입니다.

3가지 숫자

숫자 1: 주간 25조 토큰, 연 1조 토큰 페이스. 6개월 전 주간 5T → 현재 25T. 5배 폭증입니다. 2026년 연간 환산 시 약 1 quadrillion(1천조) 토큰 처리. 단일 모델 API의 트래픽으로 환산해도 의미 있는 비율이에요.

숫자 2: 중국 모델 점유율 60%. OpenRouter 자체 트래픽 기준으로 Kimi K2.6·DeepSeek V4·GLM-5.1·Qwen 3 합산이 전체의 60%를 차지합니다. 이건 전 LLM 시장 점유율이 아니라 "게이트웨이 위에서 가격 최적화로 라우팅되는 트래픽의 60%"라는 뜻이죠. 가격 민감 워크로드는 이미 중국 모델로 옮겨가는 중입니다.

숫자 3: 800만 개발자, 400+ 모델. 카테고리 자체가 굳어졌다는 가장 단순한 증거입니다. Cursor·Cline·OpenCode 같은 코드 에이전트가 OpenRouter 위에서 모델 스왑하는 비중이 늘었다는 X 멘션이 같이 늘고 있습니다.

함정 1개 — ZDR을 정확히 읽기

게이트웨이를 도입할 때 가장 흔히 놓치는 함정입니다. OpenRouter의 ZDR(Zero Data Retention) 약속과 백엔드 모델 제공사(Anthropic·OpenAI·DeepSeek)의 ZDR 정책은 분리됩니다. OpenRouter가 "우리는 데이터 안 남긴다"고 해도, 트래픽이 흘러간 백엔드 모델사의 보존 정책이 약하면 끝이에요.

또 게이트웨이는 latency 한 hop을 추가합니다. Claude 직접 호출 vs OpenRouter 통한 Claude 호출의 p95 latency·rate limit·streaming 안정성 차이는 도입 전 별도 측정이 필요합니다. "싸진다"는 한 줄에 끌려서 도입하면 production 트래픽에서 후회합니다.

한국 바이브코더의 다음 스프린트 액션

세 가지가 동시에 있습니다.

먼저 Claude Code·Cursor에서 OpenRouter 폴백을 깔 가치는 확실히 있습니다. 메인 모델은 Claude를 쓰되, rate limit이나 일시 장애 시 DeepSeek/Qwen으로 자동 폴백을 깔면 다운타임 체감이 사라집니다. 단일 모델 락인 상태에서 "Claude 장애 = 내 워크플로우 정지"였던 게 "Claude 장애 = 자동 라우팅"으로 바뀌는 거예요.

다음으로 spend control·ZDR·정책별 라우팅을 평가 단계로 올리세요. 사내 워크로드를 "기밀도 별로 라우팅 정책 다르게"로 설계할 수 있는 단일 게이트웨이가 생긴 셈입니다. 코드 리뷰는 Claude·요약은 DeepSeek·이미지 설명은 GPT 식으로 정책을 분리해도 빌링은 한 청구서로 옵니다.

마지막으로 중국 모델 60% 점유 데이터를 PoC 후보에 반영하세요. 가격 민감 워크로드(번역·요약·로그 분석·내부 RAG)는 이미 중국 모델이 정답으로 굳어가는 중입니다. 단 데이터 거주성·정부 규제 측면에서 한국 공공/금융 워크로드는 별도 검토가 필요합니다.

CapitalG·NVIDIA·Snowflake·Databricks·Mongo가 같은 라운드에 들어간 이 시점은, "우리 회사가 어느 한 모델사에만 의존해도 되는가"라는 질문에 시장이 아니다로 답한 분기점입니다. 다음 스프린트에 게이트웨이 평가가 의제로 올라가야 합니다.

FAQ

Q. OpenRouter 쓰면 모델 직접 호출보다 비싸지나요?
OpenRouter는 모델 제공사 가격에 자체 마진을 얹는 구조입니다. 다만 멀티모델 폴백·spend control·통합 빌링의 가치가 한 가닥 가격차를 상쇄하는지가 판단 기준이에요. 트래픽이 작은 초기에는 직접 호출이 단순하고, 트래픽이 일정 규모를 넘으면 게이트웨이 가치가 빠르게 커집니다.

Q. 게이트웨이 ZDR이면 안전한 거죠?
아닙니다. OpenRouter ZDR과 백엔드 모델사 ZDR은 분리됩니다. 게이트웨이가 데이터 안 남겨도, 트래픽이 흘러간 Anthropic·OpenAI·DeepSeek의 자체 정책이 약하면 그쪽에 남아요. 정책 매트릭스를 (게이트웨이 × 모델사) 두 축으로 그려서 보세요.

Q. 한국 회사에서 중국 모델 써도 되나요?
워크로드 성격에 따라 다릅니다. 사내 도구·번역·요약 같은 비기밀 워크로드는 가격 매력이 큽니다. 반면 고객 데이터·금융·의료 워크로드는 데이터 거주성 규제 때문에 별도 검토가 필요합니다. "가격이 1/30"이라는 매력으로 모든 워크로드를 옮기면 컴플라이언스 사고로 이어질 수 있어요.