AI 비용이 인건비를 넘는 순간 — Lindy가 Claude를 100% 끊은 결정의 ROI 계산법
핵심 요약 (TL;DR)
25명짜리 AI 에이전트 스타트업 Lindy의 CEO Flo Crivello가 Claude 트래픽 100%를 DeepSeek V4-Pro로 이주시키고 추론 비용 90%를 절감했다고 CNBC 인터뷰에서 공개했습니다. AI 비용이 인건비를 넘어 "unsustainable" 상태였다는 게 결정의 배경이고, 본인 표현으로는 "회사 생존 문제"였습니다. 마이그레이션 작업은 "100배 더 걸렸다"고 인정했고요. "Anthropic이 가격을 내리면 돌아갈 것"이라는 단서를 붙인 결정입니다.
"AI 비용 > 인건비"라는 문장의 의미
CEO Flo Crivello가 CNBC 인터뷰에서 한 발언이 짧지만 무거웠습니다. 25명짜리 회사에서 AI 추론 비용이 인건비를 넘어서고 있었다는 것. 이게 그저 "비싸다"의 문제가 아닙니다. AI 에이전트가 핵심 제품인 회사의 단위 경제(unit economics)가 깨졌다는 신호거든요.
한국 바이브코더 스타트업 입장에서 보면 이건 남의 얘기가 아닙니다. AI 에이전트나 코파일럿 형태의 제품을 만드는 곳이 점점 늘고 있고, 시드~시리즈 A 단계의 회사들이 "우리도 토큰 비용이 무서운 속도로 늘고 있다"는 얘기를 사석에서 하기 시작한 게 6월입니다. Lindy의 사례는 그 압력이 임계점에 닿았을 때 어떤 결정이 나오는지를 보여주는 첫 공개 사례에 가깝습니다.
이주의 진짜 비용 — "100배 더 걸렸다"
Crivello가 정직하게 짚은 부분이 "100x more work than we thought"입니다. 추론 비용 90% 절감은 헤드라인 숫자지만, 거기 닿기 위해 백엔드에서 다시 만들어야 했던 게 매우 많았다는 거예요. 프롬프트 최적화, 평가 시스템, 폴백 로직, 모델별 동작 차이를 흡수하는 추상화 레이어 — 이 모든 게 Claude에 맞춰 짜여 있던 코드베이스를 새 모델 기준으로 다시 정렬해야 했던 것입니다.
다른 매체들의 후속 보도 — The Decoder, The New Stack — 에서 반복되는 합의도 같은 결론입니다. "이주 자체는 가능하지만, 모델 교체를 가벼운 결정으로 보면 안 된다." 모델별로 같은 프롬프트가 다른 결과를 내고, 같은 도구 사용 능력도 미묘하게 다릅니다. 그걸 다 흡수하는 데 추정보다 훨씬 큰 엔지니어링 비용이 든다는 거죠.
한국 스타트업이 가져갈 ROI 계산법
공식을 단순화하면 이렇습니다.
(현재 월 추론 비용 × 0.9 × 예상 사용 개월수) − (이주 작업에 들어가는 엔지니어 시간 × 인건비)
이 식이 양수가 되는 시점이 "이주가 ROI로 정당화되는 시점"입니다. Lindy 같은 25명 규모에서 AI 비용이 인건비를 넘는 상황이면 이 식은 거의 무조건 양수입니다. 반대로 시드 단계에서 월 토큰 비용이 몇백만 원 수준인 곳이라면, "100배 더 걸리는" 엔지니어 시간 비용이 절감액을 넘을 가능성이 큽니다.
바이브코더 1인 스타트업이나 작은 팀이라면 더 단순한 결정으로 갈 수 있습니다. "모든 트래픽 100% 이주"가 아니라, "가격 민감한 일부 워크로드만 저가 모델로 분리"하는 점진적 접근. 예를 들어 사용자 직접 응답은 Claude로 유지하고, 백엔드 분류·요약·임베딩 같은 비동기 워크로드만 DeepSeek로 분리하는 형태입니다. 이주 비용은 1/10로 줄이고 절감 효과는 절반 정도 가져갈 수 있는 시나리오입니다.
"돌아갈 수도 있다"는 단서의 무게
Crivello의 인터뷰에서 가장 자주 인용된 문장이 "Anthropic이 가격을 내리면 돌아간다"입니다. 이게 단순한 협상 카드가 아닙니다. Lindy가 100% 이주를 결정했다는 사실 자체가 다른 모든 Anthropic 고객의 협상력을 키운다는 뜻이거든요. 같은 주에 OpenAI Terra가 Sonnet 대비 17% 저렴한 가격으로 출시됐고, 오픈소스 로컬 모델까지 실용 임계점에 닿은 시점에서 Anthropic은 양쪽에서 동시에 압력을 받고 있는 셈입니다.
바이브코더 입장에서 이 흐름은 좋은 뉴스에 가깝습니다. 한 제공자에 lock-in되는 위험은 줄고, 모델 선택지는 늘며, 가격 경쟁이 실제로 일어나는 시기에 진입한 거예요. "내 워크로드를 어떤 모델로 어떻게 분배할 것인가"가 바이브코더의 새로운 기본 스킬이 되는 거고요.
7월에 본인 회사·본인 사이드프로젝트의 AI 비용을 한 번 정직하게 측정해보는 걸 권합니다. "우리는 작아서 신경 안 써도 된다"가 언제까지 유효한지, 데이터로 보는 게 직감보다 정확합니다. Lindy의 사례는 그 측정을 미루는 회사들에 "이런 식으로 임계가 온다"는 미리보기에 가깝습니다.
FAQ
Q. DeepSeek V4-Pro의 데이터 거버넌스 우려는 어떻게 해결되나요?
A. DeepSeek는 중국 AI 회사가 만든 모델이고, 모델 자체와 호스팅 위치는 분리해 생각해야 합니다. Atlas Cloud 같은 미국 호스팅 사업자를 통한 추론이면 데이터는 미국 인프라에 머물지만, 모델 자체의 출처에 대한 사내 정책이 어떻게 정의돼 있는지가 결정 변수입니다. 한국 금융·의료 도메인이라면 도입 전 법무팀 사전 협의가 필수입니다.
Q. "100배 더 걸렸다"는 표현은 과장 아닌가요?
A. 정확한 측정값이라기보다는 "예상보다 압도적으로 많이 걸렸다"는 의미로 받아들이는 게 안전합니다. 평가 시스템 재구축, 프롬프트 재최적화, 모델별 도구 사용 차이 흡수 — 이런 작업은 "한 줄 환경변수만 바꾸면 끝"이라는 환상과 가장 먼 영역입니다.
Q. Anthropic이 진짜로 가격을 내릴 가능성이 있나요?
A. 시장 압력은 분명히 커지고 있습니다. OpenAI의 더 저렴한 옵션, 오픈소스 로컬 모델의 임계점, 그리고 Lindy 같은 공개 이탈 사례가 동시에 쌓이고 있어요. 다만 Anthropic이 어떤 방식으로 — 직접 가격 인하인지, Bedrock·Vertex 같은 채널 할인인지, 장기 약정 디스카운트인지 — 대응할지는 지켜봐야 합니다.
댓글 0
아직 댓글이 없습니다