인사이트 · 3분 · 05.18

Claude Code가 무거워서 만든 8MB 짜리 대안 — 솔로가 메모리 35배 이긴 zerostack 이야기

loopy vibecoder

#draft #zerostack #gi-dellav #Rust #DeepSeek #Claude-Code #vibe-coding #코딩에이전트

핵심 요약 (TL;DR)

GitHub 31팔로워짜리 솔로 Rust 개발자 gi-dellav가 자기 노트북에서 OOM killer 한 번 맞고 DeepSeek v4 Flash로 짜낸 풀-Rust 코딩 에이전트 zerostack v1.0.0이 5/16 HN 1면에 535pts·295댓글로 올라섰습니다. 메모리 ~8MB, 시작 90ms, 바이너리 8.9MB — 같은 일을 하는 Claude Code의 수 GB와 비교하면 30~35배 가벼운 도구입니다. 바이브코딩으로 짠 도구가 거대 도구를 가성비로 정면 격파한 사건이죠.

이건 무슨 사건인가요

zerostack은 한 명이 자기 통증에서 시작해 LLM에 코드 상당량을 맡겨 짠 코딩 에이전트입니다. 본인 진술에 따르면 동기가 단순했어요. 옛 노트북에서 opencode 인스턴스 2개에 Firefox를 띄웠다가 OOM killer를 맞은 거예요. 거기서 시작해 ~7,000 LoC, MIT 라이선스, 단일 바이너리로 완성한 결과물입니다.

이 도구가 흥미로운 이유는 가벼움이 단순한 자랑이 아니라는 점이에요. zerostack은 Anthropic의 공식 도구가 차지하는 자리를 정확히 노립니다. 멀티 프로바이더(OpenRouter·OpenAI·Anthropic·Gemini·Ollama), permission mode 토글, 세션 영속화, git worktree 통합, MCP 서버 지원, 마크다운 TUI 렌더링까지. 빠진 게 거의 없는 거죠. 거기에 prompt library로 Skills를 대체하고, "Ralph Wiggum loop"라는 장기 작업 모드와 doom-loop 감지(같은 tool call이 세 번 반복되면 차단)까지 얹었습니다.

어떻게 8MB가 가능했을까요

핵심은 네 가지 선택입니다.

[profile.release]
opt-level = "z"   # 바이너리 크기 최적화
lto = true        # Link-Time Optimization

첫째, 언어. JS 런타임(Node·Bun) 위에서 도는 에이전트는 V8 자체가 메모리 베이스라인을 끌어올립니다. Rust는 그 베이스라인이 없는 거죠. 둘째, 자료구조 — smallvec로 스택에 작은 배열을 직접 깔고, compactstring으로 작은 문자열을 인라인 저장합니다. 셋째, 컴파일러 플래그 — opt-level=z와 LTO 조합으로 바이너리를 한 자리 MB로 깎았어요. 넷째, 로드 전략 — "필요할 때만" 메모리를 차지하는 architecture에 prompt library가 Skills를 대체하면서 정적 자원까지 최소화했습니다.

결과는 측정 가능한 숫자로 박혔습니다. idle ~8MB / 작업 중 ~12MB. JS 기반 에이전트가 평소 ~300MB, Claude Code 한 세션이 수 GB를 먹는 환경과 비교하면 30~35배 차이입니다. CPU도 idle 0% / 작업 중 ~1.5%. crates.io v1.0.0 정식 등록, GitHub 525스타·37포크가 5/18 기준 누적된 상태고요.

이게 왜 의미가 있나요

이 사건의 진짜 메시지는 "Rust가 빠르다"가 아닙니다. Anthropic이 만든 도구를, 31팔로워짜리 솔로 한 명이 LLM 도움으로 더 가볍게 짤 수 있다는 명제가 처음으로 가시화된 사례라는 점이에요. 거기다 사용한 모델이 프론티어 모델이 아니라 DeepSeek v4 Flash라는 점도 같이 봐야 합니다. 비싼 모델을 쓰지 않고도 됐다는 거죠.

물론 본인이 손으로 직접 쓴 영역이 있습니다. 커서 이동 같은 TUI 로직처럼 모델이 헤매는 부분은 직접 작성했어요. 즉 100% vibe-coding이 아니라 "LLM이 대부분, 까다로운 곳은 본인"의 하이브리드입니다. 이게 오히려 현실적인 거예요.

바이브코더 입장에서 이 사례는 두 가지 면허증으로 읽힙니다. 첫째, 모델이 작아도 도구는 짤 수 있다. 프론티어 모델 구독료에 묶일 필요가 없습니다. 둘째, 공식 도구의 무게가 통증이라면 직접 짜는 게 옵션이다. 1년 전이라면 농담이었을 발상이 7,000 LoC 짜리 결과물로 증명된 거죠.

자주 묻는 질문

Q. zerostack을 지금 써도 되나요?
A. v1.0.0이 crates.io에 정식 등록된 상태입니다. cargo install zerostack으로 설치 가능합니다. 다만 출시 며칠 차 도구이므로 프로덕션 critical path에는 신중하게 적용하시는 게 좋습니다.

Q. DeepSeek v4 Flash로 짠 코드는 믿어도 되나요?
A. 모델이 작다고 코드 품질이 비례해서 떨어지지는 않습니다. 다만 zerostack 메인테이너 본인이 까다로운 TUI 로직은 직접 작성했다고 밝힌 것처럼, 생성 코드에 대한 인간 리뷰는 여전히 필수입니다.

Q. Claude Code를 대체할 수 있나요?
A. 기능 셋은 거의 같지만 생태계(Skills·기업 지원·통합 IDE)에서 차이가 납니다. "내 노트북이 무겁다"가 주된 통증이라면 대체 후보, "Anthropic 생태계가 필요하다"면 보완재로 보시는 게 맞습니다.

바이브코딩의 전체 그림은 바이브코딩 완전 가이드 2026에서, 도구 비교는 AI 코딩 도구 총정리 비교표 2026에서 더 자세히 보실 수 있어요.

작은 통증 하나가 한 명을 움직였고, 그 한 명이 거대 도구를 정면으로 깎아냈습니다. zerostack은 도구 자체보다 "이게 가능한 시대다"라는 신호로 봐야 합니다.