1년 동안 Claude Code만 풀로 쓰고 내린 결론: "localhost가 발목을 잡고 있었다"
핵심 요약 (TL;DR)
전 Gem 엔지니어 Nick과 Drew가 1년 동안 Claude Code와 Codex만 풀타임으로 쓰고 나서 만든 제품을 6월 4일 Show HN에 올렸어요. 이름은 Boxes.dev, 카테고리는 클라우드 ADE(Agentic Development Environment). 103점 74댓글로 첫날 안에 화제가 됐고, 두 사람이 내린 결론은 한 줄이에요. "localhost가 우리 발목을 잡고 있었다." 한국 vibe coder가 노트북 팬을 갈리며 git worktree와 tmux로 곡예하던 시기의 끝을 가리키는 신호로 읽힙니다.
1년 도그푸딩이라는 신뢰 자산
Nick과 Drew는 이전 직장인 Gem(HR/리쿠르팅 스타트업)에서 함께 일했고, 그곳을 나와서 1년간 풀타임으로 Claude Code와 OpenAI Codex만 써서 코딩했어요. 둘이서요. 이 도그푸딩 자산이 중요합니다.
왜냐하면 "agent 개발 환경"이라는 카테고리에는 이미 수많은 제품이 있어요. Cursor, Windsurf, Replit Agent, Devin, Aider... 각자 자기 워크플로를 "이게 미래"라고 주장하죠. 1년간 둘이 다른 일 안 하고 agent만 풀로 쓴 경험에서 출발한 제품은 "우리가 진짜 답답해서 만들었다"는 진정성이 있어요. Show HN 댓글에서 가장 많이 인용된 두 사람의 발화가 이거였어요. "git worktree가 multi-agent 병렬에 너무 clunky하고, agent 여러 개 동시에 돌리면 노트북이 터진다. 그래서 우리가 쓰고 싶은 ADE를 직접 만들기로 했다."
Boxes.dev가 푼 문제 — "노트북 팬 갈리는 곡예의 종료"
한국 vibe coder가 익숙한 풍경이 있어요. 새 기능 하나 짤 때 Claude Code 인스턴스 3개를 동시에 띄우고, 각각 다른 git worktree를 보게 해서 병렬로 진행하는 워크플로. tmux 세션이 9개 켜져 있고, 팬은 미친 듯이 돌고, 빌드 캐시가 충돌해서 한 인스턴스가 깨지면 나머지도 같이 꼬여요.
Boxes.dev는 이 패턴 자체를 클라우드로 옮겨요. 핵심 구성 요소가 이렇습니다.
- Firecracker microVM(E2B 기반): agent 스레드마다 격리된 파일시스템과 컴퓨트가 따로 붙어요. 한 곳이 깨져도 나머지에 안 번져요.
- 모바일·데스크탑 앱: 외출 중에도 모바일로 agent 세션을 모니터링하고 백그라운드에서 돌릴 수 있어요. "agent에게 일 시켜놓고 집 나오기"가 처음으로 가능해진 환경이에요.
- per-second billing + auto-sleep: 쓰는 만큼만 과금하고 idle 상태면 자동으로 잠들어요. "고객 등쳐먹지 않는다"는 HN 평이 여기서 나왔어요.
- 클라이언트 기기 localhost로 포트포워딩: 클라우드에서 돌리지만 내 노트북 브라우저로 결과 미리보기가 돼요.
- Slack integration·scheduled automation: 팀 단위로 쓸 때 onboarding template snapshot을 공유할 수 있어요.
간단히 요약하면, "노트북에서 git worktree로 곡예하던 multi-agent 워크플로를 클라우드 인스턴스 N개로 외주"하는 거예요. 인프라가 외주되니까 노트북은 그냥 모니터링용으로 남아요.
"localhost가 발목을 잡았다" — 이 결론이 가리키는 신호
두 사람의 결론은 도구 광고가 아니라 vibe coding 진영 전체에 대한 신호 해석이에요. 1년 풀타임 사용자가 도달한 지점이거든요.
1년 전, 한 사람이 동시에 굴리는 agent 수는 1~2개였어요. Claude Code 한 창 띄워놓고 같이 일하는 식이었죠. 지금은 3~5개를 동시에 굴리는 vibe coder가 흔해요. 각각 다른 브랜치, 다른 기능. 이 변화의 임계점이 "노트북 한 대의 물리적 한계"였던 거예요.
Nick과 Drew가 말하는 발목은 두 가지예요. 첫째, CPU·RAM·디스크 IO가 동시 agent 수에 대해 선형으로 부족해져요. 둘째, 노트북에 묶여 있으니까 "agent에게 일 시켜놓고 자리 떠나기"가 불가능해요. 클라우드 인스턴스는 둘 다를 동시에 해결해요.
한국 1인 메이커한테 이게 뜻하는 건 분명해요. 노트북 사양 업그레이드는 더 이상 답이 아니에요. "agent 인프라를 어디에 둘 것인가"가 새 질문이 됐어요.
Mac-only라는 한계, 그리고 한국 메이커의 대안
Boxes.dev는 현재 Mac-only로 출시됐어요. Windows·Linux 미지원이고 self-host 옵션도 없어요. 한국 vibe coder 다수가 Windows·Linux 듀얼 환경을 쓰는 걸 생각하면 즉시 채택이 어려운 분들이 있을 거예요.
그래서 "Boxes 같은 워크플로를 직접 만든다"는 옵션도 같이 봐둘 만해요. 핵심 컴포넌트가 다 오픈소스나 commodity 인프라거든요.
- 격리된 컴퓨트: E2B 직접 사용, 또는 Modal·Daytona 같은 대안
- agent 백그라운드 실행: tmux + ngrok 조합으로 노트북 위에 임시 구현 가능
- per-session 환경: Docker Compose 템플릿 + GitHub Codespaces
물론 직접 짜는 데 1주 정도는 들 거예요. 그런데 "Mac을 새로 사기"보다는 싸고, 자기 워크플로에 정확히 맞출 수 있다는 장점이 있어요. 한국 인프라(Naver Cloud·Kakao Cloud)에 올리면 데이터 주권 관점에서도 더 안전합니다.
그래서 지금 당장 해야 할 일
Boxes.dev를 당장 쓸지 말지 결정하는 건 부차적이에요. 진짜 액션 아이템은 이거예요.
첫째, 자기 워크플로에서 "동시에 굴리는 agent 수"를 세어보세요. 1개면 아직 노트북 시대 거예요. 3개 넘어가면 클라우드 ADE를 진지하게 고민할 시점입니다.
둘째, "agent에게 일 시켜놓고 자리 떠나기"를 한 번이라도 해봤다면, 이미 클라우드 ADE 후보 사용자예요. 모바일에서 결과를 확인하고 싶었던 순간을 기억해보세요.
셋째, Mac 사용자라면 Boxes.dev 베타에 등록만 해두세요. 직접 쓰지 않더라도 카테고리 1등 제품을 관찰하는 게 다음 자기 결정에 큰 도움이 됩니다.
FAQ
Q. Cursor나 Claude Code랑 뭐가 다른가요?
A. Cursor는 IDE를, Claude Code는 CLI 환경을 제공해요. 둘 다 노트북에서 돌아요. Boxes.dev는 IDE 자리가 아니라 "agent가 실제로 돌아가는 인프라" 자리에 들어와요. Cursor 안에서 "이 작업은 Boxes 인스턴스에서 돌려"를 시키는 식으로 보완 관계예요.
Q. E2B랑 직접 비교하면 어떤가요?
A. E2B는 인프라 레이어(Firecracker microVM)를 SDK로 제공해요. Boxes.dev는 그 위에 "vibe coding 워크플로를 위한 제품"을 얹은 거예요. E2B로 직접 만들면 더 싸고 자유롭지만, 시간과 운영 비용이 들어요. 1인 메이커라면 "Boxes 베타 써보고 내 워크플로 정리한 다음, 비싸지면 E2B로 직접 짠다"가 합리적인 순서입니다.
Q. per-second billing이 정말 싼가요?
A. agent가 토큰 호출 사이에 idle한 시간이 의외로 길어요. 사람이 코드를 검토하거나 다음 지시를 입력하는 사이 30초~1분씩 노는 거죠. per-second billing + auto-sleep이면 그 idle 시간 비용이 거의 0이에요. 시간당 정액 인스턴스보다 vibe coding 패턴에 훨씬 잘 맞아요.
Nick과 Drew의 1년이 우리한테 무료로 주는 가장 큰 선물은 제품 그 자체가 아니라 그 한 문장이에요. "localhost가 발목을 잡고 있었다." 이 문장이 가리키는 지점을 보고 자기 워크플로의 다음 한 발을 정하면 됩니다.
참고: Show HN 페이지는 https://news.ycombinator.com/item?id=48399358 에서 직접 보실 수 있고, 제품은 https://boxes.dev 입니다.
댓글 0
아직 댓글이 없습니다