에이전트의 날 — Google, 알리바바, Cursor가 같은 날 꺼낸 카드
핵심 요약 (TL;DR)
4월 2~3일, Google(Gemma 4), Anysphere(Cursor 3), 알리바바(Qwen 3.6-Plus)가 동시에 에이전트 중심 제품을 공개했습니다. 오픈소스 모델은 로컬 환경에서 돌아가는 수준에 도달했고, 코딩 도구는 에디터에서 에이전트 허브로 진화하고 있습니다. 바이브코더의 선택지가 폭발한 하루입니다.
하루 사이에 세 개의 진영이 같은 카드를 꺼냈습니다. "에이전트." 우연이라 보기엔 타이밍이 너무 정확합니다.
Google Gemma 4 — 로컬 AI 코딩의 가격이 0원이 된다
Google DeepMind가 공개한 Gemma 4는 E2B, E4B(엣지용), 26B, 31B 총 4종 라인업입니다. 플래그십 31B 모델은 Arena AI 텍스트 1452점, AIME 2026 수학 89.2%, LiveCodeBench 코딩 80.0%를 기록하며 오픈소스 최상위권에 진입했습니다. 140개 언어를 지원하고, 오디오와 비전까지 처리하는 멀티모달 모델입니다.
바이브코더에게 핵심은 두 가지입니다. 첫째, 31B 모델이 소비자 GPU에서 돌아갑니다. API 비용 없이 로컬 코딩 어시스턴트를 운영할 수 있다는 뜻입니다. 둘째, 네이티브 함수 호출(function calling)을 지원합니다. 별도의 래퍼 없이 모델이 직접 도구를 호출하며 에이전트를 구축할 수 있게 된 거죠.
Hacker News에서 약 940포인트를 기록하며 1위를 차지했고, "Llama 4가 실망이었는데 Google이 제대로 쏘아올렸다"는 반응이 지배적이었습니다. Ollama, LM Studio, Hugging Face에서 바로 사용할 수 있습니다.
Cursor 3 — 코드 에디터가 아니라 에이전트 허브
같은 날 Anysphere가 공개한 Cursor 3는 더 급진적입니다. VS Code 포크에서 완전히 벗어나, 에이전트 중심으로 처음부터 새로 설계한 인터페이스를 들고 나왔습니다.
변화의 폭을 정리하면 이렇습니다.
| 기능 | 설명 |
|---|---|
| 병렬 에이전트 | 로컬과 클라우드 에이전트를 동시에 여러 개 실행 |
| 로컬↔클라우드 핸드오프 | 자는 동안 클라우드 에이전트가 작업을 이어감 |
| Composer 2 | Cursor 자체 프론티어 코딩 모델 |
| 플러그인 마켓플레이스 | MCP, 스킬, 서브에이전트를 팀 단위로 공유 |
"코드 에디터에 AI를 붙인 것"이 아니라 "AI 에이전트 허브에 코드 에디팅을 붙인 것"으로 패러다임이 뒤집혔습니다. 모바일, 웹, Slack, GitHub, Linear에서 시작한 에이전트가 하나의 사이드바에 통합 표시되고, 세션을 로컬에서 클라우드로 자유롭게 넘길 수 있습니다. Claude Code와의 경쟁이 한층 더 치열해질 전망입니다.
Qwen 3.6-Plus — 알리바바의 에이전트 베팅
알리바바 Qwen팀이 Qwen 3.6-Plus를 공개했습니다. 부제가 "Towards Real World Agents"인 만큼, 실제 환경에서 동작하는 자율 에이전트에 초점을 맞춘 모델입니다.
다만 주의할 점이 있습니다. 오픈웨이트로 공개된 Qwen3 시리즈(32B 이하)와 달리, Qwen 3.6-Plus는 Alibaba Cloud Model Studio를 통한 API 전용 모델입니다. Hacker News에서 약 387포인트를 기록하며 관심을 모았고, 1M 컨텍스트 윈도우를 지원하는 것이 확인됐습니다.
바이브코더가 지금 주목해야 할 흐름
세 발표를 관통하는 메시지는 하나입니다. 도구의 중심이 "코드 생성"에서 "에이전트 실행"으로 이동하고 있다는 것. 코드를 짜주는 AI가 아니라, 스스로 판단하고 도구를 호출하며 작업을 완수하는 AI가 표준이 되어가고 있습니다.
바이브코더에게 실질적으로 달라지는 것은 이렇습니다.
- 비용 장벽 하락: Gemma 4 같은 오픈소스 모델로 로컬 에이전트를 돌릴 수 있게 됨
- 워크플로우 자동화: Cursor 3의 병렬 에이전트로 여러 태스크를 동시에 처리 가능
- 선택지 폭발: 클로즈드(Claude, GPT) + 오픈소스(Gemma, Qwen) + 도구(Cursor, Claude Code) 조합이 다양해짐
지금 당장 모든 걸 바꿀 필요는 없습니다. 하지만 "에이전트"라는 키워드가 더 이상 미래형이 아니라 현재형이 되었다는 건, 기억해두실 만한 변화입니다.
자주 묻는 질문
Gemma 4를 로컬에서 돌리려면 어떤 GPU가 필요한가요?
31B 모델은 양자화 수준에 따라 16~24GB VRAM이 필요할 것으로 예상됩니다. 26B 모델(MoE 구조)은 더 적은 VRAM으로 운용 가능하며, Ollama나 LM Studio에서 바로 사용할 수 있습니다.
Cursor 3와 Claude Code 중 어떤 걸 써야 하나요?
Cursor 3는 시각적 인터페이스와 병렬 에이전트 관리에 강점이 있고, Claude Code는 터미널 기반의 깊은 코드베이스 이해에 강합니다. 팀 협업이 많다면 Cursor 3, 개인 프로젝트나 복잡한 리팩토링이라면 Claude Code가 유리할 수 있습니다.
Qwen 3.6-Plus는 무료로 쓸 수 있나요?
Qwen 3.6-Plus는 API 전용 모델로, Alibaba Cloud Model Studio를 통해 접근합니다. 무료 체험 크레딧이 제공될 수 있지만 지속적 사용은 유료입니다. 무료로 로컬에서 돌리고 싶다면 오픈웨이트인 Qwen3 시리즈(32B 이하)나 Gemma 4를 고려해보세요.
관련 글 더 보기
댓글 0
아직 댓글이 없습니다