비교/리뷰 · 4분 · 05.02

Grok 4.3이 절반 이하 가격에 PDF·PPT까지 만든다 — Sonnet 4.6 / GPT-5.5와 직접 비교

loopy vibecoder

핵심 요약 (TL;DR)

xAI Grok 4.3이 input $1.25 / output $2.50 per M tokens로 4/30 출시됐습니다. Anthropic Sonnet 4.6 대비 입력은 약 1/2.4, OpenAI GPT-5.5 대비 약 1/4 가격. 직전 Grok 4.20 대비 입력 약 37%·출력 약 58% 인하라는 큰 폭이고, PDF·스프레드시트·PPT 네이티브 생성과 비디오 입력이 같이 들어갔습니다. "빠른 대량 처리는 Grok 4.3, 복잡한 추론은 Opus 4.7, 균형은 Sonnet 4.6" 식의 모델 분업이 다시 유효해진 시점입니다.


어떤 도구를 써야 할지 모르겠다면

2026년 5월 현재 바이브코더가 마주한 모델은 최소 5종 — Opus 4.7, Sonnet 4.6, Haiku 4.5, GPT-5.5, Grok 4.3. 한 도구로 다 하던 시기는 끝났고, 워크로드별로 갈아 끼우는 게 비용·성능 양면에서 합리적인 흐름이 됐습니다. 4/30 Grok 4.3 출시가 그 분업 그림을 다시 흔들었습니다.

가격 비교

모델 입력 ($/M) 출력 ($/M) 1M 컨텍스트 PDF/PPT 네이티브 비디오 입력
Grok 4.3 $1.25 $2.50 O O O
Sonnet 4.6 $3 $15 O X X
GPT-5.5 $5 $20 O 부분 (canvas) X
Opus 4.7 $15 $75 O X X
Haiku 4.5 $1 $5 O X X

출력 토큰 단가가 Sonnet 4.6 대비 1/6 수준이라는 게 결정적입니다. 코드 생성은 출력이 길기 때문에, 같은 작업을 Grok 4.3에 시키면 출력 비용에서만 5~6배의 차이가 납니다. 단가가 낮은 만큼 한 작업을 두 번 돌려도 여전히 더 싸요.

항목별 평가

가격 효율 — Grok 4.3 압승

토큰 단가만 보면 Haiku 4.5와 거의 동일 레인지에 들어갑니다. "가격으로 Haiku와 경쟁, 능력으로 Sonnet과 경쟁"이 xAI의 포지셔닝 의도였고, Artificial Analysis Intelligence Index에서는 Sonnet 4.6 위에 위치합니다. 단일 벤치 최대 점프는 GDPval-AA에서 ELO 1500(+321pt).

코딩 — Sonnet 4.6 / Opus 4.7 우위

Intelligence Index가 종합 점수라 코딩 단일 능력으로 보면 다릅니다. SWE-bench·Terminal-Bench 등 코딩 특화 벤치에서는 여전히 Sonnet 4.6과 Opus 4.7이 위에 있습니다. "한 번에 끝까지 자율적으로 PR을 만들어야 하는" 워크로드는 아직 Sonnet/Opus 영역, "단순 변환·테스트 케이스 대량 생성·문서화" 같은 반복 작업은 Grok 4.3이 비용 우위입니다.

산출물 생성 — Grok 4.3의 새 영역

PDF·스프레드시트·PPT를 모델 단에서 네이티브로 떨어뜨린다는 점이 사실 더 큰 사건입니다. 그동안 이 영역은 v0, Lovable, Vercel 같은 "프롬프트 → 산출물" 빌더들의 시장이었어요. Grok 4.3이 모델 측면에서 그걸 흡수하기 시작한 거죠. 자료 정리·기획서 초안 같은 워크로드가 모델 채팅 한 번으로 끝나는 그림이 가능해졌습니다.

비디오 입력 — 멀티모달 격차 좁히기

비디오 인풋은 Gemini 가족이 먼저였습니다. Grok 4.3이 따라붙으면서 Anthropic 라인업의 빈자리가 두드러집니다. 영상 분석·요약·UI 회귀 테스트 자동화 같은 워크로드는 Grok 4.3으로 옮겨갈 명분이 생긴 거예요.

상황별 추천

  • 솔로 바이브코더, Claude Pro/Max 사용 중 → 그대로 Sonnet 4.6 + Opus 4.7. PAYG로 따로 굴리는 단순 작업만 Grok 4.3이나 Haiku 4.5로 빼는 분업이 합리적
  • 에이전트 자동화 / 대량 배치 → Grok 4.3로 메인. SWE 벤치 영역은 Sonnet 4.6으로 폴백
  • PDF·PPT 산출물 자동 생성 → Grok 4.3이 첫 후보. v0/Lovable로 가는 중복 단계가 줄어듭니다
  • 민감 데이터·엔터프라이즈 컴플라이언스 → 여전히 Anthropic 라인. Pentagon 사례에서 보듯 "가드레일 우선" 노선이 곧 보안·감사 우위입니다
  • 비디오 분석 → Grok 4.3 또는 Gemini 3 Flash

FAQ

Q. 코딩에는 어떤 게 가장 나은가?
"코딩"이 무엇이냐에 따라 다릅니다. 자율 에이전트로 PR 단위까지 수행하는 작업은 Sonnet 4.6 / Opus 4.7, 단순 보일러플레이트·테스트 코드·리팩터링 보조는 Grok 4.3 / Haiku 4.5로 충분합니다. 한 모델에 다 맡기지 말고 "이 작업은 어떤 모델이 가성비 좋은가"를 매번 고르는 습관이 곧 비용 절감입니다.

Q. Grok 4.3 한국에서 결제 가능?
xAI 개발자 페이지에서 카드 결제로 즉시 이용 가능합니다. SuperGrok 정액제는 별도이고, 본 비교의 가격은 API 정가 기준입니다.

Q. 어떤 워크로드부터 옮기는 게 안전?
반복 가능하고, 산출물이 명확하고, 출력 길이가 긴 작업부터 옮기세요. 예를 들어 RSS·뉴스 요약 파이프라인, 자동 문서화, 마케팅 카피 생성 같은 작업입니다. 자율 에이전트로 PR을 만드는 작업은 가장 마지막에 옮기거나, 당분간 Sonnet 4.6에 두는 게 안전합니다.

마무리

Grok 4.3 출시의 진짜 메시지는 "단일 챔피언 모델" 시대가 끝났다는 신호입니다. 같은 워크로드를 어떤 모델에 보낼지를 매번 결정하는 능력이 곧 바이브코더의 새로운 생산성 축이 되는 거죠. 한 도구만 써온 분이라면, 이번 주말에 자기 워크플로우의 30%만 다른 모델로 옮겨봐도 비용 곡선이 바로 꺾이는 게 보일 겁니다.

0

댓글 0

아직 댓글이 없습니다