GitHub Copilot 쓰고 있다면 — 지금 어떤 모델로 코딩하는지 확인해보세요
핵심 요약 (TL;DR)
Microsoft가 6월 2일 Build 2026에서 자체 코딩 모델 MAI-Code-1-Flash를 공개하고 GitHub Copilot의 Auto picker에 즉시 자동 투입했습니다. SWE-Bench Pro 51.2%로 Claude Haiku 4.5(35.2%)를 16점 앞섰고 동일 정확도에 60% 적은 토큰을 사용합니다. 별도 동의 없이 Copilot 유저가 자기도 모르게 MS 자체 모델로 라우팅되는 시대가 시작됐고, "내가 지금 어떤 모델로 코딩하고 있는가"를 model picker로 확인하는 게 새로운 기본 습관이 됐습니다.
본인이 동의한 적 없는 모델로 갈아타고 있을 수 있습니다
GitHub Copilot 매일 쓰면서 model picker 한 번도 안 열어본 분 많을 겁니다. 그동안은 그래도 됐죠. Claude나 GPT 계열 중에 적당히 라우팅되는 줄 알았으니까. 그런데 6월 2일부로 한 명 더 들어왔습니다. Microsoft가 자체로 만든 MAI-Code-1-Flash.
흥미로운 점은 출시 즉시 GitHub Copilot individual 사용자의 VS Code model picker와 default Auto picker에 동시 투입됐다는 사실입니다. 별도 옵트인 동의가 없습니다. "Auto"에 맡겨놓은 분이라면 일부 요청이 본인 인지 없이 MAI-Code-1-Flash로 빠지고 있을 수 있다는 얘기예요.
SWE-Bench Pro 51.2%가 의미하는 것
MS가 자랑한 숫자는 두 개입니다. SWE-Bench Pro 51.2%로 Claude Haiku 4.5의 35.2%를 16점 차로 앞섰다는 것. 그리고 동일 정확도에 도달하는 데 토큰을 60% 적게 쓴다는 것.
이 두 숫자가 같이 가는 의미가 큽니다. 모델 자체 성능이 강해지면서 호출 비용도 줄었다는 건, Microsoft가 Copilot 트래픽 비용 구조를 한 번에 바꾸겠다는 신호거든요. CNBC가 짚었듯이 본질은 "OpenAI 의존도 축소"입니다. MS가 GPT 계열 라이선스에 매년 지급하는 비용을 자체 모델로 점진 대체하면, Copilot의 가격·마진 구조 전체가 재설계됩니다.
루피의 시각으로 보자면, 이게 한국 바이브코더에게 던지는 직접 영향은 두 가지입니다.
하나, "코딩 보조 모델 = Claude 또는 GPT" 등식이 깨졌습니다. 이제 세 번째 옵션이 들어왔고, 자동 라우팅 기본값에 같이 섞입니다.
둘, 본인이 매일 만드는 코드 산출물의 성격이 본인도 모르는 사이에 바뀝니다. 모델마다 코드 스타일, 패턴, 안전 가드레일이 다르거든요. Copilot에서 받은 코드의 톤이 갑자기 달라졌다면, 모델이 바뀌었을 가능성이 높습니다.
지금 당장 확인할 3가지
VS Code Copilot 쓰는 분이라면 5분이면 끝납니다.
1) Model picker 열기. VS Code 우하단 Copilot 아이콘에서 모델 선택 메뉴로 들어가세요. 현재 "Auto"인지, 명시적 모델 고정인지 확인합니다.
2) 최근 30일 동안 받은 코드 한 덩어리 골라서 톤 비교. 같은 종류의 요청에 응답 스타일이 일관됐는지, 어느 시점부터 바뀌었는지 직관으로 잡힙니다.
3) 본인 작업 성격에 맞는 모델로 고정. 보안·복잡한 리팩토링은 Claude 계열, 빠른 보일러플레이트는 MAI-Code-1-Flash, 긴 컨텍스트 분석은 GPT-5.5 같은 식으로 워크로드 매칭이 새로운 기본기가 됐습니다.
MS 공식 발표: https://microsoft.ai/news/introducingmai-code-1-flash/ (CNBC 보도: https://www.cnbc.com/2026/06/02/microsoft-unveils-new-ai-models-lessen-reliance-on-openai-lower-costs.html, HN 토론: https://news.ycombinator.com/item?id=48374466)
FAQ
Q. 한국 리전 사용자도 이미 라우팅되고 있나요?
GitHub Copilot Auto picker는 글로벌 동시 롤아웃 정책으로 가는 게 일반적입니다. 다만 지역별·계정 유형별 미세 차이는 있을 수 있으니, 본인 model picker에서 MAI-Code-1-Flash 옵션이 보이는지가 가장 정확한 신호입니다.
Q. MAI-Code-1-Flash가 Claude나 GPT보다 무조건 좋은 건가요?
벤치마크 한 종(SWE-Bench Pro)에서 강했다는 것뿐입니다. 한국어 처리, 긴 문서 추론, 보안 워크플로우 같은 영역에서는 비교 데이터가 아직 없어요. 본인 워크플로우 안에서 같은 작업을 두 모델로 돌려보고 직접 비교하는 게 가장 빠른 검증법입니다.
Q. Auto picker를 끄고 Claude만 쓰면 안전한가요?
모델을 명시 고정하면 적어도 "내가 뭘 쓰는지 아는" 상태가 됩니다. 다만 다양한 모델을 워크로드별로 매칭하는 게 장기적으로 더 효율적이라, 무작정 한 모델에 락인하기보단 "내가 어떤 작업에 어떤 모델을 쓰는지" 본인 매트릭스를 갖는 걸 추천합니다.
매일 쓰는 도구의 뒷단이 바뀔 때, 본인이 가장 늦게 아는 사람이 되는 건 피하고 싶죠. 5분만 들여서 model picker 한 번 열어보시면 됩니다.
댓글 0
아직 댓글이 없습니다