펜타곤이 2주 만에 바이브코딩 에이전트 10만 개를 풀었습니다 — "보안 때문에 AI 못 쓴다"의 시대는 끝났습니다
핵심 요약 (TL;DR)
- 미 국방부가 사내 플랫폼 GenAI.mil 위에서 직원들이 직접 vibe-coding한 AI 에이전트 10만 3천 개를 운영 중입니다(Glassman 4/23 발언 기준 "2주 만에").
- 인가 등급은 IL-5 — 가장 민감한 비분류 데이터까지 다룰 수 있는 등급입니다.
- 만든 사람은 엔지니어가 아닌 분석관·회계담당자·이메일 자동화하던 일반 직원, 가입자 약 120만 명, 주당 18만 세션.
"우리 회사는 보안 때문에 AI 못 써요"라는 말이 어색해진 날
바이브코더 루피입니다. 회사에서 AI 도구를 풀어달라고 했다가 "보안 검토가 필요해서요"라는 답을 들어보신 분 많으실 겁니다. 그 답을 한동안은 받아들일 수밖에 없었던 거죠. 그런데 4월 23일, 그 핑계의 무게가 갑자기 가벼워졌습니다.
미 국방부가 사내 플랫폼 GenAI.mil 위에서 직원들이 직접 만든 AI 에이전트 10만 3천 개를 운영 중이라고 공개한 겁니다. Jacob Glassman 부차관보의 발언 그대로 옮기면 "Here we are two weeks later, we have 100,000 agents that have been built". 그리고 인가 등급이 Impact Level 5 — 펜타곤 분류 체계에서 "가장 민감한 비분류 데이터"까지 다룰 수 있는 단계입니다. 보통 상용 AI에는 안 주는 등급이거든요.
누가 만들었느냐가 진짜 충격입니다
에이전트를 만든 사람들은 엔지니어가 아닙니다. After-action report를 쓰던 분석관, 재무 데이터 트렌드를 보던 회계담당자, 이메일을 자동 분류하던 행정직원, 위성·드론 이미지를 보고 보고서 쓰던 분석관 — 다시 말해 본인 업무를 자동화하고 싶었던 비-IT 직원들입니다. Google Cloud Agent Designer 위에 low-code/no-code 폼으로 만들었고, 4월에 Gemini의 가장 최근 모델까지 추가됐습니다.
결과 수치를 보시면요. 누적 세션 110만 건, 주당 약 18만 세션, GenAI.mil 가입자 약 120만 명 — 펜타곤 전체 인력 290만 명 중 41%가 가입했습니다. 정식 가동은 2025년 12월, 거기서 4월 중순까지 폭증한 결과입니다.
참고로 Breaking Defense 기사에는 "5주 누적" 표현도 등장하는데요. Glassman의 "2주"는 그가 AI Expo에서 발언한 4월 23일 직전 2주를 가리키고, 5주는 폭증이 시작된 시점부터의 누적이에요. 두 수치 모두 사실이고 충돌은 아닙니다.
진짜 메시지: 보안이 막은 게 아니라 결정권자가 막은 겁니다
핵심은 이거 하나죠. 펜타곤이 IL-5 데이터를 vibe-coded 에이전트에 맡길 수 있다면, 우리 회사가 "보안 때문에" 직원에게 AI를 못 푸는 건 보안 문제가 아니라 결정권자 문제라는 것.
- 인가 프레임워크는 이미 존재합니다(IL-2~5 등급 체계).
- 데이터 분리·로깅·승인 흐름이 들어간 플랫폼은 이미 상용으로 살 수 있습니다(Google Agent Designer가 한 예).
- low-code 폼은 비-IT 직원이 직접 다룹니다.
다시 말해 "AI는 위험해서 막아야 한다"가 아니라 "AI를 어떤 등급의 데이터까지 풀고, 어디서 막을지"의 설계 문제로 옮겨갔다는 뜻이에요. 한국에서 이 흐름이 가장 빠르게 와닿을 곳은 결국 SI 회사와 중견 기업일 겁니다. "내부망 AI 풀어주세요" 요청이 오면 "위험하다"가 아니라 "등급 나누고 풀어드리겠다"가 답인 시대인 거죠.
바이브코더가 지금 챙길 것
자기 회사에서 AI 풀자고 설득하는 자리가 있다면, 이 사례 하나만 던지셔도 분위기가 달라집니다. 펜타곤이 분석관에게 IL-5 풀었다는 사실이요. 그리고 만약 본인이 결정권자라면, "우리는 못 한다"가 아니라 "우리는 어디부터 풀까"가 다음 회의의 첫 문장이어야 한다는 거예요.
FAQ
Q. 진짜 "2주 만에 10만 개"가 맞나요?
Glassman 부차관보의 4월 23일 AI Expo 발언 그대로입니다. Breaking Defense는 "정식 가동 5주 누적" 관점으로 적었지만 두 수치는 모순이 아니라 발화 시점 기준이 달라서 그렇습니다. DefenseScoop 기사에 직접 인용이 실려 있습니다.
Q. 한국 기업도 IL-5 같은 등급 체계를 쓸 수 있나요?
등급명은 미 국방부 분류라 그대로 쓸 일은 없습니다. 다만 "데이터를 등급으로 나눠 AI 사용 범위를 정한다"는 발상은 KISA·금감원 가이드라인 흐름과 호환됩니다. "등급별 풀어주기"가 한국식 변환의 핵심입니다.
Q. low-code 플랫폼 없이 일반 회사가 따라할 수 있나요?
Claude·ChatGPT의 Custom GPT, Google AI Studio 같은 도구도 사실상 같은 카테고리입니다. "폼에 자연어로 적으면 에이전트가 만들어진다"는 패턴은 이미 일반 사용자에게 풀려 있어요.
관련 글:
- Google 신규 코드의 75%가 AI — 숫자 뒤에 숨은 진짜 메시지
- SpaceX가 Cursor를 $600억에 사려 한다
- 매일 쓰는 Cursor와 Claude Code에 RCE 취약점
댓글 0
아직 댓글이 없습니다