투자자가 백악관에 일러바친 날 — Anthropic Fable 5 셧다운이 바이브코더에게 남긴 것
핵심 요약 (TL;DR)
Amazon CEO Andy Jassy가 자체 연구팀이 발견한 Anthropic Fable 5 jailbreak을 트럼프 행정부에 직접 알린 것이 6월 12일 Commerce Department의 export control 발동의 도화선이었다고 Fortune이 보도했습니다. Anthropic은 "90분 통보로 모델 강제 회수"라고 진술. Amazon은 Anthropic에 누적 $13B 이상을 투자한 최대 외부 투자자입니다. 미 정부가 공개 상용 AI 모델을 export control로 강제 셧다운한 첫 사례죠.
같은 회사가 두 자리에서 다른 얼굴을 했다는 사실
이 사건의 핵심을 한 문장으로 요약하면 이렇습니다. Anthropic의 최대 외부 투자자 Amazon이, Anthropic 모델의 jailbreak을 직접 백악관에 가져갔고, 사흘 뒤 모델이 90분 통보로 내려갔습니다. 한 회사가 Bedrock에서 Anthropic 모델을 팔면서 동시에 그 모델을 "위험"으로 분류해 정부에 신고한 구조입니다.
Fortune 6월 14일 보도와 GeekWire·TechPolicy.Press 후속 보도를 종합하면, 백악관 AI 어드바이저 David Sacks는 이렇게 말했습니다. "매우 신뢰할 수 있는 파트너가 가드레일의 jailbreak을 식별했고, Anthropic에 수정 또는 회수를 요구했으나 Amodei가 거절했다." 그 결과가 export control이죠.
Anthropic 측은 "사전 커뮤니케이션 없이 90분 통보로 최신 모델을 내리라는 명령을 받았다"고 진술했고, 6월 16일 주말부터 기술팀이 워싱턴 DC로 급파됐다고 합니다. 회사 내부 표현이 "내로우 jailbreak로 모델 회수는 과잉"이라는 입장이라는 것도 같이 보도됐고요. 같은 사건을 두고 백악관과 Anthropic의 진술이 충돌한다는 점은 중요한 단서입니다.
어떻게 뚫린 건가, 그리고 누가 12만 자 프롬프트를 유출했나
기술적으로 무슨 일이 있었는지를 보면 더 흥미롭습니다. Fable 5는 6월 9일 Mythos 클래스로 출시된 모델로, SWE-bench Verified 95%·토큰 $10/$50 가격대로 알려졌습니다(Anthropic 출시 자료 기준). 출시 24~48시간 만에 'Pliny the Liberator'라는 X 사용자가 다중 에이전트 공격으로 뚫었다는 보고가 올라왔습니다.
공격 패턴은 "pack hunt"라고 불리는 다중 에이전트 방식이었고, Unicode 치환·long-context smuggling·decomposition이 결합됐다고 알려졌습니다. 더 충격적인 건 12만 자에 달하는 Fable 5 시스템 프롬프트가 GitHub에 유출됐다는 점입니다. 모델 출시일과 거의 동시에요.
위 디테일들은 Fortune 본 기사에는 안 나와 있고, Pliny의 X 게시물과 GitHub 유출 레포·LocalLLaMA 토론에서 가져온 정보입니다. 인용할 때 출처를 분리해서 보는 게 정확합니다.
바이브코더가 진짜 가져갈 함의 네 가지
첫째, 단일 LLM 종속은 정책 리스크가 됐습니다. "내 프로덕션이 Claude Sonnet 4.7만 쓰는 상태"라면, 미 정부가 90분 통보로 그 모델을 내리는 시나리오가 이제 실재합니다. Anthropic·OpenAI·Google·오픈웨이트 라우팅이 페일오버 옵션으로 미리 깔려 있어야 합니다.
둘째, 오픈웨이트의 비교 우위가 정책 측면에서 커졌습니다. Zhipu GLM-5.2, Kimi K2.7, MiMo Code 같은 모델은 자기 GPU에 올린 상태로 회수가 불가능합니다. 컴플라이언스가 무서운 도메인이라면 이런 백업 라인을 한 줄 두는 게 가치를 발휘하는 순간이 옵니다.
셋째, 파트너십과 정치는 분리해서 보세요. Amazon이 가장 큰 Anthropic 채널이자 가장 큰 정치적 위협이라는 모순이 이번에 확인됐습니다. "이 회사가 그 회사 모델 호스팅하니까 안전하겠지"는 더 이상 작동 안 합니다. 파트너십과 회수 결정은 별개로 작동합니다.
넷째, 공식 입장은 양쪽 다 듣고 판단하세요. Anthropic은 "내로우 jailbreak로 90분 회수는 과잉"이라고 반박했고, 백악관은 "Amodei가 회수 요구를 거절했다"는 입장입니다. 두 진술이 충돌하니 어느 한쪽 프레임만 가지고 판단하면 위험합니다.
FAQ
Q. 내가 Bedrock에서 Claude를 쓰고 있는데 안전한가요?
A. 현재 운영 중인 Claude Sonnet 4.6 이하 라인은 영향이 없습니다. 다만 Fable·Mythos 클래스의 최신 라인을 쓰던 워크로드는 영향을 받았고, 향후 frontier 모델에 비슷한 일이 반복될 위험은 분명히 커졌습니다. 멀티 프로바이더 페일오버 설계가 답입니다.
Q. 오픈웨이트로 다 옮기면 되는 거 아닌가요?
A. 단순한 답은 아닙니다. 오픈웨이트는 가격·운영 비용이 다르고, 같은 코딩 성능이 안 나오는 경우도 많습니다. "백업 라인"으로 한 줄 깔아두는 것과 "주력으로 다 옮긴다"는 다른 결정입니다.
Q. Pliny가 누구이고 시스템 프롬프트 유출은 합법인가요?
A. Pliny the Liberator는 frontier 모델 jailbreak으로 알려진 X 사용자입니다. 시스템 프롬프트 유출 자체는 모델 출력에서 뽑아낸 것이라 모델 약관 위반 가능성이 높지만, 형사 처벌로 이어진 사례는 아직 알려진 바 없습니다.
기술 기업의 위험은 더 이상 기술 안에만 있지 않습니다. 투자자와 정부, 파트너십이 동시에 한 회사의 모델을 흔드는 시대가 왔습니다. 바이브코더가 가져갈 첫 응답은 한 줄입니다. 한 곳에 모든 걸 걸지 마세요.
댓글 0
아직 댓글이 없습니다