토큰이 한 줄로 나온다는 상식이 깨졌다 — Google의 디퓨전 LLM, DiffusionGemma
Google DeepMind가 디퓨전 텍스트 생성 모델 DiffusionGemma 26B를 Apache 2.0으로 공개했다. 256토큰을 병렬 생성하며 H100에서 1,000+ tok/s(벤더 벤치마크), 양자화하면 18GB VRAM 로컬에서도 돌아간다.
Google DeepMind가 디퓨전 텍스트 생성 모델 DiffusionGemma 26B를 Apache 2.0으로 공개했다. 256토큰을 병렬 생성하며 H100에서 1,000+ tok/s(벤더 벤치마크), 양자화하면 18GB VRAM 로컬에서도 돌아간다.
OpenAI가 클라우드 개발환경 스타트업 Ona(전 Gitpod)를 인수해 Codex를 몇 시간~며칠짜리 장기 실행 에이전트로 확장한다. 에이전트 경쟁의 병목이 모델 지능에서 실행 인프라로 이동했다는 공식 시그널이다.
Cursor Bugbot이 Composer 2.5 탑재로 평균 리뷰 시간을 약 5분에서 약 90초로 줄였다(자체 측정). 리뷰가 커밋 루프 안으로 들어오면 '푸시 후 기다리는 리뷰'가 '푸시 전 습관'으로 바뀐다.
Atos가 54개국 56,000명 전 직원에 M365 Copilot과 Agent 365 Governance를 풀스택 배포한다. 단일 기업 사상 최대 Copilot 도입의 진짜 뉴스는 '에이전트 거버넌스'가 엔터프라이즈 표준 레이어로 굳어지고 있다는 신호다.
6월 9일, OpenAI는 ChatGPT를 코드네임 'Aria' 슈퍼앱으로 전면 개편합니다. Booking·Canva·Spotify 같은 외부 앱이 MCP 위에 직접 얹히고 결제는 OpenAI-Stripe 공동 표준이 처리합니다. 바이브코더에게 9억 주간 사용자에 직통하는 새 0번째 배포 채널이 열렸습니다.
6월 8일 WWDC26에서 Apple은 iOS 27 Extensions 프레임워크를 발표했습니다. Siri·Writing Tools·Image Playground의 디폴트 AI를 Claude·ChatGPT·Gemini·Grok 4개 중에서 직접 선택할 수 있고, App Store에는 전용 Extensions 마켓플레이스가 신설됩니다.
WWDC 2026 키노트 직전, Apple이 Google에서 1.2조 파라미터 Gemini를 연 10억 달러에 라이선스해 새 Siri 백엔드로 쓰고 'Extensions'로 ChatGPT·Claude·Gemini를 사용자가 선택하는 마켓플레이스를 iOS 27에 넣는다는 보도가 나왔습니다.
Supabase가 105억 달러 데카콘이 되며 신규 DB의 60% 이상이 AI 도구로 만들어졌다는 숫자를 공개했습니다. 한국 1인 메이커의 SaaS 백엔드 선택은 이제 사실상 자동화된 의사결정입니다.
1인 메이커 zdk가 만든 Lowfat이 Show HN 94점·178스타. Claude Code 셸 출력을 LLM 도달 전에 슬림화해 토큰 91.8%를 줄였다는 단일 Rust 바이너리예요. 같은 카테고리에 6개월 새 4개가 떴습니다.
OpenAI가 ChatGPT 메모리를 'Dreaming V3' 백그라운드 합성으로 교체. 사실 회상이 41.5%→82.8%로 올랐고 무료 티어 확장도 곧 시작됩니다. 바이브코더에게 메모리 락인이라는 새 변수가 생겼어요.
유튜브 구독자 1.1억의 PewDiePie가 자가호스팅 AI 워크스페이스 Odysseus를 풀어 4일 만에 GitHub 스타 5만을 넘기고 HN 1위에 올랐습니다. 청중이 있으면 SaaS 카테고리 하나를 1인이 무력화할 수 있다는 첫 공개 증명입니다.
Microsoft가 자체 코딩 모델 MAI-Code-1-Flash를 GitHub Copilot Auto picker에 자동 투입했습니다. SWE-Bench Pro 51.2%로 Claude Haiku 4.5를 16점 앞섰고, 본인 동의 없이 자동 라우팅이 시작된 만큼 model picker 확인이 새 기본 습관이 됐습니다.