인사이트 · 3분 · 07.01

AI로는 SaaS만 만든다는 사람이 모르는 것 — 2.5주에 RL 드론 띄운 워크플로

loopy vibecoder

핵심 요약 (TL;DR)

ML 엔지니어 Karolina Dubiel이 하드웨어 경력 0(이전 substantial 프로젝트 0회, CAD 0회, 솔더링 1회, 드론 비행 컨트롤러 전무) 상태에서 시작해 2.5주 만에 본인이 설계한 옥토콥터를 비행시켰습니다. Fusion 360 CAD, G10 + 카본 파이버 CNC 절삭, STM32H743 비행 컨트롤러, 그리고 그 위에 본인이 짠 RL 정책(약 50k 파라미터, PPO via PufferLib)을 Betaflight 펌웨어에 직접 컴파일해 PID 루프를 통째로 우회하는 구조입니다. 도구는 "Google + Reddit + Claude + 친구 한 명과의 대화"가 전부였다고 본인이 밝혔습니다.


시작점: 본인이 정확히 짚은 출발선

Karolina가 블로그에서 글을 시작하는 방식이 정직합니다. "이전에 substantial한 하드웨어 프로젝트 0개, CAD 0번, 솔더링 1번, 드론 비행 컨트롤러 전무." 본업은 RL과 시뮬레이션이 익숙한 ML 엔지니어 톤이지만, 하드웨어 쪽 영역은 진짜 zero에서 시작했다는 거예요. 친구 Tomas(항공우주공학 전공)가 CAD나 머신샵 관련 질문을 받아준 게 인간 측 도움의 전부였습니다.

HN 토론에서 298pts·67댓글을 받으며 1면에 진입했고, 댓글 창의 핵심 질문은 한결같았습니다. "그래서 AI가 정확히 어디까지 했나?"

2.5주에 들어간 것들

전부 직접 한 것입니다. Fusion 360에서 본인이 CAD 설계, G10 fiberglass와 카본 파이버를 CNC 밀로 직접 절삭해 손조립. 비행 컨트롤러는 STM32H743(Betaflight 펌웨어 베이스). 여기까지가 평범한 자작 드론의 영역이라면, 다음이 진짜 흥미로운 지점입니다.

Karolina는 본인이 짠 RL 정책(약 50k 파라미터, asymmetric actor-critic + PPO, MuJoCo 시뮬레이션 + 도메인 랜덤화로 학습)을 Betaflight 펌웨어에 직접 컴파일해서 기존 PID 컨트롤 루프를 통째로 우회하게 만들었습니다. 단일 모터 실패, 이중(2모터) 실패 상황에서도 비행을 유지하도록 시뮬레이터에서 학습 중이고, 하드웨어에서의 zero-shot 디플로이가 목표 단계입니다. "실제 비행체에 옮겨도 첫 시도부터 작동"이 검증된 단계는 아니라는 점은 본인도 명확히 짚었고요.

AI가 못한 한 가지

Karolina가 정직하게 짚은 부분이 글의 무게중심입니다. "Google + Reddit + Claude로 거의 다 해결됐지만, 친구 Tomas와의 대화는 대체할 수 없었다." 항공우주공학 도메인의 직관 — 어떤 결함이 치명적이고 어떤 건 무시해도 되는지, 어떤 부품 조합이 진동 모드에서 어떻게 깨지는지 — 은 검색으로 도달하기 어려운 영역이었다고 합니다.

이게 "AI 코딩으로 다 된다"는 단순 자랑글과 이 사례를 가르는 분기점입니다. AI는 광범위한 지식과 빠른 코드 생성으로 진입 장벽을 깨고, 한 명의 도메인 전문가는 그 위에서 "치명적 실수" 필터 역할을 했습니다. 솔로 빌더 한 명 + 도메인 멘토 한 명, 둘이면 이전엔 대학원 1년 프로젝트였던 일이 2.5주가 되는 거죠.

바이브코딩 천장이 또 한 칸 올라간 신호

불과 1~2년 전만 해도 "바이브코딩으로 가능한 영역 = 웹 SaaS·모바일 앱·간단한 자동화 스크립트"가 일반적 인식이었습니다. 그게 "PCB 설계는 무리" "펌웨어는 무리" "하드웨어 + RL 결합은 박사과정" 같은 구분선이었고요. Karolina의 사례는 그 선들을 거의 다 같이 넘었습니다. 한 명이, 2.5주에, 친구 한 명의 대화로.

중요한 건 "누구나 할 수 있다"가 아닙니다. Karolina는 이미 RL과 시뮬레이션 워크플로에 익숙한 ML 엔지니어였고, 그 베이스가 없으면 PPO 학습이나 Betaflight 펌웨어 컴파일 같은 부분은 Claude 도움만으로 2.5주에 닿지 않습니다. 이미 한쪽 도메인에 깊이가 있는 사람이 AI로 인접 도메인을 빠르게 흡수하는 패턴, 그게 진짜 신호입니다.

학부생이라면 "내가 가진 한 도메인의 깊이는 무엇이고, AI로 인접 도메인 어디까지 흡수해볼 만한가"를 다시 그려볼 만한 시점입니다. 대학원에서 1년 들일 프로젝트를 2.5주에 띄우는 사람이 같은 학번에 있을 수 있다는 거니까요.


FAQ

Q. RL이나 펌웨어 경험 없는 사람도 따라할 수 있나요?

A. 가능은 하지만 2.5주는 어렵습니다. Karolina는 RL/시뮬레이션 베이스가 이미 있었기 때문에 그 시간이 가능했던 거고, 베이스 없이 시작하면 PPO 학습 안정화나 sim-to-real 단계에서 막힐 가능성이 큽니다. 본인이 이미 깊이 있는 한 도메인을 출발점으로 잡는 게 현실적입니다.

Q. 친구 Tomas의 역할은 정확히 무엇이었나요?

A. 본인 글에서는 "대화" 정도로 표현됐고, 실질 설계 기여보다는 항공우주공학 직관에 대한 자문 역할이었던 것으로 보입니다. "이 설계가 진동 모드에서 깨질 위험이 있나" 같은 질문에 즉답해줄 도메인 멘토가 곁에 있었다는 게 중요했던 거죠.

Q. 하드웨어 zero-shot 디플로이는 성공한 건가요?

A. 시뮬레이션 학습은 진행 중이고, 단일 모터 실패에서의 비행 유지는 시뮬에서 확인됐습니다. 실제 하드웨어로 옮겼을 때 zero-shot으로 작동할지는 아직 검증 단계가 아닙니다. 본인도 "목표"라고 표현했고요. 후속 글이 나오면 그 결과를 봐야 합니다.

0

댓글 0

아직 댓글이 없습니다