루프 엔지니어링이 프롬프트를 대체하다… AI 코딩, 3년 만에 4번 진화

엔지니어들은 더 이상 AI를 위한 프롬프트를 작성하지 않는다. 에이전트가 자율적으로 작동할 수 있도록 설계된 자기 실행 루프를 설계한다 — 이는 3년 동안 네 가지 뚜렷한 코딩 시대를 압축한 변화다.

엔비디아의 젠슨 황은 프롬프트 작성이 시대에 뒤처졌다고 선언하며 루프 엔지니어링(Loop Engineering) 시대를 열었다. 이는 엔지니어가 명령어를 입력하는 대신 자율적인 피드백 시스템을 설계하는 방식으로, 3년 동안 네 가지 뚜렷한 AI 코딩 시대를 압축했다.

"아무도 더 이상 프롬프트를 작성하지 않습니다,"라고 황은 말했다. "새로운 직업은 루프를 작성하고 관리하는 것입니다." 앤트로픽의 클로드 코드(Claude Code) 창시자 보리스 체르니도 비슷한 변화를 설명했다. "나는 더 이상 클로드를 위한 프롬프트를 작성하지 않습니다. 클로드에게 무엇을 할지 지시하고 다음에 무슨 일이 일어날지 결정하는 루프를 가동하고 있습니다."

클로드 코드는 이제 세 가지 루프 프리미티브(기본 요소)를 탑재한다 — 시간 기반 사이클을 위한 /loop, 검증이 통과될 때까지 목표 기반 실행을 위한 /goal, 클라우드 기반 무인 실행을 위한 /schedule. /goal 명령어는 중요한 아키텍처 규칙을 적용한다. 코드를 작성하는 모델이 자신의 출력을 검증할 수 없도록 하는 것이다. 앤트로픽은 대형 모델을 통해 코드 생성을 처리하는 반면, 별도의 소형 Haiku 모델이 승인 테스트를 담당한다. 오픈AI의 코드엑스(Codex)도 유사한 접근 방식을 취하며, 격리된 클라우드 샌드박스에서 최대 8개의 에이전트를 가동해 각각 하위 작업을 처리한 후 결과를 병합한다.

프롬프트에서 루프로의 전환은 AI 인프라 지출에 직접적인 영향을 미친다. 자율 루프 시스템은 단일 프롬프트 워크플로우보다 작업당 더 많은 토큰을 소비하며, 추론 컴퓨팅에 대한 수요를 증가시킨다. 엔비디아는 이러한 멀티 에이전트 루프를 구동하는 GPU의 주요 공급자로서 수혜를 입을 것으로 보이며, 아마존 웹 서비스, 마이크로소프트 애저, 구글 클라우드 등 클라우드 제공업체들은 증가하는 워크로드를 두고 경쟁하고 있다. 지난주 기업공개(IPO)를 신청한 앤트로픽은 클로드 코드에 루프 아키텍처를 직접 내장하여 기업 채택과 반복 API 수익을 가속화할 잠재력을 지녔다.

4단계 진화는 명확한 궤적을 보여준다. 2023년부터 2024년까지는 프롬프트 엔지니어링(Prompt Engineering)이 지배했다 — 사용자는 각 상호작용에 대해 정교한 명령어를 작성했으며, 출력 품질은 전적으로 프롬프트의 정교함에 달려 있었다. 2024년에서 2025년 즈음에는 컨텍스트 엔지니어링(Context Engineering)이 '질문하는 방법'에서 '모델에 무엇을 보여줄 것인가'로 초점을 전환했으며, RAG 파이프라인과 코드베이스 통합이 각 쿼리에 제공되는 정보를 확장했다. 2025년에서 2026년 사이에는 하네스 엔지니어링(Harness Engineering)이 등장해 에이전트에게 도구, API, 실제 실행 환경에 대한 접근 권한을 부여했다. 네 번째이자 현재 단계인 루프 엔지니어링은 에이전트가 각 단계마다 인간의 개입 없이 계획, 실행, 검증, 재시도를 수행하며 자율적으로 작동할 수 있도록 함으로써 사이클을 완성한다.

루프 뒤에 숨은 아키텍처

핵심 통찰은 관심사의 분리(separation of concerns)다. 클로드 코드의 /goal 시스템에서 한 모델이 코드를 생성하고, 독립적인 검증기 — 생성기의 추론 과정을 전혀 볼 수 없는 별도의 모델 — 가 출력을 테스트한다. 이는 단일 모델 워크플로우를 괴롭히는 '자신의 숙제를 스스로 채점하는' 문제를 방지한다. 검증기는 그럴듯해 보이지만 기능 테스트에 실패하는 출력을 거부하며, 생성기를 다시 루프로 되돌린다.

루프 엔지니어링이라는 용어를 만든 구글 엔지니어링 리드 애디 오스마니는 신중한 입장을 취했다. "아직 초기 단계입니다. 판단을 유보하겠습니다. 토큰 비용에 매우 주의해야 합니다,"라고 그는 썼다. 이 경고는 이론에 그치지 않는다. 토큰 제한, 반복 상한, 시간 제한 등 하드 스탑 조건이 부재한 루프 시스템은 예산을 소진하거나 API 속도 제한에 도달할 때까지 실행될 수 있다.

'이해 부채(Understanding Debt)' 문제

세쿼이아 캐피털의 AI Ascent 2026 컨퍼런스에서 연설한 안드레이 카파시는 자동화 열광에 대한 반론을 제시했다. "생각을 아웃소싱할 수는 있지만, 이해를 아웃소싱할 수는 없습니다,"라고 그는 반복해서 인용해온 문구를 언급하며 말했다. 루프가 인간이 검토할 수 있는 속도보다 더 빠르게 코드를 병합함에 따라, 엔지니어들은 팀 내 누구도 완전히 이해하지 못하는 시스템, 즉 '이해 부채'를 축적하게 된다. 카파시는 실질적 비용은 토큰 청구서가 아니라, 아무도 읽지 않은 시스템을 누군가 디버깅해야 하는 날이 오는 것이라고 지적했다.

2025년 11월 자신의 IDE를 삭제하고 현재 핸드폰으로 수백 개의 에이전트를 관리하고 있다고 밝힌 체르니는 이러한 트레이드오프를 인정했다. 스스로 해결하지 못하는 에이전트는 그의 받은 편지함으로 에스컬레이션된다. 그의 워크플로우는 루프 방식의 종착점을 보여준다. 인간은 규칙을 작성하고 판단을 내리며, 에이전트는 그 외의 모든 것을 실행한다.

루프 시스템의 학문적 기초는 야오 슌위의 2022년 ReAct 프레임워크(Reason + Act)로 거슬러 올라간다. 이는 ICLR 2023 구두 발표(Oral)로 선정되었으며 수만 건의 인용을 축적했다. ReAct는 모든 현대 에이전트 루프의 기반이 되는 생각-행동-관찰(think-act-observe) 사이클을 공식화했다. 이후의 연구 — Reflexion의 오류 피드백 메커니즘, Tree of Thoughts의 다중 경로 탐색, 그리고 일련의 도구 사용 에이전트 논문들 — 은 현재 루프 엔지니어링이라 불리는 엔지니어링 분야로 수렴되었다.

투자자들에게 핵심 지표는 승인된 변경당 비용(cost per accepted change)이다. 루프의 승인율이 50% 아래로 떨어지면 시스템은 손실을 보고 있는 것이다 — 인간이 루프가 자동화하기로 되어 있던 검토 작업을 수행하고 있는 셈이다. 기업이 루프 아키텍처를 대규모로 배포함에 따라, 승자는 토큰 낭비를 최소화하면서 자율 처리량을 극대화하는 기업이 될 것이다.

본 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.