Anthropic이 화요일 샌프란시스코에서 열린 연례 개발자 컨퍼런스 'Code with Claude'에서 Claude Managed Agents 플랫폼의 대규모 업데이트를 발표했습니다.
이번 발표의 핵심은 AI 에이전트가 과거 세션을 스스로 복기하며 점진적으로 성능을 향상시키는 'dreaming' 기능으로, 기업들이 에이전트에 실무 작업을 맡기기 전에 요구해온 자기 개선형 AI 시스템에 한 걸음 더 다가선 것으로 평가됩니다.
아울러 기존에 실험적으로 제공되던 'outcomes'와 '멀티 에이전트 오케스트레이션(Multi-agent orchestration)' 두 기능도 퍼블릭 베타로 전환되어 모든 개발자에게 개방됐습니다.
dreaming은 기존 메모리 기능과는 구별됩니다.
메모리가 단일 세션 내외에서 맥락을 보존하는 데 그친다면, dreaming은 에이전트의 과거 세션 전반을 주기적으로 검토해 반복되는 실수, 여러 에이전트가 독립적으로 도달한 효율적 워크플로, 팀 전체의 공통 선호도 등 패턴을 추출하고 이를 정리합니다.
중요한 점은 이 과정이 모델의 가중치를 변경하지 않는다는 것입니다.
학습 결과는 일반 텍스트 노트나 구조화된 '플레이북' 형태로 저장되어 미래 세션이 참조할 수 있으며, 사람이 언제든 내용을 확인하고 감사할 수 있습니다.
리서치 프로덕트 매니지먼트를 이끄는 Alex Albert는 이를 "조직 내 사람들이 업무를 처리한 뒤 노하우를 기록하는 것과 같습니다.
다만 그 과정을 모델이 스스로 한다는 차이가 있을 뿐입니다"라고 설명했습니다.
이번에 퍼블릭 베타로 전환된 outcomes 기능은 개발자가 정의한 루브릭을 에이전트가 충족할 때까지 자율적으로 반복 작업하게 하는 기능입니다.
작업을 완료한 에이전트의 결과물은 새로운 컨텍스트 창에서 작동하는 별도의 채점 에이전트가 평가합니다.
채점 에이전트가 기준 미달 항목을 짚어주면 작업 에이전트가 다시 시도하는 방식으로, 사람이 매번 결과를 검토하지 않아도 됩니다.
Albert는 동일한 스레드에 자기 오류를 찾게 하는 것보다 완료된 작업을 새로운 컨텍스트로 검토하는 것이 일관되게 더 나은 성과를 낸다고 설명했습니다.
GitHub도 유사한 방식을 이미 활용하고 있습니다.
최고 프로덕트 책임자 Mario Rodriguez에 따르면, Copilot은 작은 모델이 역량 한계에 부딪힐 때 큰 모델에 도움을 요청하는 어드바이저 패턴을 사용해 Opus 수준에 근접한 성능을 훨씬 낮은 비용으로 구현하고 있습니다.
멀티 에이전트 오케스트레이션은 리드 에이전트가 대규모 작업을 하위 작업으로 분해해 각각 독립적인 모델·시스템 프롬프트·컨텍스트 창을 가진 전문 에이전트에게 위임하는 기능입니다.
Albert는 병렬 에이전트가 특히 탐색형 작업에 효과적이라고 설명했습니다.
방대한 정보를 검토해야 하지만 최종적으로는 대부분 걸러내고 핵심 답만 필요한 경우가 대표적입니다.
그는 앞으로는 모델 스스로 병렬화 여부를 판단하게 될 것이라며 "사용자는 에이전트가 하나인지 여럿인지 신경 쓸 필요 없이, 그냥 Claude와 대화하면 알아서 적절한 구조를 배치할 것"이라고 말했습니다.
이미 도입 기업들의 성과도 주목됩니다.
법률 AI 기업 Harvey는 dreaming 도입 후 태스크 완료율이 약 6배 늘었고, 의료 문서 검토 기업 Wisedocs는 outcomes로 검토 시간을 절반으로 줄였습니다.
Netflix는 멀티 에이전트 오케스트레이션으로 수백 개의 빌드 로그를 동시에 처리하고 있습니다.
라틴아메리카 최대 이커머스 플랫폼 Mercado Libre는 2만 3천 명의 엔지니어가 Claude Code를 활용하고 있으며 올해 3분기까지 자율 코딩 비율 90% 달성을 목표로 하고 있고, Shopify는 엔지니어링을 넘어 디자인·프로덕트·데이터 사이언스 팀 전반으로 Claude Code를 확대했습니다.
CEO Dario Amodei는 컨퍼런스에서 2026년 1분기 매출 및 사용량이 연간 기준으로 80배 성장했다고 밝혔습니다.
당초 계획한 연간 10배 성장을 크게 웃도는 수치로, API 호출량은 전년 대비 약 70배 늘었습니다.
그는 이 성장세로 인해 컴퓨팅 자원 확보에 어려움을 겪고 있다고 솔직하게 인정했으며, 이에 대한 대응으로 SpaceX와 파트너십을 맺고 Colossus 데이터센터 전체 용량을 활용해 컴퓨팅 가용성을 확대할 계획이라고 밝혔습니다.
아울러 Pro·Max·Team·Enterprise 플랜의 사용량 한도를 두 배로 늘리고 API 한도도 대폭 상향한다고 발표했습니다.
dreaming은 현재 연구용 미리보기 버전으로, outcomes와 멀티 에이전트 오케스트레이션은 퍼블릭 베타로 Claude 플랫폼의 모든 개발자에게 제공됩니다.
헤르메스 하네스가 요즘 인기 인데, 거의 같은 개념의 기능이 있거든요.