Anthropic이 AI 코딩 도구 클로드 코드(Claude Code)에 새로운 '자동 모드(auto mode)'를 도입했습니다.
AI가 스스로 행동의 안전 여부를 판단해 실행하는 기능으로, 현재 리서치 프리뷰 단계로 공개됐습니다.
기존에 개발자들은 AI의 모든 행동을 일일이 승인하거나, 반대로 모든 결정권을 AI에 넘기는 두 가지 방식 중 하나를 선택해야 했습니다.
자동 모드는 이 사이에서 균형을 찾으려는 시도입니다.
AI가 각 행동을 실행하기 전에 안전장치를 통해 자체 검토를 수행하고, 안전하다고 판단한 행동은 자동으로 진행하며 위험한 행동은 차단합니다.
사용자가 요청하지 않은 행동이나 프롬프트 인젝션 공격—AI가 처리하는 콘텐츠에 악의적인 명령을 숨겨 의도치 않은 행동을 유도하는 방식—도 탐지 대상에 포함됩니다.
이 기능은 기존의 'dangerously-skip-permissions' 명령어에 안전 레이어를 얹은 구조로, GitHub와 OpenAI 등이 선보인 자율 코딩 도구와 유사하지만 한 가지 차이가 있습니다.
언제 사용자에게 허가를 구할지 결정하는 주체가 사용자가 아닌 AI 자체라는 점입니다.
다만 안전장치가 안전한 행동과 위험한 행동을 구분하는 구체적인 기준은 아직 공개되지 않았습니다.
개발자 입장에서는 실무 도입 전에 반드시 확인하고 싶은 부분인 만큼, 향후 Anthropic의 추가 설명이 필요해 보입니다.
자동 모드는 앞서 공개한 Claude Code Review, Cowork용 Dispatch와 함께 Claude Code의 자율성을 높이는 연속적인 업데이트의 일환입니다.
현재 Claude Sonnet 4.6과 Opus 4.6에서만 지원되며, Anthropic은 만일의 사고에 대비해 운영 시스템과 분리된 격리 환경에서 사용할 것을 권장하고 있습니다.
엔터프라이즈 및 API 사용자를 대상으로 순차 배포될 예정입니다.
https://claude.com/blog/auto-mode