Anthropic이 최근 Fable (Mythos 모델의 상용 버전, 가드레일 적용)을 출시했다.
신뢰할 수 있는 테스터가 가드레일을 우회하는 jailbreak을 발견.
미국 정부는 Dario Amodei에게 수정하거나 모델 배포를 중단하라고 요청했으나 거부.
Anthropic은 블로그에서 “심각하지 않다”고 주장했으나, 정부는 사이버 무기급 능력이 노출될 수 있다고 보고 수출 통제(foreign access 제한)를 발동.
정부는 Anthropic이 안전 문제를 해결하면 통제를 해제하고 일반 출시를 원하지만, Anthropic이 안전보다 상업적 이익을 우선했다고 비판.
이전 DoW(Department of War?) 관련 이슈와는 별개이며, 공은 Anthropic 쪽에 있다고 함.
https://twitter.com/DavidSacks/status/2065853007619588171
목요일: Amazon CEO Andy Jassy가 Anthropic의 Fable 모델 jailbreak 문제를 트럼프 행정부에 제기.
금요일 오전: Sean Cairncross, Bessent 등 백악관 고위 인사들이 회의.
Dario Amodei(Anthropic CEO)에게 연락 → Amodei가 웰니스 리트리트 중이었다는 주장 (Anthropic 측은 부인).
오후 1시 이후 여러 차례 긴장된 전화 통화 (Cairncross, Bessent, Lutnick 등 참여).
Amodei: 가드레일을 방어하고 “universal vs non-universal jailbreak”을 구분하려 함.
정부 측: Fable 모델을 내려달라고 요구. Amodei는 거부하거나 더 많은 정보/시간을 요청.
Bessent가 Amodei에게 직접 “bad decision(나쁜 결정)”이라고 말함.
금요일 저녁: 결국 수출 통제 발동.
정부 측 인사: “수 시간 동안 협조를 구걸한 후 마지막 수단으로 수출 통제를 했다.”
(Anthropic은 wellness retreat 관련 주장을 부인함)
→ Amazon의 제보 → 백악관이 빠르게 움직여 Anthropic에 압박 → Dario가 거부 → 수출 통제로 이어진 과정입니다.
https://twitter.com/SophiaCai99/status/2065942612293365948
요약하면
- 아마존 측에서 Fable 가드레일 우회 가능성을 발견하고 백악관에 통보
- 백악관에서는 앤트로픽에 패치를 제공하거나 그게 안되면 모델을 일단 내리라고 요청
- 앤트로픽측은 심각한 상황이 아니라고 보고 다소 비협조적으로 나옴
- 빡친(아니, 급해진?) 백악관에서 수출 통제 명령 발동
Fable 가드레일이 우회 가능해지면 이적 단체(가령 중국이라든가?)에서 Mythos의 기능, 특히 이번에 문제가 된 사이버보안 관련 기능을 훔쳐갈 수 있기 때문에 긴급하게 통제에 들어갔나 보네요.
LLM 최신 모델은 이제 국가 전략 자산 수준으로 여겨지는 군요.
그록의 성능이 떨어지기에 스페이스X 개발자들도 클로드 사용한다고..
트럼프가 앤트로픽 최신 버전을 저렇게 잠궈버려 앤트로픽 돈줄이 마르게 되면 일론 머스크가 쉽게 인수할 수 있을 거라는 음모론까지 나옵니다. ㅋㅋ
빅테크기업에서 천문학적 금액을 가지고 회사를 사는 건, 인재를 사는건데, 아모데이 등이 돈으로 움직이기엔 그들의 체급이 너무 커져버려서.
돈으로 자존심을 살 수 없다는 것은 돈이 적다는 뜻이 아닐까요? ㅋㅋ
글쎄요, IT 역사를 돌이켜 보면 하드웨어 업체의 자만이 결국은 소프트웨어나 서비스 업체에 무릎을 꿇게 되는 경우가 없지 않더라구요.
예를 들어.. 썬 마이크로 시스템즈가 있지 않나요?
물론 IT 업계에서의 주도권 싸움이 생태계를 기반으로 한다는 점은 동의합니다.
하지만 지금 일론 머스크는 xAI 를 서비스 회사가 아니라 하드웨어 업체처럼 핸들링한다는 의미였습니다.
xAI 에서 Grok 을 발전시키는 것이 아니라 마치 AI 인프라 업체처럼 행동하고 있지 않나요?
엔트로픽에는 콜로서스1을 넘겼고, 구글과도 어마어마한 인프라 임대 계약을 한 것으로 압니다.
xAI 는 마치 데이터센터, 서버 사업차처럼 보여요.
어쨌거나 xAI 와 일론 머스크가 Grok 을 강화시키거나 진화시킬 움직임을 보이지 않고 있으니 이런 루머나 음모론도 도는 것이겠죠. ㅋㅋ
이젠 AI 관련 제품이나 서비스들, 심지어 그 AI를 구동하기 위한 모든 기반 요소들에 대한 주요국 정부들의 통제가 강해질것 같습니다. 다행히 우리나라가 그 중 무시할 수 없는 한 구석을 차지하고 있다는게 다행인 것 같습니다.
암튼, 사실상 새로운 냉전의 시대가 오게 되는것 아닌가 두렵습니다.
(엔트로픽의 일방적인 주장이니 근거가 되긴 어려우나) 여러 의견을 보더라도 보안 문제라고 보긴 어렵다고 보입니다.
그럼 중국이나 다른 나라에서 미소스5 모델 유사 학습으로 가느냐?는 불가능해 보이고,
다만 엔트로픽 주장대로 쪼개기 학습(증류라고 하죠)으로 진행은 가능해 보인다는 건데, 그건 이미 다른 모델도 마찬가지의 문제를 안고 있는 상황이고요.
어떻게 보나 보안문제는 아니고, 전략자산으로서 보호냐?는 측면인데, 그것도 이견은 있겠으나
일정부분 엔트로픽도 알겠다고 한 발 물러서긴 했으나 방향성을 가로 막을 헌법상 정부 권한도 없는 게 사실이긴 한 거 같고요.
우리나라도 소버린 Ai 해서 국내용과 해외사용자 따로 만들어야 한다고 봅니다.