가볍게 쓰는 글이니... 무겁고 진지하게 보진 마시길 바라며...
앤트로픽의 다리오 CEO가 예전부터 입버릇처럼 말하던 대목이 있습니다.
바로~~~~~
클로드가 클로드를 만든다는 것인데요.
클로드가 근래 코워크로 대박을 쳤지 않습니까?
상대적으로 작은 규모의 회사가 코어 서비스는 오히려 선제적으로 내놓는다는 말이죠.
오히려 예전부터 이야기 나왔던 것이 오픈AI나 구글이 내부 모델 ... 이 있다며 비슷한 말을 했었던 것에 비해,
클로드가 핵심 서비스를 더 잘 내놓는 모습을 보이는 이유를 살펴봅니다.
최근에 구글도 내부 모델에 대해 각 부서에서 너도나도 쓰려고 한다는 소식을 흘렸지만,
상대적으로 코딩 능력은 현저한 격차가 있어서 신뢰할 만한지 모르는 일입니다.
지금 앤트로픽의 클로드 오푸스 4.6이 실제 프로그래밍은 가장 잘 하는 상황이라
코워크든 뭐든 엔지니어들이 기능을 만들 때 클로드가 다 짜고 완성본을 검토만 하는 거라는 말을
다리오가 말할 때는..... 보이는 것이 있으니 끄덕 할 수 있지만 말이죠.
최신의 경쟁은 다들 아시다시피 에이전트 경쟁입니다.
ARC 3 새로 나온 벤치에 가장 강력한 모델을 아무리 돌려도 0점이었던 것을
같은 모델에 에이전트 하네스를 씌워 급~ 36%를 찍은 일이 화제가 되었었는데요.
그만큼 모델의 내재된 힘을 끌어 내는 것이 중요한 시대가 된 것 같습니다.
또한 여러 기능을 효율적으로 관리하면서 동시에 각 기능마다 하네스를 더하는 방식을 위해
오픈AI 역시 올인원 통합 앱, 즉 슈퍼앱을 만들겠다고 하는 것 같습니다.
코덱스 기반으로 만들어질 이 슈퍼앱 역시....GPT로 만들고 있다고 보면,
확실히 코딩 능력에서 앞선 것이 기능 출시 경쟁에서도 유리한 지점을 가져가는 것 같습니다.
참고로 이전에 오푸스 4.7을 말했던 것은 ... 4.7이 아니라 4.6 오푸스의 윗 버전을 새로 내놓는다는 것 같습니다.
오푸스가 굉장히 무겁게 느껴졌던 시기가 있었는데, 이젠 그 윗급도 나온다니...
클로드가 근래 떡상하는 이유는... 별거 없습니다.
각 직업에서 실제 쓰일 때 가장 만족도가 높아서입니다.
그 발목을 잡는 것이 ... 가격 대비 비싸고 ... 구독을 유지할 때 항상 더 쎈 모델을 내놓으며,
그 전의 상위 모델을 낮추는 방식이지... 다른 경쟁사들처럼 토큰 당 가격을 낮추는 일이 없다보니,
가볍게 쓰기에는...구독료 대비 쓸 수 있는 양이 너무 적다는 점이 문제였었습니다.
그게 지금이라고 나아진 것이 아니어서...
물론 오류가 줄어들고 장기 컨텍스트 유지도 잘하는 것만으로 오히려 실제 토큰을 줄이는 효과가 있다지만,
일단 보이는 수치가 높으니... 서비스 확대에 제한이 있었던 것을,
꾸준히 계속 코딩 수위를 놓치지 않으면서 점차 신뢰도가 쌓이다가
코워크 와 미 정부와의 이슈를 기점으로 폭발한 것 같습니다.
최근에 각 전문직종에 있는 분들이 3개의 모델을 비교하며,
가능 하면 3개를 다 쓰면서 장점을 취하는 것이 좋겠지만,
단 하나를 쓴다면 클로드를 쓰겠다고 하는 글을 보게 됩니다.
앞서 말한 소비자 접근성(겉으로 보이는 낮은 가성비)을...
오히려 미 정부와의 보안 이슈 때문에 갑자기 확 무너뜨리게 된 것이 계기가 되어,
막상 사용해 본 사람들이 실 사용에서 ... 특히 업무용으로 좋은 점이 제대로 어필 되는 것 같습니다.
앞으로도 상황이 크게 달라지지 않을 것 같다는 생각을 하게 되는 이유 역시
다리오의 기획 능력이라고 해야 할까요.
상대적으로 작은 회사가 생존하기 위해 어떤 서비스로 엄청난 경쟁 압박을 뚫고 가야 하는 지를
아주 잘 이해하고 있는 모습에, 그것을 실제로 이뤄 내면서,
그간 한 번도 모델 성능이나 기능 면에서 부족하다는 말을 듣지 않았으니...
앞으로의 경쟁의 관건이라고 할 수 있는
실제 업무상의 다양한 접목에 있어서
주목 할 것은...
클로드의 코워크 기반 + 법률 등 이미 서비스를 시작한 기능의 고도화 및 확장
오픈AI의 코덱스 기반... 통합 앱에서의 개인 + 업무용의 현존하는 기능 몽땅 모아 놓은 앱의 경쟁력.
이렇게 흘러 갈 것 같습니다.
구글의 생태계를 말씀하시는 분들이 많았는데요.
물론 일정 부분 가져갈 것 같습니다.
제 말은... 생각 보다 시장을 다 가져가진 못할 것 같다는 말입니다.
코워크 기반의 서비스가 보다 더 확장 되고 안착 되기까지 구글이 반격하지 못한다면요.
구글 생태계의 온갖 기능 중 필요한 것들은 이미 코워크 안에서 대부분 되기도 하고요.
샘 알트만이 괜히 통합 앱에 힘을 바짝 주는 것이 아니라는 이야깁니다.
락인을 하기 위한 분기점이... 에이전트 통합 앱이라고 생각하는 것 같습니다.
근데, 말씀대로 문과생이 백테스트나, 자동주문봇 정도 만드는 상황이라 클로드를 유료 구독할 필요까지는 못느끼고 있는데, 장기적으로는 앤트로픽이 다 먹을 수도 있겠다 싶네요.
실제써보면 코덱스랑 성능 차이 그렇게 크지도 않은데 체감 가격은 10배라서... 클로드 안쓰게 되요.
ㅠㅠ. 저도 피해잡니다.
너무 적어졌어요..ㅠㅠ
이런 것 같습니다.
예를 들면...
예전에 맥북프로 일반 버전으로 충분한 사람과
맥스로 가야 하는 사람은...
둘 다 유튜버인데,
한 사람은 강연까지 같이 해야 해서,
말 그대로 시간이 돈인 사람은...
그 빠른 프로 보다 더 빨라야 하고,
그래서 맥스로 산다는...
클로드 구독제 중에 가장 비싼 요금제를
몇개씩 쓰는 사람들....
가격 보다 시간이 중요한...
그런 케이스가 상대적으로 적었는데,
그래도 체감이 되다 보니,
기업에서의 채택이 생각 보다 많이 늘어나고 있습니다.
일단 코덱스로 옮기고 싶은데.. 또 써보면 한숨만..... 계획은 그럴듯 했는데..
가장 좋은 것은 클로드 Opus4.6과 Codex5.4를 동시에 이용해서 상호보완적으로 운영하는 형태이며, 루틴이 만들어지면 버그 발생율이 거의 없다시피 할 정도입니다.
결국 클로드가 꽤 똑똑하지만.. 토큰제한이 매우 혹독한 모양이군요...
아! 소문은 들었습니다.
최근에 또 신모델 내놓는다고 했는데.. 나왔는지 모르겠네요.
신 모델은 클로드와의 점수차가 고작 2점차라고 본 것 같습니다.
다만 속도가 느리고 비용이 비싸도 한번만에 가장 좋은 결과를 내는게 결국엔 가장 적은 비용이고 가장 빠르다는게 제 생각이라 opus 4.6 max effort thinking으로 계속 돌립니다.. ( 물론 사용량 엄청 녹습니다..)
반면, 꾸준하게 하나하나 규명을 해나가야 하는 디버깅에서는 일단 던져보는 패턴으로 인해 갈팡질팡하면서 불필요한 시도를 해서 디버깅을 지연시키는 경우도 많습니다.
보통 사람들은 한도 다 쓰기 쉽지 않습니다.