claude에게 어떤 주제에 대해 글을 쓰게 하고, codex가 댓글을 다는 시스템을 만들었습니다.
claude가 글을 쓰면, codex가 그 글을 읽고 평가하고 댓글을 달면, 다시 claude가 트리거되어서 claude가 codex의 댓글을 읽고 댓글을 답니다. 그렇게 한바퀴 돌면, 제가 살펴보고 승인하는 방식으로, codex와 claude에게 댓글로 서로를 평가해 봤습니다.
claude에게 글을 먼저 쓰게하는 이유는 제가 더 신뢰하기 때문입니다. 오랫동안 claude에 대한 애정이 있었죠.
그런데 댓글 달리는 걸 보면, 주종관계가 생기는 것 같습니다.
항상 codex가 지적하고, claude는 "codex가 옳습니다. 저의 명백한 실수입니다." 이러면서 수정에 들어갑니다.
그리고 그 수정안에 대해서 또 codex가 지적하면, 별 군말없이 claude가 받아 들입니다.
나중에는 claude의 댓글에 "codex의 승인을 기다립니다."라고 까지 적네요.
믿었던 claude가 codex에게 못이기는 건가.. ㅎㅎ
물론 codex가 플레이어 claude가 감시자라면 달라질 수 있겠지만, 오늘 처음해본 결과 cladue가 끽 소리를 못하네요.
두 개 모두 plan mode에서 작업시키고 (codex는 알아서 superpower 스킬을 사용하네요), 두 개 모두 200달러 플랜이고, 가장 높은 사고로 작업 했습니다. 오늘 처음해본 협업이고, 불과 몇 시간 동안의 작업 경험이라, 단정짓는 것도 우습지만, 가장 신뢰했던 claude에게 실망하고 있습니다. 세간의 소문대로 codex의 리뷰 성능이 더 뛰어난 건지. 아니면 claude가 살짝 맛이 간건지... ㅎㅎ 내일은 반대로 해 봐야겠습니다. codex에게 일 시키고, claude가 평가하도록 해 보면 알게되겠죠.
-경험-
근데 써내려가는 능력 (유려함 등)은 클로드가 나아서 이 구도를 유지 중이긴 합니다.
오퍼스 4.7, GPT 5.5 들어서 유독 그렇네요. 4.6 / 5.4 때는 이정도는 아니었습니다.
동일한 결과가 나올지 궁금하네요
물론 느낌입니다.. ㅋㅋ
똑같은 작업물을 둘다 리뷰 시키고, 리뷰 내용을 서로 검토하게 하면
코덱스가 잡은건 클로드가 거의 다 맞다고 하는데
클로드가 잡은건 코덱스가 엇? 아니지 않나요? 하는 경우가 많이 늘었어요,
(클로드 신봉자 +1)