2월 중순 부터 codex app 을 이용하는 경우 해당요금제 한도의 x 2배를 주는 프로모션이 진행중이라
(3월 2일까지 였다가 4월 2일로 연장)
GPT 5.4 xhigh 에 fast 모드로 사용 중인데 사용량이 대략 50% (PRO 구독중) 정도 남으면 계속해서 초기화를 시켜주내요.
Claude의 Opus 4.6 으로 진행하다 GPT 5.4 xhigh 에 fast 그리고 전체 액세스 권한을 주니
기본 설계문서와 화면, 그리고 인터넷 검색등을 통해 해당 개발을 진행해 주는데 생각보다 준수한 결과물을 뽑아내더군요.
Claude Opus도 늘 문제였던 것이 작업을 지시하면 완료되었다고 하는데 실제 작업이 안되어있는 경우가 꽤 많이 있었는데
GPT 5.4 xhigh 에서는 본인이 작업한거 그리고 남아있는 잔여작업이 무엇인지를 계속해서 던져줘서 생각보다 누락되는게
많지 않다는 장점이 있었습니다.
프로모션 기간까지 무제한에 가까운 사용량을 자랑하다 보니 Claude Opus 는 사용을 아에 하지 않아서 구독을 취소해야하나
고민중인 상황입니다. 생각보다 Opus 대비 장점들이 꽤 많이 있는거 같아 당분간 주력으로 사용할 예정이고요.
추가로 Codex app 구조를 보니 open claw 기능들이 Codex App 으로 통합될 것이라 생각이 들기도 하고요.
openai 프롬프팅 가이드에서도 웬만하면 항상 기본값으로는 쓰지 말라고 하더군요.
이것 관련해서 어제 조코딩 채널에 open ai 담당자랑 live 로 codex app 관련해서 설명하면서 한 말이 있어요.
"벤치마크 평가에는 인간의 판단이 포함되는데, 인간은 더 간단하고 빠른 해결책을 선호하는 경향이 있어 벤치마크 결과에 반영될 수 있습니다"
"생각 시간의 양면성: XHigh 모델은 더 오래 생각하여 답변하지만, 무조건 더 오래 생각한다고 해서 더 정확한 결과를 내놓는 것은 아닙니다"
라고요. 즉 각각 코딩에서 내가 모든것들 주입할 수 있으면 high 가, 그러나 내가 조사가 부족하거나 뭔가 대충 던져줘야할때는 xhigh 가 괜찮을 것이다 라고 말이죠.
open ai 직원도 모든 시연은 그냥 xhigh 로 넣고 실행하더라고요. 단순 프롬프트 1개로 최종본까지 뽑을때 유용해서 사용한다고 합니다.
정답입니다! 새로운 모델 나와서 괜찮은거 있으면 갈아타는게 최고죠.
저는 vscode에 github copilot 물려져있고, 네이티브 에이전트가 들어간 vscode상에서 돌리는 opus 4.6은 정말 한차원 다른 강력함을 보여준다고 느꼈었거든요. ( 물론 이것도 한계는 있지만요.. )
vscode에서 codex 익스텐션 사용해서 사용하던 에이전트 모드로서의 움직임이 너무 비교되서 성격급한 저는 쓸게 못된다고 느꼈었는데, 요번에 codex app 이 나오면서 codex와 gpt 5.4도 조금씩 테스트 해보고는 있습니다.
아직 뭔가 체감할 정도로 써보지를 못해서 평가를 못내리고 있는데, vscode에 비해서 더 큰 사이즈의 context를 다룰 수 있는 부분이 괜찮아 보이는 반면, 대규모 코드를 다루는 상황에서 리소스 먹는게 눈에 보여서 최적화는 필요해 보이더라구요.
ide 없이 그냥 터미널에서 신규 프로젝트 생성하고 바로 claude cli 로 진입해서 작업을 하는 편이거든요.
저는 원하지 않는 수정은 배제하고 싶고, 결과물 하나하나 다 훑어보는지라 IDE가 없는 AI는 앙꼬없는 찐빵 같은 느낌인데, 어떤식으로 작업하시는지 궁금하기는 하네요. 답변해주셔서 감사합니다.
저도 말씀해주신 부분은 신경쓰고 있는데, 소규모 일때랑 사이즈를 좀 키웠을 때,
그리고 대규모 일때가 또 다르게 느껴져서 어떤식으로 방향성을 잡아가야할지 한참 고민중입니다 ㅎㅎ
좀 더 고민하면서 이것저것 해보면서 답을 찾을 수 있었으면 좋겠네요.
저도 현재 중대형급 프로젝트를 전개해보고 있는데
결국 사람에 위한 프로젝트를 진행할때 어떻게 했었는지를 되돌아 보게 되더라고요.
그래서 그 방법에 대해 더 강하게 AI 에게 요구를 해서 퀄리티를 높이는 방향으로 가고 있습니다.
어차피 중대형급 프로젝트에서 나 혼자 개발을 하고 설계를 하는 것이 아니였는데 그때는 믿고 지금 AI 는 못믿을 존재일까 생각해 보면 오히려 더 믿을 수 있다 생각이 들었어요.
최근에 Codex 에서 codex security 라는 것을 내놔서 지금 작업 마무리 단계에 있는 프로젝트를 올려놓고 보안점검을 해봤는데 이슈사항이 0개로 나오더라고요. 이것으로 좀더 확신을 가지게 되었습니다.
그만하라 말나올 때까지 AI들을 더더더 굴려봐야겠네요.