주 업무가 개발자는 아니지만 업무상 필요한 툴이나 스크립트 몇 가지를 작업하고 있습니다.
개발자가 아니라고 회사에서 승인을 안해줘서 cursor같은 서비스 사용을 못하고 있어서 이 부분은 감안하고 봐주세요.
제가 아래 언급한 단점의 상당부분은 전문 바이브 코딩툴을 사용하면 해결 가능한 문제입니다.
모두 유료버전입니다.
Gemini 2.5 Pro
장점:
- AI 바이브 코딩의 고질적 문제인 수정할수록 코드가 늘어나는 현상이 없습니다.
- 방어적 코드 작성과 장황함으로 인한 코드 길이 증가 문제가 지금까지 써본 AI 코딩 서비스 중 유일하게 발생하지 않으며,
오히려 수정할수록 코드 최적화를 잘 수행합니다.
- 하루종일 작업해도 사용량 제한이 없습니다.
단점:
- 기본적인 문법 오류가 자주 발생합니다.
- 가독성을 위한 것으로 보이나 함수명을 과도하게 길게 작성합니다. (가이드 제공으로 해결 가능)
- 동일 채팅창에서 이미 수정했던 내용을 누락시키는 경우 발생합니다.
- 로직 변경 시 뷰단 변경을 누락하는 경우가 많습니다.
- 함수명 변경 후 관련 부분 수정을 누락하는 경우도 있습니다.
AI가 뭐 이런걸 틀리냐 싶은 경우가 많은데 이런 문제들은 오류만 봐도 원인을 바로 파악할 수 있어서,
애초에 로직을 잘못 짜는 다른 서비스보다 훨씬 만족스럽습니다.
Claude Opus 4
이전 버전까지 오류 없이 코딩 가능한 최고의 툴이었고 거의 대부분의 작업을 claude로 했고
Opus4는 분명 더욱 개선되었습니다만
단점:
- 사용량이 매우 제한적입니다. (2천 라인 정도 코드를 3~4번 수정하면 5시간 대기)
- 방어적 코딩 스타일이 개선되지 않았습니다.
바이브 코딩이라는게 만들고, 수정하고, 추가하고를 반복하는데 나중에는 기능 추가 없는데 코드가 2~3배로 커져있습니다.
- 다소 예전 스타일의 코딩 방식으로 느껴집니다.
- 기능을 잘 만들기는 하는데 고도화 과정에서 타 서비스에 비해서 한계가 느껴집니다.
- 기능이 좀 복잡해지면 다른 언어 사용을 제안합니다.
ChatGPT o4-mini-high
- 코딩 스타일은 매우 세련되고 어이없는 실수는 없으나 생성된 코드가 제대로 실행되지 않는 오류가 많습니다.
- 긴 코드의 경우 수정할수록 오히려 엉망이 되는 경향이 있고,
사용량 제한이 여유가 있다고 하는데 채팅창에 작업내용이 일정이상되면 작업하는척하다가 작업을 포기합니다.
claude은 사용량을 넘었다고 알려주는데 gpt는 그런게 없네요.
간단한 이슈 처리에는 매우 유용한 인사이트를 제공하지만, 실제 코딩 작업에는 적합하지 않다고 판단됩니다.
결론적으로 지금까지 바이브 코딩은 주로 Claude만 사용했었는데,
Gemini 2.5 Pro가 정식 버전 이후 크게 개선되어 지금은 이것만 사용하고 있습니다.
구글의 저력이 대단하다고 느껴집니다.
커서로 작업하다 막히면 클로드에 코드 던지고
Diff 패치형태로 만들어달라고 하면 출력토큰을 아낄수 있습니다
하지만 이것도 코드량이 많으 싸이트에서 분석해서 해결 해달라고 하면 무한적으로 해결 못하더군요.
기본적인것만 제대로 되지만 그 이상은 아직 무리인거같아요.
개인적인 추측이지만 api는 아무래도 비용을 절감하기 위한 프롬프트가 필요 없으니까 코드가 긴 경우에 좀 더 신뢰할 수 있는거 같습니다.