코딩 할 때 AI에 자율성을 대폭 주는 게 오히려 낫군요..? : 클리앙

바이브 코딩을 주로 파일 단위 수정이나 작성 계획을 이야기하면서

작업해왔는데 아예 자율성을 주고 '기능 단위' 전체를 스스로 완성하도록 하니

결과가 되려 더 나은 기분입니다?

'뭔가, 뭔가'라는 불안감이 있어서 통 크게? 맡기지를 못했었는데요.

어제 replit이라는 사이트에서 웹 하나를 상세 프롬프팅으로 대부분의

기능 초안까지 구현해주는 걸 보고... gemini pro랑 claude 4를 이용해서

'큰 단위'의 작업을 뭉텅이로 넘겨주듯이 해봤는데요.

잘 되네요. 차라리 gemini를 2.5 pro부터, claude를 4부터 사용했다면

뭉텅이로 넘길 생각을 했을건데.. 제미나이는 바드 시절부터 썼고

클로드도 초반부터 써와서 '업그레이드 된' 점을 너무 간과한 게 아닌가

싶을 정도로 잘 뽑아주네요.. 물론 아주 고급 코드나 복잡한 관계가 얽힌

코드가 아니라서 그런 부분도 있겠지만요..

기능의 목표, 그 기능이 유기적으로 작용할 기능들, 코드 작성 방식, 프로젝트 최종 목표..

등등을 참조로 걸어줬고요. 의존성을 가지게 될 DB나 코드들 정리 내역까지 참조해서

정합성을 1 목표로 추구하도록 프롬프팅 해줬습니다. 아, 실제 사용자의 사용 시나리오도

세분화해서 넣어줬고요. 시나리오에 따라서 빠진 내역에 대한 체크까지 요청했고요.

결과는.. 되려 완성도나 코드 일관성 면에서 파일 단위로 끊어서 요청하던 것 보다

훨씬 더 나은 모습을 보여주는 것 같습니다..?

물론 세부적인 부분은 손 볼 부분이 있습니다만, 파일 단위로 요청했을 때 보다

직접 손 코딩이나 체크해야 되는 부분이 확 줄어드는게 체감돼요.

예전부터 써오다 보니 코딱지 만한 컨텍스트랑..

크다고 홍보는 하는데 체감은 절대 안되던.. 막상 참조 많이 걸어버리면

엉뚱한 답만 뽑아내던 예전 버전 LLM들에 가스라이팅이 많이 돼서

컨텍스트 용량을 자체적으로 고려하고 참조도 최소한으로 걸고 했었는데요.

이번엔 필요한 내용들 참조로 우다닥 걸고서 기능 단위로 맡겼는데

추론 모델이라 좀 느리지만.. 대충 10분 정도 혼자서 뚝딱뚝딱 하더니

A to Z기능 뚝딱이고 테스트 해보니 웬걸? 한 번의 오류 없이

작동하네요...ㄷㄷ

다만! 제미나이는 없는 파일을 확인 했다고 구라를 치거나

터미널에서 오류난 내역이 있음에도 '성공적으로...'라고 할루시네이션으로

"했다 치고~"로 넘어가는 게 좀 많다고 느껴졌습니다. claude 4가

컨텍스트 용량은 훨씬 작은데도 어찌 제미나이 프로보다 더 똑똑한

느낌이 드네요. 바로 얼마전 까지만 하더라도 제미나이가 코딩에

1황 느낌이었는데..

제미나이는 중간중간 필연적으로 생기는 린터 오류도 일일히 점검한다던지

사용자에게 보고하는 바람에 연속적 작업에 지나치게 긴 텍스트가

다음 프롬프트의 컨텍스트 복잡화에도 영향을 많이 주고요.

프롬프팅으로 간결하고 짧은 답, 필연적 발생 린터 오류등에 대해서는

답변을 하지 않도록 설정해놔도 GPT, Claude는 말을 잘 듣는데

동일 프롬프트에서 유독 제미나이가 쌩(!!)을 많이 까네요.

뭐 여튼 그렇습니다. 문득 드는 생각이...

AI발전이 편리하기는 참 편리한데.. 지금은 뭐랄까 발전 속도에 비해

산업 현장에 적용되는 속도가 느린 상황이다..?로 보이고...

GPT가 퍼져나가던 것 처럼 활용도가 사회 전반에 걸쳐서 올라간다면

날아가는 일자리는 가속화 될 게 불보듯 뻔해질 것 같아..

걱정도 되고 뭐 여러가지 생각이 드네요..ㅎㅎ

모두의공원