11월 18일에 구글이 Gemini 3를 공식 출시했길래, 지난 2주 동안 실제 업무랑 개인적인 작업에 계속 써봤습니다.
결론부터 말하면 “이제는 그냥 챗봇이 아니라 진짜 일을 대신 해주는 에이전트에 가까워졌다”는 느낌이 강했습니다.
1. Deep Think 모드 → 실제로 ‘생각함’
이번 버전의 핵심은 Deep Think인데, 복잡한 문제를 단계별로 쪼개서 논리적으로 풀어가는 능력이 확실히 올라갔습니다.
예전 모델들처럼 사용자 눈치 보면서 틀린 논리를 따라가지 않고, 논리 오류를 바로 잡아주는 편이라 오히려 "세컨드 오피니언"으로 쓰기 좋았습니다.
2. 코딩 능력 변화가 큼
그냥 코드만 생성하는 게 아니라, 오류를 직접 찾아서 수정하고 작은 프로그램 정도는 혼자 만들어버립니다.
UI 쪽 감각도 좋아져서 간단한 미니 앱 정도는 금방 프로토타입을 뽑아주더군요.
3. 멀티모달이 ‘실제로 쓸만한 수준’
이미지, 문서, 스크린샷, 텍스트를 한 번에 이해하는 능력이 꽤 자연스러워졌습니다.
예를 들어 평면도 이미지를 올리면 방 구조를 파악해서 간단한 시각화나 미니 프로젝트로 만들어주기도 했습니다.
4. 긴 작업에서 흐름이 안 끊김
이전 모델들이 긴 대화나 긴 문서 작업에서 맥락을 잃는 경우가 많았는데, Gemini 3는 처음 잡은 방향을 끝까지 유지하는 편입니다.
연속된 업무—기획, 리뷰, 문서 정리 등—에서 꽤 안정적으로 이어지는 게 체감됐습니다.
요약하자면, 이번 세대의 특징은 “대답하는 모델 → 스스로 계획하고 실행하는 모델”로 전환된 느낌이 컸습니다.
일상적인 Q&A보다, 실제로 뭔가 만들어주고 해결해주는 쪽에 강점이 있는 버전 같습니다.
혹시 다른 분들도 테스트해보셨다면 어떤 점이 가장 크게 느껴졌는지 궁금하네요.
저는 ChatGPT 유로 를 사용하고 제미나이는 무료를 사용하는데 이경우에는 ChatGPT가 훨씬 좋더라구요...
둘다 유료를 사용해서 비교해봐야 좀 객관적인 평가를 할 수 있을텐데...말이죠...
개인적으로는 뭔가를 아직 기획중이고 코드를 출력해달라할때까지 코드를 뱉지 말라고 하는데도 코드를 말하고 싶어 안달난 코드 투머치토커 같더군요. 3으로 넘어오며 그게 심해져서 저는 불편함을 겪고 있어요
코드작성 수준은 이제 claude와 비슷해졌다 느끼는데.... 클로드가 출력된 코드나 사용자가 제공하는 코드에대한 평가를 좀 더 보기쉽게 정리를 잘하는편입니다.