Plus 플랜으로 GPT-5 써보고 있습니다. (비 개발자 관점) : 클리앙

의도치 않게 올해 들어 잼민이, 지피티, 퍼플렉시티를 다 구독하고 사용하고 있습니다...(돈 낭비 ㅠㅠ)

저는 기존에 GPT 모델들이 파편화된 게 너무 직관적이지 못하고 불편하다고 생각했는데요.

4o, o4-mini, o4-mini-high, 4.5, 4.1, 4.1-mini 이렇게 있었는데,

각각이 어떻게 작동하는지 어떤 모델인지에 대한 디테일한 설명이 없어서 혼란스러웠어요.

GPT-5오면서 심플해지기는 했는데...제가 원하던 방향이 절대 아니네요..

기존에 GPT-4o는 너무 친구처럼 대화하는 식으로 캐주얼하게 답변을 줘서 거의 배제하고,

업무용으로 o4-mini / o4-mini-high를 위주로 잘 사용하고 있었습니다. Plus plan에서 질문 횟수도 넉넉했고..

이 모델들의 '생각하는 중'이 CoT인지 다른 기능인지는 모르겠지만, 어쨌든 바로 답변을 주지 않고 한 번의 버퍼가 있어서 그런지

프롬프트를 조금 공격적(?)으로 작성하면 4.1이나 4o, 또는 타 사 일반 모델들(소넷3.7/4.0, 잼민2.5 등)보다 환각도 적은 편이라고 판단하고 사용했거든요.

대충 찾아보니, GPT-5는 mini, base, thinking, pro로 딱 적당하게 정리가 되었던데..

차라리 이 네 가지에 대해서 일간 횟수 제한을 명시해서 알려주면 제가 원하던 정리의 방향일 것 같습니다만...

사용자 입장에서 더 속 편하게 사용할 수 있을 것 같거든요. 지금은 세부 모델을 고를 수 없게 되어 있어서 곤란하네요.

일단 GPT-5는 환각이 줄었다는 제조사 설명에 비해 벤치마크에선 어떨지 몰라도 사용자 입장에서는 여전히 hit or miss라고 생각합니다.

4.1에 비하면 월등한 것 같고, 4o/o4-mini랑은 비등하거나 좀 나을 수도 있을 것 같지만 아직 확인이 덜 되었구요.

Thinking으로 선택해서 질문하면 확실히 괜찮네요.

(개인적으로 환각이나 답변 수준이 일정 수준의 threshold를 넘지 못한 모델은 써먹을 수 없다고 생각해서 GPT-2? 3?시절이나 4.1이나 그놈이 그놈이라고 봅니다. 그냥 오 신기하구나 수준)

제가 클량의 많은 개발자분들하고 다르게.. 저도 뭐 개발자입니다만 S/W가 아닌 H/W쪽이라 관점이 좀 다를 수 있는데요.

반도체와 회로 엔지니어로 일하면서 평가..까진 아니고 제가 어느 정도 믿고 쓸 수 있는지 확인차 물어보는 질문지가 3개 정도 있는데,

아직 제게 정확한 답을 주는 AI모델은 없지만, GPT-5 thinking은 확실히 기존 o3나 o4-mini-high보다는 내놓는 대답이 개선이 많이 된 걸 느낍니다.

다만 GPT-5가 Perplexity의 Research 대비해서 더 나은 점은 속도가 조금 빠르다는 점 외엔 잘 모르겠어요.

저는 GPT Plan이 좀 정리되지 않으면 Plus 구독 해제하고 계속 Perplexity Research를 계속 활용할 것 같습니다.

Perplexity의 Research는 횟수가 일300회? 그정도 수준이라서 제가 사용하는 용도로는 거의 구애받지 않고 사용할 수 있거든요.

제가 사용하는 용도에서는 체감상 GPT-5 Thinking ≒ Perplexity - Research ≒ 잼민이 2.5 프로 정도 느낌입니다.

그런데 그 중에 Research를 선호하는 이유는 타 모델들 대비 웹 검색을 엄청나게 많이 하고 답변을 줘서 그렇습니다.

환각 교정이 프롬프트로도 가능하겠지만, 체감상 레퍼런스가 많아도 많이 줄어드는 것 같더군요.

- 아 그리고 방금 작성하며 확인해보니 Perplexity에도 GPT-5가 들어왔네요. 캐주얼하게 써먹기 좋아 보입니다. 굿굿

퍼플렉시티 자체 모델인 Sonar는 완전 구데기라서(...)

개발자분들이 좋다고 하시는 그록이나 클로드 고급 모델들은 아직 안 써봤습니다.

그리고 저는 아직 각 서비스에 있는 딥 리서치(최고급 기능)도 쓸 일이 없었네요.

쓸데없는 긴 글 읽어주셔서 감사합니다.

굿나잇!

모두의공원