의도치 않게 올해 들어 잼민이, 지피티, 퍼플렉시티를 다 구독하고 사용하고 있습니다...(돈 낭비 ㅠㅠ)
저는 기존에 GPT 모델들이 파편화된 게 너무 직관적이지 못하고 불편하다고 생각했는데요.
4o, o4-mini, o4-mini-high, 4.5, 4.1, 4.1-mini 이렇게 있었는데,
각각이 어떻게 작동하는지 어떤 모델인지에 대한 디테일한 설명이 없어서 혼란스러웠어요.
GPT-5오면서 심플해지기는 했는데...제가 원하던 방향이 절대 아니네요..
기존에 GPT-4o는 너무 친구처럼 대화하는 식으로 캐주얼하게 답변을 줘서 거의 배제하고,
업무용으로 o4-mini / o4-mini-high를 위주로 잘 사용하고 있었습니다. Plus plan에서 질문 횟수도 넉넉했고..
이 모델들의 '생각하는 중'이 CoT인지 다른 기능인지는 모르겠지만, 어쨌든 바로 답변을 주지 않고 한 번의 버퍼가 있어서 그런지
프롬프트를 조금 공격적(?)으로 작성하면 4.1이나 4o, 또는 타 사 일반 모델들(소넷3.7/4.0, 잼민2.5 등)보다 환각도 적은 편이라고 판단하고 사용했거든요.
대충 찾아보니, GPT-5는 mini, base, thinking, pro로 딱 적당하게 정리가 되었던데..
차라리 이 네 가지에 대해서 일간 횟수 제한을 명시해서 알려주면 제가 원하던 정리의 방향일 것 같습니다만...
사용자 입장에서 더 속 편하게 사용할 수 있을 것 같거든요. 지금은 세부 모델을 고를 수 없게 되어 있어서 곤란하네요.
일단 GPT-5는 환각이 줄었다는 제조사 설명에 비해 벤치마크에선 어떨지 몰라도 사용자 입장에서는 여전히 hit or miss라고 생각합니다.
4.1에 비하면 월등한 것 같고, 4o/o4-mini랑은 비등하거나 좀 나을 수도 있을 것 같지만 아직 확인이 덜 되었구요.
Thinking으로 선택해서 질문하면 확실히 괜찮네요.
(개인적으로 환각이나 답변 수준이 일정 수준의 threshold를 넘지 못한 모델은 써먹을 수 없다고 생각해서 GPT-2? 3?시절이나 4.1이나 그놈이 그놈이라고 봅니다. 그냥 오 신기하구나 수준)
제가 클량의 많은 개발자분들하고 다르게.. 저도 뭐 개발자입니다만 S/W가 아닌 H/W쪽이라 관점이 좀 다를 수 있는데요.
반도체와 회로 엔지니어로 일하면서 평가..까진 아니고 제가 어느 정도 믿고 쓸 수 있는지 확인차 물어보는 질문지가 3개 정도 있는데,
아직 제게 정확한 답을 주는 AI모델은 없지만, GPT-5 thinking은 확실히 기존 o3나 o4-mini-high보다는 내놓는 대답이 개선이 많이 된 걸 느낍니다.
다만 GPT-5가 Perplexity의 Research 대비해서 더 나은 점은 속도가 조금 빠르다는 점 외엔 잘 모르겠어요.
저는 GPT Plan이 좀 정리되지 않으면 Plus 구독 해제하고 계속 Perplexity Research를 계속 활용할 것 같습니다.
Perplexity의 Research는 횟수가 일300회? 그정도 수준이라서 제가 사용하는 용도로는 거의 구애받지 않고 사용할 수 있거든요.
제가 사용하는 용도에서는 체감상 GPT-5 Thinking ≒ Perplexity - Research ≒ 잼민이 2.5 프로 정도 느낌입니다.
그런데 그 중에 Research를 선호하는 이유는 타 모델들 대비 웹 검색을 엄청나게 많이 하고 답변을 줘서 그렇습니다.
환각 교정이 프롬프트로도 가능하겠지만, 체감상 레퍼런스가 많아도 많이 줄어드는 것 같더군요.
- 아 그리고 방금 작성하며 확인해보니 Perplexity에도 GPT-5가 들어왔네요. 캐주얼하게 써먹기 좋아 보입니다. 굿굿
퍼플렉시티 자체 모델인 Sonar는 완전 구데기라서(...)
개발자분들이 좋다고 하시는 그록이나 클로드 고급 모델들은 아직 안 써봤습니다.
그리고 저는 아직 각 서비스에 있는 딥 리서치(최고급 기능)도 쓸 일이 없었네요.
쓸데없는 긴 글 읽어주셔서 감사합니다.
굿나잇!
벤치마크나 AI 성능을 논할 때 코딩 성능 dependant한 설명이 많이 보여서 의견 한 번 남겨봅니다.
그런데 가격이 좋아요. 그래서 플러스가 더 많다고 생각합니다.
API 가격을 보고 유추해 보시면 됩니다.
즉, 지피티 가격은 딱 제미나이2.5 프로에 맞춰놨습니다.
클로드를 비롯해 다른 서비스 보다 가격이 낮고,
가격 대비 성능에 한해 가장 뛰어난 제미나이와 같다는 것은...
노렸다고 봐야 하겠고요.
기존 지피티 프로 사용자의 기준으로 보면,
약 2배 이상 저렴해 진 것이어서요.
그럼 지금은 어떠하냐면...
프로 사용자의 프로 이용량은 똑같습니다.
기존대로 하시면 되고요.
오히려 더 늘려준다는 말이 나왔습니다.
주어지는 사용량은 더 많아지면 많아졌지 줄어들 일은 없습니다
그러면 사용자 뺏기는 건데요.
이걸 바꿔 말하면 제미나이 2.5 프로 보다 자신은 있는데,
압도하진 못한다고 보면 되지 싶습니다.
이게 더 나은 성능에 같은 가격이니 써봐라... 라는 의미겠죠.