GPT-5에서 자동 라우팅 기능으로 추론 작업에 들어가면 GPT-5 Thinking(low)로 스위칭, 더 깊게 생각하라 같은 프롬프트를 명시적으로 넣는 경우 경우 GPT-5 Thinking(medium)으로 라우팅 된다고 합니다.

그리고 Plus Plan의 경우 GPT-5 Thinking 모델의 제한량을 주당 3000회로 변경하려고 한다고 하네요.
이러면 굳이 GPT-5 를 사용 할 이유가 없는데 기존 200회에서 15배나 올려줬다는건 신빙성이 의심되긴합니다.
출처의 댓글에서 GPT-5 Thinking 모델에도 종류가 여러가지가 있어서 그 모델들의 총 사용량을 말하는 듯 합니다.
아마도 o3급 GPT-5 Thinking 의 제한량은 여전히 주당 200회가 맞고 이전의 o4-mini, o3-mini 이런 모델에 대응하는 경량화 모델들의 제한량 총합이 주당 3000회라고 생각하는게 합리적으로 보입니다.
아마도 기존 레거시 모델들을 제거하면서 반발하니까 올려준것으로 보이는데요.
OpenAI의 통계상 유료구독자(Plus Plan)의 경우에도 o3같은 고급 추론 모델을 사용하는 비중이 8% 밖에 안됐다고 합니다.
그런데 GPT-5로 넘어오면서 24%로 늘었다고 하네요.
저는 간단한 작업이든 어려운 작업이든 모델 수준별로 산출물의 급의 차이가 사용자가 느낄 수 있을 정도로 선명하다고 생각합니다.
다만... 결과물이 사용되는 맥락에 따라서 그 차이가 결과물을 못쓰게 만들정도로 결정적이냐, 조금 거슬리는 문제 정도냐하는 차이일 뿐이죠.
대표적으로 드러나는 질의 문제로 LLM들이 생성한 글에서 단어 선정이 날카롭지 못하며 때로는, (맥락을 고려했을 때 이해는 할 수 있되) 엄밀히 말해 틀린 단어를 선정한 것들도 많이 보여요.
그러니 지금 문제는 뭐냐면, 데스크 트레이 만들어 주세요. 라고 했더니
"어 보니까 책상에서 작업하는 일이 많지는 않으시죠? 그럼 대강 마감이 좀 허술하고 내구성이 안좋아도 괜찮잖아요. 당신한테는 3D프린터로 뽑아서 드릴게요." 하고 사포질도 안하고 던져주는거죠.
소비자가 선택권을 가지는게 아니라, 내 상황을 보고 판매자가 파는 상품의 질을 결정하겠다는건데... 어처구니 없는 발상이죠.
그걸 일부 소비자만 아는 마법의 주문 '마감에 신경써 주세요' 라고 하면, 사포질을 해서주거나, 아예 구조적으로 더 튼튼한 다른 소재와 방법을 통해 제작한걸 준다는거고요.
그런데... 그렇게 프롬포트 내에 라우터 선택 옵션을 내장할거면, 그게 외부로 옵션으로 빠져 있지 못할 이유는 뭔가 싶고요.
비추론 모델을 선택해서 사용하는데 대부분의 사용자는 추론/비추론 관심이 없을것이므로 약간은 눈속임 비슷한 전략을 취하는게 아닐까 싶어요.
GPT-5 관련해서 명시적으로 프롬프트에 추론 모델로 전환하는 트리거를 넣어서 답변 품질을 올리는게 팁으로 올라 올 정도니까요.
메이저 버전이 올라갔는데 생각보다 미적지근하네요.
구글은 매우 무섭게 치고 오고 있고 앤트로픽은 철저하게 자신들만의 강점을 강화하는 느낌이구요.