https://twitter.com/Lentils80/status/2063327001797447800
아마도 초기 버전 미토스겠죠.
너프 폭은 얼마나 될지는 모르겠지만 어마어마하게 비싸고 엄청난 추론을 한다고 합니다.
간단한 프롬프트에서 Low 기준으로 추론에만 20만 토큰을 썼다고 하니 딸깍 잘못하면 몇만 원 날아가는 겁니다.
https://twitter.com/Lentils80/status/2063327001797447800
아마도 초기 버전 미토스겠죠.
너프 폭은 얼마나 될지는 모르겠지만 어마어마하게 비싸고 엄청난 추론을 한다고 합니다.
간단한 프롬프트에서 Low 기준으로 추론에만 20만 토큰을 썼다고 하니 딸깍 잘못하면 몇만 원 날아가는 겁니다.
즉 지금의 성능보다 떨어지게 조정한다는 뜻 입니다.
그리고 이 달 말에 GPT-5.6 출시 예정이구요.
앞으로는 모델 성능이 중요하다기보다 이제는 값싸고 빠른 모델을 여러개 굴리는게 중요할 거라고 봅니다.
이제 모델 들 성능이 앵간한 개발자는 상대도 안되게 다들 올라와서 결국 가격이 문제일것같아요.