챗지피티 o1 프로 성능이 예상 보다 못하다네요. : 클리앙

모두 아시겠지만...벤치 점수는 점수일 뿐입니다.

참고가 안 되는 건 아니지만 살 사용 성능하고 괴리가 적지 않은 편입니다.

그럼에도 챗지피티의 경우 자사의 다수 모델이 같은 벤치를 받는 경우가 많았기 때문에

대조 가능한 비교군이 충분하므로 최신 오원프로의 성능이 전 보다 나아졌음을 부인하긴 어려운데요.

무려 200달러짜리 이 플랜을 이미 결제하고 사용해 본 사람들이 전하는 말에 의하면,

더 나은 답변을 주긴 하는데...열배 가격의 가치를 하느냐면... 아니라고 합니다.

그 이유는 프리뷰 버전에서 보여준 추론 과정을 그대로 답습하기 때문입니다.

예를 들어 다른 추론 방법, 더 나은 추론으로 기존에는 풀지 못했던 문제를

프로에서 풀 수 있어야 할 터인데,

추론 방법이 거의 같다 보니 프로버전임에도 프리뷰가 풀지 못한 문제는

프로도 풀지 못한다는 것입니다.

게다가 일부 오류가 있는 것인지, 프리뷰 보다 못한 결과가 나올 때도 있고,

코딩에 있어서 기존에 불가능했던 부분이 가능해졌다던지 하는 것이 아니어서

아무래도 사용량이 아주 많고,

그 답변의 질 차이가 조금이라도 더 나은 것이 자신의 생산성 향상 및

시간 절약 등으로 인한 이득이 큰 업무에 한해 200달러의 가치를 할 것으로 보이고,

이 정도 민감한 정도가 아니라면....굳이...가 될 수 있겠습니다.

즉, 아주 사소한 차이가 나의 생산성에 매우 큰 영향을 받는

일부가 아니라면 ... 굳이 사용할 필요가 지금 당장은 없는 것 같습니다.

모두의공원