2026 수능 풀이 AI종합점수 및 총 비용 : 클리앙

스크린샷 2026-04-25 142536.png

수능의 여러 영역에 걸친 종합 점수

스크린샷 2026-04-25 142514.png

GPT 5.5가 발표 할 때 나온 효율은 곧 똑똑한 만큼 토큰을 덜 먹으면서 정확히 풀 수 있는 모습으로 증명 되었습니다.

스크린샷 2026-04-25 142526.png

https://hehee9.github.io/2026-CSAT/

딥시크가 눈에 띕니다.
토큰 비용은 싸지만 문제 풀이를 위해 써야 하는 연산량 때문에...

딥시크 모델의 경우 고성능 모델이 플래시 모델 보다 비용이 적게 나온 대목이 눈에 띕니다.
이 정도면 비용의 이점 보다 성능 차가 더 크다고 볼 수 있을 것 같습니다.

물론 수능으로 모든 것이 다 설명 되지는 않습니다만,

여러 언어부터 수학 과학 등을 아우르므로 일정 부분의 대표성은 있어 보입니다.

코딩이나 에이전트 성능이 중요한 시기여서 이런 부분만 볼 수는 없겠지만 말입니다.

앞자리는 모두 GPT, 제미나이, 클로드 순의 성적이고,

중국 모델의 성능은 Qwen, 딥식, KIMI 순이며,

그 뒤를 그록과 K엑사원이 뒤따르네요.

이 와중에 성능은 확실한데 역시... 가장 비싼 건 클로드 오푸스군요..ㄷㄷㄷ;

얼마 전까지는 코딩과 같은 전문 분야 외에는

종합적 성능에서 제미나이가 가장 무난한 선택이었다면,

이제는 코딩 포함 전 분야에서 GPT 5.5가 비용과 성능 모두에서 원탑이 된 모습입니다.

중국 모델은 가성비가 아주 좋은 것 같이 홍보 되지만,

실제로는 API 토큰 당 비용만 쌀 뿐... 실제 결과를 내기 위한 비용에서

얼마 더 싸지 못한 대신 그 가격차 보다 더 낮은 실성능이었습니다.

GLM5.1 의 경우 API비용 대비 코딩 쪽으로 괜찮다고 하니,

특화 성능 쪽으로는 조금 다를 수 있는 점을 감안해서 보면 될 것 같습니다.

모두의공원