- 코딩 능력이 꽤 좋아졌습니다.
간단한 게임 만들어 달라고 하면...
전 보다 더 그래픽이나 기능을 좋게 만들어 줍니다.
- 언어 능력 1황이 된 듯 합니다.
- 5는 아니지만 o3가 체스 데회에서 그록4를 발랐습니다.
그런데 지능 자체는 제자리 걸음인 듯 합니다.
사람은 7살이면 바로 풀 수 있는 문제를 AI가 못 풀거나 틀리는
아주 간단한 문제들이 있는데요.
2번 혹은 3번은 버전업을 해야 맞출까 말까...발전이 거의 안 되는 수준이라
프런티어 모델에 기대를 걸어보지만....GPT5도 여전히 잘 못 풉니다.
- 벤치점수
거의 전 분야 SOTA 입니다.
한계가 이제 다가 온 것 같습니다.
기존 대비 전 분야에서 좋아지긴 했지만...
체감 가능한 부분은 일 부분에 국한 되고,
나머지는 점수로 나아졌다니.. 나아졌나 보다 정도...
그럼에도 여러 사용자들이 시를 짓게 하는 것을 보니...
4.5 보다 더 좋아진...글쓰기 전반이 다 그런 것은 아니고 표현력 부분에서1황....
결론.
지피티 쓸만해져서 쓰던 사람 계속 써도 되겠습니다.
클로드코드 쓰던 사람이 옮길 메리트... 까지는 없어 보입니다.
그록은 그냥 ... 지피티로 대동단결 하시죠....ㅎㅎ
가장 에메한 것이 그록인 듯 합니다.
그록 쓸 바엔 지피티가 낫고,
올라운더는 제미나이가 낫고,
코딩은 클로드가 낫고...
클로드/GPT/Grok3/제미나이
제미나이가 제일 밑입니다. 제 기준에서는.
/Vollago
아! 그 문제는 각자 쓰는 부분에 따라 체감이 달라서...
개인적으로는 요즘 거의 대부분의 경우 클로드를 씁니다. ㅎㅎ
정갈한 답변을 원할 때는 지피티... 가끔 쓰고,
지능이 클로드가 제일 높은 느낌... 제 환경에선요.
글쓰기, 범용성, 채팅용은 체감상 대폭 업그레이드된듯합니다.
OpenAI가 지향하는 방향이 이제 분명히 읽힙니다.
대다수는 이번 변화를 분명 ‘발전’으로 느낄 것 같습니다.
특히 이전에 모델을 적절히 고르지 못해
o3를 쓰지 않고 4o만 쓰며
AI를 혹평하던 분들은
체감 차이가 더욱 클 듯합니다.
선두를 유지하겠다는 생각에 전력과 GPU만 때려박다보니 이런 상황에 직면한거 아닐까요.
좀 써보고 지피티는 유료 계정 없엘까 고민해봐야 할거 같습니다. 클로드도 며칠전에 opus 4.1 나와서 만족하던 중이라.
잘은 모르지만...이게 트랜스포머 모델 자체의 한계라고 한다면 엔비디아 주식을 팔아야 할 타이밍일지도.
아키텍쳐는 이미 개선 된 모델들이 나오고 있습니다.
나중에는 개선 정도로는 안 될지도 모르지만.. 지금은 개선 중에 있습니다.
중국의 오픈 소스로 풀리는 모델은 기존의 트랜스포머 그대로가 아니라
나름 뜯어 고진 트랜스포머입니다.
폐쇄모델들도 마찬가지일 거라고 봅니다.
구글도 개정판 트랜스포머로 훈련 중이고요.
언젠가는 완전히 업그레이드 된 무언가가 나올지도 모르겠네요.
며칠전에는 싱가포르에서 모든 신경망을 동시에 활성화시키는 대신에 계층화해서 부분적으로만 순회하면서 활성화하는 H..뭐라 하는 모델(트랜스포머는 아님)을 깃헙에 공개하기도 했더라고요. 아주 낮은 리소스만 사용하는데 추론능력이 어마어마 하다고.