벤치는 생략하겠습니다.
제목대로 요약이기도 하고...
한 줄로 표현 가능합니다~ "육각형으로 성능 전반 향상"
아주 큰 차이는 아니지만, 이미 다 높은 상태에서 육각형으로 모두 오르다 보니
현존 SOTA 자리를 탈환했습니다.
발표 때 언급한 대목들을 본 사람들의 반응은 좋습니다.
# 컴퓨터 유즈, 에이전트
예상 되었던 대목으로, 이번 5.5 는 .. 실 사용 업무를 위한 에이전트 기능 강화에 초점이 맞춰져 있었습니다.
코드 작성 및 디버깅, 온라인 조사, 데이터 분석, 문서와 스프레드시트 작성, 소프트웨어 조작이 그 대상입니다.
목록을 보면 알겠지만 실제 업무 능력을 올리는데 초점을 두었습니다.
이러한 기능을 묶으면... 업무 자동화 및 과학 연구와 같은 지식 노동을 대체하려는 목적 지향이 보입니다.
이 외에도 사용자가 목적하는 모든 면에서 향상 되었습니다.
# 토큰당 비용 증가, 토큰 절약
토큰당 비용은 증가 했지만 토큰을 절약하는 기술을 통해 크게 보면 더 싸졌다고 주장합니다.
그런데 잘 생각해 보면... 제 느낌은... 토큰 절약 기술이라는 것이 토큰을 막대하게 소모하는 경우에
제대로 그 효과를 볼 수 있으므로... 일반 사용자의 경우 큰 체감은 어렵지 않나 싶습니다.
즉, 기존과 비슷비슷할 것 같습니다.
다만, 에이전트라는 것이 보통 일반 채팅 보다 더 많은 토큰을 요구하므로,
대체적인 효과는 있다고 보면...평균적으로는 대략 기존 대비 소폭 나아진 정도로 예상됩니다.
더 비싸지만 그 이상으로 똑똑해져서 자원을 덜 쓴다는 말입니다.
이런 특징은 아무래도 업무량이 많은 분들에게는 꽤나 매력적일 것 같습니다.
다만, 아주 간단한 작업과 답을 할 때는 토큰 가격 기준으로 조금 더 사용 될 가능성도 있어 보입니다.
# 총평
GPT는 현존하는 기술의 집약이므로 새로운 아키텍쳐가 등장하기 전까지 가능한
최대치의 지능에 근접해 가는 것 같습니다.
그러다 보니 5.4 때도 인텔리전스 부분에서는 1위를 이어갔는데,
이제는 그 상태에서 전 분야에 고르게 성능이 오르면서
체감은 꽤 많이 좋아 진 것 같다는 후기가 올라오고 있습니다.
다만, 단점이 없는 것은 아니니 ... 환각 부분입니다.
이 환각을 줄이는 지침은 아직 유지하셔야 할 것 같네요.
좀 더 설명 부탁드릴게요~
저도 누군가 공개했던 제미나이용 지침 씁니다.
예전엔 이런 것도 나름 연구했었는데,
매번 바뀔 때마다 하는 것이 귀찮아서...
한참 찾아 보았을 때라면 어디가서 보시라고 했을텐데,
아쉽게..지금은 저도 찾아야 해서...
https://www.clien.net/service/board/park/19177845CLIEN
컨텍스트 유지 능력은 이전 보다 크게 좋아졌고,
모델 경량화도 가장 잘하는데,
사용자 수 대비 아무래도 컴퓨팅 능력이 부족한 것 같습니다.
데이터센터 확보를 더 해야 하겠죠.
1M 가 272K 대비 4배가 아니라 ... 늘어날 수록 커지는 것이라...
서버에 부하가 아주 크죠.
KV캐시 양자화 (이미 있지만 혁신적인)기능을 기다리는 이유입니다.
한 달 쯤 전인가 구글 터보퀀트가 화제였던 이유이기도 해서,
조만간 논문만이 아니라 실제 공개한다고 하니,
이런 기술이 접목되면....컨텍스트 확장에 큰 도움이 될 것 같습니다.
아! 조금 전부터 5.5도 1M 설정이 먹기 시작하네요.. 제발 메모리 컴팩션 시 오류가 사라졌으면 좋겠는데, 272K 상태에서도 어제 한 번 오류를 경험한 터라 비관적입니다.. codex 를 가지고 이 버그를 못 잡고 몇개월이나 증상이 방치된다는 건, cli 쪽 문제가 아니라 모델에 구조적 문제가 있나 봅니다.
....1M으로 표시까지 되더니 실제 구동하니까 이번에는 258K로 찍힙니다...뭔가 작업을 하고 있는 모양입니다 ;;;