GPT만이 아니라 클로드와 제미나이... 역시
보이지 않지만 존재하는 시스템프롬프트가 상당히 두텁게 존재합니다.
쉽게 말해 AI 모델을 보다 효과적으로 사용하기 위해 사용자만 하네스를 쓰는 것이 아니라
서비스 제공 기업들이 이미 그런 기능을 내장하고 있고,
그 양이 만만치 않게 많다는 말입니다.
얼마 전 유출 된 클로드코드 관련 내역만 보아도...
그 양이 상당했습니다.
즉, 업무 활용도를 높이기 위한 장치를 가장 꼼꼼히 신경 쓴 곳이 클로드였기에 체감이 좋았던 것입니다.
대신....토큰이 녹아 내린 것이고요.
이 모두는 추측이 강하게 들어가 제목에 '개인적 추측'으로 달아 놓았으니 감안해서 보아주시면 좋겠습니다.
제 느낌은...
이번 5.5는 모델 자체의 성능도 향상이 있었지만,
과도하게 열거해 놓았던 내부 지침 및 기능을 정리한 것이 아닌가 싶습니다.
이렇게 추측하는 이유는...
대개 어디서 알아 볼 수 있느냐면,
사용자 지침을 제대로 이해하는가. 그리고 얼마나 충실히 따르는가 여부에서 갈리는데,
이 내부 지침이 제대로 정리가 안 되어 있을 경우
모델의 성능을 깎아 먹을 뿐 아니라 ... 사용자 체감에서 중요한 지침을 잘 따르지 않게 됩니다.
그래서 지침과 크게 무관한 경우는 더 똑똑한 것 같은데,
지침이 필요한 정교한 작업에서는 내부 지침의 통제가 심해서
욕 나올 때가 자주 발생한다는 것입니다.
이번에 잘 정리도 하면서,
제로샷의 의미를 살리고,
언어적 측면 또한 강화 되어,
이제는 이전에 호평 받은 ... 소위 유저들이 말하는 공감 능력이 더 좋게 와닿는다는 평과
동시에 기존에 해결이 안 되던 프로젝트를 완료 할 수 있었다는 후기도 있습니다.
산업적 측면에서 보면,
더 비싼 토큰인데, 덜 쓴다...라는 앞서 제가 쓴 요약 글의 내용 역시
이렇게 잘 정리된 내부 하네스로 인해
서비스의 효율화를 이뤄 오픈AI에 발생하는 서비스 비용 대비
이익 이란 측면에서 좋아질 것 같습니다.
하네스의 중심은 지침 + 스킬 + 스크립트 + 에이전트입니다.