네이버는 32B 모델을 최근 선보였고,
SK는 500B 모델을 발표했습니다. 공개는 내일입니다.
32B의 성능은 거의 반년 쯤? 전에 공개 된 Qwen 32B( 오해 하시는 분들이 많아, 첨언하자면 첫 공개 모델을 말합니다. 이후 개선 된 여러 응용 버전이 나왔습니다.)나 LG 엑사원 4.0 대비 여러 모로 소폭 더 나은 벤치 점수에 에이젠틱 부분에서 오픈 소스 SOTA입니다.
8B짜리 옴니모델의 경우 이미지, 텍스트, 소리 네이티브 통합 모델입니다.
왜 이게 의미가 있느냐면...기술력에 대한 척도 비슷한 거여서 그렇습니다.
독자 모델로 이 단계까지 왔다... 아 쫌 하는 구나.. 라는 개념입니다. 일종의 경계선이라고나 할까요.
최근 오픈소스의 대장 역할을 하고 있는 Qwen의 경우 온갖 응용 버전을 내놓는 중입니다.
이것만으로도 이미 격차가 좀 있는 편입니다.
큐웬 이미지 레이어(이미지를 포토샵처럼 레이어로 나눌 수 있어서 강력한 편집 기능이 가능)라는 강력한 신 모델이 각광 받고 있는 중이며, 이 외에도 온갖 실제 응용 버전이 하루가 다르게 쏟아 내고 있고, 그게 무려 1년 가까이 지나고 있습니다.
한국은 어찌 보면 이제 중국 오픈소스의 패스트팔로워 역할을 지금까지 해 온 느낌입니다.
중국이 그만큼 엄청나게 빨리.. 그리고 폭 넓게 달려 왔습니다.
이제는 GPU가 주어질 것이니 보다 큰 대규모 모델이 가능할 것 같고,
그리 되면 아무리 작은 모델부터 시작해 확장하는 유형이라고 하는 하이퍼클로바X 역시
500B 까진 아니어도 근접한 대형 모델을 공개할 가능성도 있습니다. 그리 커 보이진 않지만요.
SK 의 500B 모델은 당분간 소버린AI의 향방을 점치게 할 시금석 역할을 할 것 같습니다.
요즘 트랜드는 작은 모델의 최대 성능입니다. 잘 보이지 않지만 공개 모델의 사이즈만 모니터링해도,
KIMI K2의 1T 이후로 그 이상의 무언가는 나오지 않고,
주로 300~600B 사이로 더 큰 모델을 이기기도 합니다.
그리고 그것을 실제 어떻게 활용하는가에 몰두하고 있다는 것입니다.
소버린AI에 대한 회의론은 나아지지 않고 있고, 생각 보다 불신은 깊은 상황입니다.
이는 허깅페이스 상단을 가득 메우고 있는 중국 AI 모델 대비해서 그런 것도 있고,
네이버 클로바가 그간 오랜 삽질을 통해 쌓은 불신도 한 몫을 하며,
이런 상황에 오래 방치하다시피 하다 보니 관심 자체가 거의 없었던 부분도 있습니다.
500B는 현재 트랜드에 비쳐 보면 작은 크기가 아닙니다.
과거 기준이면 고만고만한 사이즈고,(딥시크 R1이 681B)
첨단을 기준으로 하면 500B는 최적의 사이즈입니다.
즉, 이 정도 사이즈면 오픈소스 기준에서는 최고 성능이 나올 수 있는 사이즈라는 뜻입니다.
과연 내심 일정 부분 기대는 하지만 기대 하지 못할 요인이 더 많아
긴가민가로 보고 있는 사람들을 놀라게 할 수 있는 모델이 나올 것인지
지켜 볼 일입니다.
제 생각은 이렇습니다.
사람들은 GPU가 충분했느냐 아니냐를 감안해서 이해해 주려 하지 않습니다.
따라서 ... 없이도 가능성을 보여주어야 합니다.
그럼 어느 정도 성능이어야 하는지 대략 나오게 됩니다.
358B로 현재 허깅페이스 트랜드 1위에 있는 GLM 4.7 버전의
이전 버전...즉, GLM 4.6 정도가 된다면,
굉장히 밝은 미래를 점칠 수 있을 것 같습니다.
물론 못 미친다면...회의론이...
개인적으로는 GLM 4.6 정도는 되지 않을까 기대해 보고 있습니다.
그냥 또하나의 예쁜 쓰레기일 뿐이라는 개인적인 생각이 듭니다.
최근에 공개된 MiniMax M2.1 230B-A10B 이 46점이었는데 이건 230B 모델이니까요.