업스테이지 솔라AI 성능이 꽤 준수하군요. : 클리앙

스크린샷 2026-01-06 212731.png

왠지 어색한 허깅페이스 모델 페이지입니다.

국산 모델이 상위에 랭크 된 기억이 얼마 없는데,

두 개나 최 상위에 있다니요...ㄷㄷㄷ

이전에도 말씀드렸지만, 초거대 모델...2T 이상도 의미가 있고,

또 100~500B 사이도 의미가 있습니다.

솔라 102B 의 성능입니다.

스크린샷 2026-01-06 202547.png

발표 전 쓴 글에서 GLM 4.6 정도 성능을 기대한다고 했었는데요.

모델 크기를 적시하지는 않았지만 조금 더 큰 모델 기준이었고,

100B인 솔라가 일부 앞서거니 뒷서거니 하지만, GLM 4.5 air를 전반적으로 소폭 앞선다는 것은 의미심장합니다.

오픈AI가 공개한 oss 대비 조금 밀리지만,

oss가 120B임을 감안하면 동급으로 볼 수 있을 것 같습니다.

전 같으면 이게 말이 되느냐...

돈 낭비 세금 낭비 라는 ... 말 이전에 아예 될 수 없다...라는 분위기였던 것을 감안하면...

고무적 성과입니다.

스크린샷 2026-01-06 202602.png

한국 모델은 하나 같이 한국어 실력을 주장하는데,

사실 이 부분은 체감의 영역이라는 생각입니다.

심지어 한국어를 특별히 신경을 더 쓴 것도 아닌데, 한국어 능력이 더 좋은 해외 모델도 있으니,

실제 사용자가 써 보고 한국어는 역시 더 잘하네...차이 나게 잘하네...는 되야 의미가 있지 싶네요.

현재 두 선두 주자인 지피티와 제미나이는...한국어 실력이 꽤 좋죠.

그런데 왜 굳이 강조할까... 이건 역시 공개 모델 중에는 한국어 실력이 안 좋은 케이스가 다수이기 때문일 듯 합니다.

그런데 그 일부 괜찮은 곳들이 오픈 소스의 선두 주자들이니...

결국엔 별 의미 없지 않나 싶은데,

지금은 과정 중에 있으니 차츰 더 좋아질 것으로 긍정적 기대를 해볼 수 있겠습니다.

엑사원도 그렇고, 우리나라 모델들은 수학, 코딩 .. 이런 쪽은 좀 신경 쓰는 느낌을 받습니다.

모두의공원