https://huggingface.co/LGAI-EXAONE/K-EXAONE-236B-A23B
최첨단은 아니나 그 직전까지 갈 것이라고 예상했었습니다.
위 링크를 통해 허깅페이스 엑사원 모델을 보실 수 있습니다.
ㅎㅎ. 이번에 비교적 정확하게 맞춘 것 같습니다.
https://www.clien.net/service/board/park/19117810CLIEN
이 글에서 GLM 4.6 정도.. 로 예상했었는데, 딱 그 정도 나온 것 같습니다.
Qwen 모델과의 비교는 지난 7월과 11월 모델 중간 정도 성능으로 보입니다.
그런데 흥미로운 지점이 발견 되는데요.
전통적인 ...
LLMU , 라이브벤치, 수학 능력 같은 상징적인 벤치마크에선 비슷하거나 소폭 낫거나.. 정도지만
새로 주목 받는 에이전틱 관련해선 오히려 의미 있게 앞서기도 하는 식입니다
개인적으로 왜 그렇게 국내 소버린 AI에 대해 비관적인 분위기가 많은지 잘 이해는 가지 않는 쪽입니다.
제가 볼 때는 비관적일 이유가 그다지 없습니다.
우니나라는 불모지가 아닙니다.
GPU가 부족했었을 뿐,
AI 인재가 미국과 중국 만큼이 아니었을 뿐,
상대적 기반은 탄탄한 편이고,
적응력 면에서 세계 선두를 달립니다.
중국의 딥시크가 얼마 없는 GPU로 만들어져 충격을 주었었지만,
그 얼마 없는 것이 5만대였습니다.
지금 GPU가 슬슬 국내로 들어 오고 있지만,
아직 딥시크 때 만큼도 되지 못할 겁니다.
최근 카이스트를 비롯해 여러 연구 기관 및 기업에서 나온 AI 논문들을 보셨는지 모르겠습니다.
두어 달 전에는 삼성이 낸 논문이 파랑을 일으켰었고, 최근에는 카이스트에서 아주 큰 의미가 있는 영상 관련 논문이 나왔습니다.
제가 볼 때... 좋은 결과가 나올 가능성 충분합니다.
어떤 느낌이냐면....
삼파 정도입니다.
비유 하자면 TSMC에 해당하는 중국을 넘어서는 것은 조금 어렵다고 보지만,
오픈소스 세계 2위는 가져가는...것은 달성이 되고도 남지 않나 싶습니다.
근데 우리나라 사람들이 또 위기 앞에서 강하죠.
이번 젠슨황발 26만장 들어온 것 중에 네이버와 SK가 각 5만, 6만장 인걸로 알고있었는데.
"올해 GPU 지원 대상에서 제외되며 업스테이지, NC AI, LG경영개발원 AI연구원 정예팀이 필요한 GPU 지원을 받게 된다"
위 두 회사는 GPU 지원을 받지 않았다고 하네요.
"SKT는 B200 1024장 규모로 2개 정예팀을 지원하고 네이버클라우드는 H100 1024장으로 1개 정예팀을 지원한다."
는 기사내용과 허깅페이스 모델 내용을 조합해보면
NC가 H100 1016장을, 업스테이지와 LG가 512장의 B200으로 훈련했다는것 같네요.
이정도 규모로 학습했는데, 이번 성과를 보면, 앞으로 미래가 밝을 수 있다. 생각이 됩니다.
벤치점수가 빨리나오면 좋겠네요. 양자화 누가 해주면 돌려보고싶습니다
기존 랭킹 그대로 LG랑 업스테이지 활약이 기대됩니다.