이 글은 2조 규모의 정부 AI사업 추진에
민간 사업자가 잘 참여하지 않으려 한다는 뉴스를 보고 생각난 점을 적어 봅니다.
이 사업은 제 기억에 두세달 정도 전에 발표 되었던 것 같은데,
진행이 원활하지 않은 것 같습니다.
이왕 새정부가 들어섰고, 기존 계획이 잘 안된다고 하니
새로 재수립해야 하지 않나...하는 생각에 의견을 적어 봅니다.
___
엔트로픽 및 딥시크의 예를 보면,
거대 모델을 만드는데 필요한 최소한의 자원이 어느 정도인지 유추가 가능합니다.
파운데이션 모델이 있어야 세계 최고 수준과 겨뤄 볼 수 있습니다.
그걸로 리즈닝(AI챗봇 자체가 추론이라 추론모델이란 말은 맞지 않습니다) 모드도 만들고,
양자화도 하고, 각 산업에 쓰일 전문 모델도 만들고...파생시킬 수 있는데요.
그럼 현실적으로 가능한 부분을 진단하고, 대안을 생각해 볼 수 있습니다.
5만대 수준이 가능할까 부터 생각해 봐야 할 것입니다.
1. 5만대가 되지 못함에도 불구하고 쓸만한 오픈소스를 만들어 낸
LG가 있으니, 이 정도 선에서 타협하거나 장기적으로 5만대 이상 까지 추진하는 것을 두고,
재 논의 하여 큰 틀의 계획을 수정하여 결정.
2. 향후에는 1만대로도 H100 5만대 이상의 성능이 나올 수 있습니다.
블랙웰의 다음인 울트라, 그 다음과 다다음이 연 단위로 나올 것이고,
HBM4가 들어가는 루빈 부터는 성능 향상 폭이 클 것이기 때문에,
감가도 감안해야 하지만, 애초에 한꺼번에 10만대씩 사서 한꺼번에 쓸
역량이 되는 기업이 없는 상황이라면, 현실적으로 나누어 구입하는 것도 괜찮아 보입니다.
여기서 전문가가 필요한 것이...그 최소 단위를 알 수 없어섭니다.
효율적인 자원 배분의 이유는 알겠는데, 정작 목표를 달성하는 것이 중요함을 잊지 않고,
얼만큼이 적정한지 알아야 할 테니까요.
3. 이 번에도 약간 기술적 부분이...들어 갑니다. 무슨 말이냐면,
엔트로픽의 경우 구글의 투자를 받으면서 적잖은 클라우드 서버를 임대해서 씁니다.
5만대를 산다고 해서 이걸 한꺼번에 돌리는 것이 아니며,
또 그렇게 하기도 힘듭니다.
효율적으로 GPU성능을 한꺼번에 사용 가능 하거나
여러 사용자가 분할 해서 사용 가능하도록 해주는
솔루션 개발을 하는 스타트업이 있을 정도.
전문가의 의견을 수렴해서 적당한 타협선을 찾아야 하는 것은
제가 짐작하기 어려운 부분이긴 하나,
계획을 재 수립 할 때 보다 더 면밀히 이런 기술적인 부분의 자문이 있어야 할 듯 합니다.
당연히 데이터센터를 몇 곳으로 나누어 GPU를 분산시키는 짓은 하면 안되겠고,
아무래도 이런 이야기가 요즘은 없는 것으로 보아 이리 진행 되진 않았던 것 같습니다.
2조 투자 계획은 전면 보류하고,
새 정부가 인공지능을 제1의 경제 공약으로 내세웠던 만큼,
투자 규모를 더 키우되 보다 더 철저히 계획하여 진행했으면 하는 생각입니다.
일리가 있는 말씀이십니다.
저도 글을 써놓긴 했지만,
사실 판단이 어려운 부분이 많습니다.
누가 제대로 된 전문가인지도 파악이 안될 수도 있는..
그런 영역으로 보입니다.
그런데 본문에 파운데이션 모델을 언급한 것은,
진짜 제대로 하려면...스케일링의 법칙을 일정 부분은 따라가야 하니까 꺼낸 말입니다.
1번에 타협 얘기 한 것도 그렇고요.
타협을 할 것인지, 아니면 더 높게 잡고 갈 것인지...
개별 기업 단위로는 어려운 면도 있고요.
제 개인적 의견은...
각 세부 분야의 전문가는 있겠지만,
통합 해서 볼 만한 사람은 국내에 없지 않나 싶습니다.
그럼 결국 여러 전문가들이 머리를 모아야 하지 않나...이렇게 보고 있습니다.
실험, 데이터 수집 정제 등등 제외하고, 최종 학습에 쓰인 자원만 테크니컬 리포트에 적긴 했었을거라 실제론 더 많이 사용했겠지만, 어찌되었건 그들 공식 발표 기준 2,048개입니다.
딥시크는 GPU가 5만대 가량이었던 것으로 알려져 있고, 지금은 더 늘어났을 것으로 추정 된다고 합니다.
V3가 671B인데, 2,048개로 학습했다는 건...좀 믿기 어렵기도 합니다.
KISTI 슈퍼컴퓨터를 보면 당시에도 충분한 컴퓨팅 자원이었지만, 실제 사용량이 극히 제한되었었습니다.
기업이던 연구기관이던 만들어지는 GPU팜의 접근 난이도를 줄이고 활용할 수 있게하는 장치(정책, SW)가 사전에 충분히 고려되었으면 합니다.
하드웨어 엔지니어가 너무 줄어들고있어서 우리힘만으로 가능하려나.. 걱정도 됩니다.