관심이 꾸준히 있는 분들은 AI관련 논문을 모니터링 하고 계실 텐데요.
지금 마스크로소프트, 오픈AI를 비롯한 빅테크 및
중국의 유명 기업... 우리에겐 낯설지만 치고 올라오는 신흥 강자들의
공개 논문들이 말 그대로 쏟아져 나오고 있고,
나아가 근래 유럽 쪽에서도 늘어나고 있는 추세입니다.
여기서부터는 추정 들어갑니다.
구글이 과거 보다 공개에 보수적인 것을 아시는 분은 아실겁니다.
그럼에도 본래 가져가던 기조를 버린다는 것은 내부에서도 반발이 있기 대문에,
꾸준히 오픈소스와 논문을 내놓습니다.
예를 들어 보면, 최근에 허깅페이스에서 가장 핫한 모델은
구굴의 임베딩젬마 입니다. 이쪽은 트랜드가 자주 바뀌니
또 내일 모레면 바뀌어 있겠지만 ...
불과 0.3B짜리 임베딩인데 성능이 좋아서 인기가 있습니다.
논문으로 가면 최근 중국의 모 기업은
엄청나게 적은 데이터로 몇 배도 아니고 수십 배 더 많은 데이터로 학습한 모델에
맞먹는 성능을 낼 수 있는 이론을 제시했고, 실증 모델도 선보였습니다.
또한 빅테크에선 기존에 보상 체계를 크게 뜯어 고친 방법으로 효율을 크게 개선한 논문도 나왔습니다.
빅테크가 공개하지 않는 것들이 있기는 있겠지만, 아주 적을 것으로 추정해 보는 이유는,
세부적인 훈련 노하우에선 차이가 일정 부분 있을 지언정,
어떤 원리인지는 빅테크에서 신 모델이 나오면... 바로 대응한 모델을 오픈소스로 풀면서
더 이상 숨은 기술은 소수이며, 서로가 서로의 논문을 참고하여
융성의 시대로 접어듬을 느낄 수 있었습니다.
20세기 초에 과학이 엄청나게 발전하던 그 시절에 바다 건너 학자의 논문을
보완 하는 연구를 하며 상호 시너지를 내던 시절처럼...
한국 사람들이 원천 기술이 약했지만, 요즘은 잘 하는 편입니다.
그럼에도 중국에 비해서는 많이 모자란 것도 사실입니다.
그런데 이런 오픈 된 논문과 오픈소스를 참조하여 응용하는 것은
과거부터 탑 클래스 였습니다.
간혹 그렇지 않았던 경우는 경제성이 특정 카테고리에 한정적이거나
관련 인프라가 너무 열악하거나...
그런데 AI 기반 이 한국처럼 잘 되어 있는 곳이 몇 곳 없으며,
쏟아지는 논문과 오픈소스를 잘 활용하고 발전 시키는 것은
중국 보다 못할 것이 없습니다. 더 잘하면 잘했지...
다만 당장은 이렇기 힘든데,
이는 고급 인력의 숫자 자체가 워낙 차이가 많으니 어쩔 수 없습니다.
중국을 빠른 시일 내에 따라 잡기는 힘들겠지만,
또 그 와중에도 해내는 사람들이 있을 것으로 봅니다.
소버린에 대해서는 몇 차례 말씀드렸으니 생략하겠습니다.