뉴스에서는 비전인코더와 오디오인코더를 중국 알리바바의 Qwen 것을 가져다 쓴 것에 대해 지적하지만,
이것이 어떤 의미인지 잘 모르는 분들이 있을 것 같아 적어 봅니다.
비유를 들게 되면 이해에 도움이 됩니다.
네이버의 작은 모델의 경우 네이티브로 통합 된 옴니모달이라고 했습니다.
이게 무슨 말인가.
바로 텍스트든 이미지든 어떤 것이든 모두 같은 신호로 이해하고 해석한다는 것입니다.
여기서 비전 인코더의 역할이 나옵니다. 즉, 비전 인코더로 이미지를 시각토큰으로 바꾸어
결국에는 텍스트와 통합된 신호가 들어가는 것입니다.
네이버는 이미 이러한 인코더를 가지고 있었다는 것으로 알려져 있습니다.
왜 굳이 Qwen을 썼는지 알 수 없으나 아무래도 성능 차이 때문이 아닐까 싶습니다.
옴니모달로 설계 된 네이버의 AI모델이 본체이고,
비전인코더, 오디오인코더는
눈과 귀 역할이라고 보면 되겠습니다.
오픈소스 진영에서 눈과 귀와 같은 파츠를 쓰는 것은 자연스러운 일입니다.
예를 들어 어떤 소규모 집단이 5년 전부터 어떤 오픈소스를 만들 때
오픈소스인 5개의 중요 파츠와 백여가지의 라이브러리를 사용해서
완성된 앱 하나를 만들었고, 또 다른 집단이 다시 이것을 변형한 버전을 만들기도 합니다.
거인의 어깨 위에 서는(Standing on the shoulders of giants)...
것이라고 보통 말합니다.
대표적인 예가 VSCODE입니다.
인터페이스가 비슷하게 보이는 IDE의 다수가 변형 버전입니다.
네이버가 탈락한 이유는 국가대표AI모델의 취지와 부합하지 않아서입니다.
즉, 소버린AI의 목적에 부합하도록 경연을 통해 가장 나은 모델이 선택 되고,
앞으로의 발전 과정에 여러 지원을 받게 하는 것은,
어떤 곳에서 만든 모델이든 거기서 비롯되는 기술 자립의 시작점이 될 수 있는 도전을 했느냐 하지 않았느냐의
차이로 보면 되지 않나 싶습니다.
예들 들어 최종 선발 된 A라는 모델이 있다면,
이 오픈소스가 위에서 언급한 '거인의 어깨'가 되도록...오리지널이 되라는 의미입니다.
거인의 어깨 위에 서는 이들이 한국인의 눈과 귀를 가진 거인이어야 하는 것을
명시한 대회였다는 것입니다.
사실, 오픈소스의 기본적인 정신에 비추어 보면 어느 정도 부분적인 제한을 두는 것과 같은 양상이긴 합니다.
즉, 이상적이진 않는다는 말입니다.
그런데 이것은 오픈소스를 가장 선두에 둔 기준이었을 때 그렇습니다.
국가대표AI의 대표 주제는,
국가대표여서요. 이 기준이면 한국에서 만든 눈과 귀를 갖는 거인이어야 했습니다.
한국의 대표 it기업이라는 명성을 갖는 곳이 사명감과 큰 뚯이 없는 거지요
그대로 가져다 썼다는건 네이버의 행보와 나라의 근간 모댈을 어떻개 바라보는지 딱 그 시선이 드러났다고 봅니다
네이버는 우리가 생각한것처럼 나라의 대표기업이 되는 것 보다는 돈 안되는 영역에 투자하고 싶지 않은 겁니다
그냥 내수 시스템을 발굴해서 빨대꼽는 그 이상도 이하도 아닙니다
인공지능 시대에 대한민국 대표 소프크웨어 회사에서 이렇다할 실적이나 뉴스가 없는건 그런 이유입니다
전 네이버나 ㅏ카오나 신규 ai 서비스로 무장한 신규 업체에게 크게 한번 휘둘릴것 같습니다
우리나라 특성상 내이버가 그댜로 카피해서 더시 빨대 꼽겠지먼요
아쉽지만 우리나라 모든 산업에 걸쳐 자체 오리지널 기술로 큰곳은 없습니다.... 그냥 페스트 팔로우로 큰 기업들 밖에 없어요 ㅜ
대기업이든.. 유니콘이든 죄다 그렇죠....
It강국이라지만..실상은 원천기술은 거의 없다 시피 합니다.
그나마 ai분야는 업스테이지가 지금 기대주죠 ㄷㄷㄷㄷ 이런기업들이 투자많이 받고 수조 가치 기업되어야 한다고 봐요. 거액에 매각되는것도 좋을텐데.... 해외에는 제값받고 팔수 있겠지먼.... 국내에서는 핵심기술/핵심인재만 빼갈려고 하거나 헐값에 사려 하겠죠 ㅎ
그리고 내수시스템을 발굴해서 빨대꼽는게 아니라 한국인 맞춤형 서비스를 제공했으니 빅테크의 공세로부터 살아남은거죠. 매정부마다 네이버 규제는 심하게, 글로벌빅테크는 규제해도 무시하는 환경에서 말이죠.
https://www.aitimes.com/news/articleView.html?idxno=203743
IT 회사가 기술개발 투자 하지 않고 쇼핑포탈에 집중하겠다는 건지...
‘하정우 믿었는데 들켜서 x됬네 xx’ 같은 태도로밖에 읽히지 않습니다.
‘중국기술 대체할 우리기술도 사실 있다’ 면서요? 뭐 내놓기 부끄러운 녀석인가보죠?
말씀하신 비유와 결은 비슷한데,
오픈소스는 조금 다르긴 합니다.
오픈소스의 정신에는 부합하는 행위이나
국가대표 선발대회의 핵심 주제와 맞지 않는다는 내용입니다.
27년까지 선정한다고 했다가 26년 말로 땡긴것도 있고.
1개만 탈락시킨다고 했는데, 갑자기 탈락사가 2개 되었구요.
네이버 떨어트리면 NC를 남겨두던지, 기업에서 굳이 에너지 쓸 필요없죠.
예능도 아니고 패자부활전한다니 웃기긴 하네요.
국산 언어도 없고 국선 cpu도 없는데
1. 도구 운용 방법.. 즉, 남의 방법이 아닌 우리 방법을 쓰자는 이야기를 하고 있는 가운데, 언어 같은...도구 자체를 쓰면 안 되는 것 아니냐고 하는 비유이십니다. 맞지 않는 얘기라는 뜻입니다.
2. 독자 파운데이션 모델 상세 기준이 발표 되어 있습니다. 찾아보시길 추천합니다.
그리고 각자 강점이 있는 모델인데 일정한 기준에 부합하지 않으면 탈락으로 기업명성에 오명까지 얻는데 굳이 뭣하러해요?
굳이 따지자면 이건 대기업들이 할 사이즈라기보다는 우수 스타트업 발굴용이 맞다고봐요
사실 괜히 더 안하는게 아닐겁니다. 기술력이 안될가능성이 높아요
알고 있습니다.
자체 DATA가 이번 평가에서는 해당 요소가 특히 강조된 것으로 알고 있습니다.
다만, 심사 과정 전반의 전문성과 일관성에는 모르겠네요
실제로 일부 과제의 경우,
대부분의 의원들이 ChatGPT 등 간단한 AI 툴을 몇 차례 사용해보거나 유튜브 기능 시연 영상 수준으로만 기술을 이해한 심사하는 경우가 많아서
뭔가 전문성이 있어야 하는대 전문성이 부족한 심사가 많쵸
그리고 중복지원을 하거나 엉터리 기술도 많구요
모 기관에서는 과거 메타버스 프로젝트를 오픈소스 기반으로 구현하여 경고 조치를 받았음에도 이후 다른 과제로 다시 선정되어 수십억 원의 정부 지원금을 받은 사례가 있었는대
뭐 받고 나니 실질적인 연구 인력보다는 행정직 중심으로 보상과 인센티브가 배분되는 등
문제가 많고
외국에서 수십조로 개발하는 기술을 지원금 몇 억만 주면서 비슷하게 만들라고 하는것도 문제죠