조금 전 처음 접한 AI기업입니다.
언어 모델 만이 아니라 키오스크를 비롯한 몇몇 특화 서비스까지 이미 하고 있는 모습인데요.
엣지디바이스에서 돌아가려면 속도를 감안하지 않을 경우
정확히는 모르겠습니다만...2B까진 돌아가지 않나 싶은데요.
이 경우 해외 모델은 자연어 처리가... 꽝입니다.
(해외 서비스의 한국어는 최소 7B이상은 되야 볼만 하고 들어 줄 만 합니다)
작은 모델 역시 엄청난 속도로 성능이 좋아지고 있어서,
요즘은 7B는 과거의 32B보다 성능이 좋습니다.
그런데 이게 3B이하로 가면 또 얘기가 달라져서요.
이 회사 대표가 방송 나와서 하는 말에 힌트가 있는데,
MoE를 말합니다.
지금도 이걸 하기만 한다면 꽤 많은 수의 스타트업이 있겠지만,
잘~ 하는 곳은 지금도 얼마 없습니다.
즉, 대표가 하는 말이 진짜라는 가정해 보면,
딥시크가 가성비를 만들어 내기 위해 행한 많은 조치들 중
하나가 이 MoE를 독자적으로 발전시키고 최적화 하는 것이었는데,
페르소나AI 역시 그런 쪽의 연구와 투자가 아니었나 싶습니다.
또한 언어 모델을 파일로 다운로드 받는다고 다 알아서 동작하는 것이 아니어서,
챗봇 형태의 기능 + 서버 기능 등... 여러 기능을 아예 하나의 엔진으로 통합해야
하는데, 오픈소스 모델을 받아 보신 분들은 아시겠지만
올라마와 같은 곳에 모델을 불러와서 쓴다는 말입니다.
대표가 엔진이라고 표현하는 것으로 보아,
올라마 및 여러 도구의 역할을 통합한 성격의 엔진인 것으로 보입니다.
즉, 가볍게 돌릴 수 있는 맞춤형이 가능한 아키텍쳐와
도구를 통합한 엣지 디바이스용 AI엔진 플랫폼? 이 정도로 나름 해석해 봅니다.
예를 들어 1B X 8(전문가 모델 집단) 정도라면
최신 스마트폰에선 잘 돌아가고 속도도 나쁘지 않을 텐데,
이런 점을 해내고 여러 특화 서비스까지 개발해서 내놓으며
적극적인 확장 의지가 보이는 것 같습니다.
돈만 쏟아 부기를 수년 하는 식이 아니라
개발과 수익의 발란스를 맞추려는 대표의 생각이 엿 보이는 것 같습니다.
근데, 대표의 말과 달리 전 몇 년의 격차일 것 같진 않습니다.
남들이 아직 손을 대지 않은 ...개인용
엣지 디바이스용 솔루션을 현 시점에 하고 있다는 것은,
경쟁의 시기에 먼저 대결장에 올라와 있는 모습 같지만,
결국은 실력이 좌우하게 되니,
해당 엔진의 AI성능이 관건이 될 것 같습니다.
이런 곳은 투자를 조금 더 받아 꾸준히 AI 모델의 성능만
올린다면, 나름 여러 특화 서비스에 설치 및 운용을 해주며,
성장이 가능해 보이기도 합니다.
다시 말하지만 과도기적 사업 모델이 생존하려면,
결국 바탕이 되는 모델의 성능이 좌우하므로,
동 체급 대비 모델 성능이 중상급... 이 정도는 유지해야 할 것 같습니다.