위의 링크는 어제 제 블로그에 올렸던 글입니다. 내용 자체는 루닛이라는 기업이 현재 너무 비싼 상태라는게 주된 내용이지만, 솔직히 루닛 정도면 영상판독 소프트웨어 분야에서는 누구도 반박하기 어려운 탑티어 회사입니다. 실제로 먼저 상장했던 뷰노보다 훨씬 내실있게 성장하고 있고, 블로그에도 언급했지만 로슈와의 계약이 성사될 확률이 상당히 높습니다.
문제는 이정도로 실체가 뚜렷하고 실제로 성공가능성이 있는 회사마저도 DCF법으로 최고로 낙관적인 가정을 했을때조차 현재 주가는 지나치게 고평가상태라는거죠. 그렇다면 성공가능성도 애매하고, 실체(실제로 뭔가를 하고 있는)도 뚜렷하지 않으면서 인공지능 테마에 올라타고 있는 회사들은 어디까지 고평가되었을지 감히 가늠하기도 어려울겁니다.
사실, 제가 만족스럽게 제품을 사용하고 있기 때문에 개인적으로 관심 가지고 있는 회사는 다른 회사입니다. 여기도 이번 인공지능 테마에 탑승해 조만간 코스닥 상장을 할거라고 하더군요. 하지만, 문제는 지금 당장 출시한 제품들이 쓸만하냐 아니냐가 아닙니다. 지금까지 인공지능 진단소프트웨어는 모두 딥러닝 AI기반으로 개발되있어서 라벨링이 된 데이터를 얼마나 확보해놨느냐가 진입장벽이 되주고 있지만, 최근 대세로 떠오른 트랜스포머 AI기반에서는 기존에 확보해놓은 데이터의 양이 진입장벽이 되기 어렵죠.
진입장벽의 문턱이 낮아지면 결국 자본력 싸움입니다. 미국 빅테크기업들이 해당 시장에 조금만 관심을 가져도 단번에 나가리되기 십상인 판이 되버릴 수 있다는겁니다.
하기사, 요즘같은 분위기면 루닛만 해도 예정되어있는 호재들만 계속 확정발표가 되어도 주가는 여기서 또 몇단계 점프업 하긴 하겠죠. 그걸 생각하면 DCF고 나발이고 그냥 무지성으로 사놓는게 어떨까 하는 생각도 들고 그러긴 합니다만,,, 그냥 지켜보기만 하는게 스트레스 안받고 마음 편해지는 길이라고 믿어보렵니다.
아직은 다들 걸음마단계에요. 판독용 인공지능이 정말로 “신뢰도”라는 개념을 탑재하려면 20년은 더 기다려야 할거에요. 그렇기 때문에 지금 정도로 확보된 데이터를 가지고 해자라고 주장하기가 간단한 문제가 아닙니다. 그만큼 지금 각 회사들에서 출시해서 사용되는 소프트웨들은 아직 발전해야 할 여지가 무궁무진한 단계입니다. 그래서 이들의 미래가 더 유동적인거구요.
https://blogs.nvidia.co.kr/2022/04/01/what-is-a-transformer-model/
저야 인공지능 전문가는 아니라서 엔비디아 홈페이지에 나와있는 내용을 참고해서 글을 썼습니다. 말씀하신게 맞다면, 엔비디아가 잘못된 주장을 한걸수도 있겠군요.
어쨋던, 영상판독 소프트웨어 회사들이 지금까지 굉장히 힘들어하던 게 라벨링과 데이터 양 두 분야였다는 건 분명합니다(연수강좌 때 여러차례 강조되던 내용이라서 또렷이 기억하네요). 그리고, 그런 문제를 한번에 해결해줄 수 있는 대안이 나오기 시작했다는 점에서 중요한 계기가 될 수 있다고 봅니다.
트랜스포머가 general task에 대한 unsupervised learning의 가능성을 제시한건 맞습니다. nvidia 글은 pretrain 과정 한정으로 다루는 듯 하네요. pretrain만으로는 안되고 downstream task는 거의 대부분의 분야가 여전히 labeled data 써줘야해서..
아마 말씀하신대로 아예 label이 필요없는 시대가 되면 그건 general ai가 등장하는 시점일거라 봅니다
저도 현업이라 관심있게 보긴 했는데 분야가 그쪽이 아니라 조심스럽긴 한데요...
그냥 투자 관점 말고 일하는 입장에서,
판독ai 관련 업체들 문제는 수익창출인거 같아요.
좋긴 한데 돈을 어디서 벌거니? 하는 문제요.
병원입장에서 의사가 편해지는것보다 수가를 받을 수 있느냐가 문제가 되니까요.
그점에서 외국, 특히 장비업체들쪽 뚫었다는건 다른 기업들과 명백한 차별성이 맞는듯합니다.
일단 소프트웨어어 퍼포먼스는 업체 factor도 중요하지만 윗분 말대로 데이터가 진짜 중요하다고 봅니다.
사실 대학병원 급 데이터도 디테일하게 보면 퀄리티 차이가 꽤 많이 난다고 생각해서요...
근데 이렇게 고품질 데이터가 AI의 퀄리티를 결정한다면, 쏠림은 더 심해질거 같아서 걱정입니다.
선점 업체꺼를 많이 쓰면 그쪽으로 데이터가 몰리고
결국 엄청난 "해자"를 가지게 될테니까요...