엔트로픽 최상위 모델을
미국 정부가 강제로 운영 중지 시켰습니다.
그말인 즉슨.
가이드 라인은 지금 정해졌고.
이제 현재 fable5 제외 최상위 프론트 모델 수준 정도만 미국 이외의 나라가 쓸수 있는거고
미국 자국민은 그 이상의 수준을 쓸수 있다고 친다면.
뭐. 아예 미국 외에는 접근조차 못하게 정부가 조치한다면
ai 격차는 더 커질것이고. 미국만 승승장구
중국이 따라잡는다 라는건 아직까지 모르겠어요
그냥 중국이 제가 볼땐 증류만 하는 수준이라서
미국이 최상위 모델을 비공개로 유지할때 중국이 따라잡을수 있을진 미지수네요
그게 아니라면 글로벌 무제한 서비스를 제공하는 LLM이 승리하겠네요.
저는 한국인데요.
아마도 캐나다인들도 빡치고 유럽인들도 혀를 차고 있을껄요.
아니요 미토스는 아예 아무도 못쓰게 봉인되어 있습니다.
거의 핵무기 급으로 관리되고 있습니다.
같은 논리로 인공지능이 인간을 능가해 인류를 좌지우지할 수 있을 때 인공지능이 안보를 이유로 미국인은 인공지능을 못쓰게 만들어도 할말이 없으니까요.
기본 플랫폼의 하단 부터 상단까지 전부 미국이 컨트롤 하고 있죠.
그리고 지금 10년안에 벌어질 중국과 패권 싸움의 기본적 판을 깔고 있는 겁니다. 그 안에.. 굴복시킬꺼에요.
당장 미토스로 타국을 해킹하고 있을 수도 있죠.
승리자를 단정짓기에는 너무 이르죠.
저런 식으로 정부에서 사기업에 대한 직접적인 통제가 들어가는건...
장기적으로 승자가 아니라 패자가 되는 지름길 아닌가 싶네요.
미국의 ai 기술력이 중국과 무슨 10년이나 20년이 나는 상황도 아니고,
사실상 초격차 단위에서, 아무리 잘 봐줘도 몇달 정도 차이로 경쟁하는 판인데...
이런 선택은 아무리 봐도 미국 내 ai 빅테크들에게 마이너스 같습니다.
아직 누가 승자다 확실히 모르는 상황이라고 봅니다.
가성비 때문에 세계적으로는 클로드, 지피티보다
중국쪽 오픈소스 ai를 훨씬 더 많이 쓰고 점유율도 늘어가고 있죠.
AI 모델은 어짜피 상향평준화됩니다. 토큰비용이 중요해요...
발전 속도와 격차의 문제인데, 중국이 만든 AI들이 성장 속도는 빠르게 보이지만,
미국의 오픈 소스 모델을 가져다가 조정해서 쓰는 거라 원천 모델을 뛰어넘기는 힘듭니다.
이게 가능하려면 아키텍쳐 설계 능력이 있어야 하는데 아직은 미국을 넘기 어려운 영역입니다.
미국의 오픈 서스 모델을 가져다 조정해서 쓴다?
무슨 모델 보고 그런 말씀을 하시는지요?
증류야 다들 하는 것이고요,
그 말씀하시는 원천 모델의 정의가 뭔진 모르겠습니다만
오픈 소스 모델들은 중국이 다 하고 있습니다
정확히 말해서는 중국이 없으면 오픈소스 커뮤니티는 돌아가지가 않는 수준입니다
젬마4만 해도 큐웬보다 못해요
재귀개선하는 모델이 나오기 시작하면서 ai모델의 개발요건이 좀 달라졌다고 생각해요.
그리고 하네스 엔지니어링이 더 강조되면서 모델들을 적재적소에 분배해서 쓰는 방식이 강조되고 그것때문에 구글도 프로모델보다는 플래시모델을 더 홍보하는 것 같기도하고요.
아무튼 중요한 문제는 여유부릴 상황이 아닌데 정부가 크게 태클을 걸었다는 점입니다.
앤트로픽이 오푸스이상으로 못판다면 결국 제일 손해보는건 미국기업이죠
최근에 중국에서 독자 구조로 개발된 모델들이 늘고는 있습니다만,
그래도 아직은 미국의 오픈 모델 구조를 베이스로 개발 중인 모델이 더 많습니다.
당장 큐엔도 표준 트랜스포머 모델 기반으로 개발 됐자나요?
미국이 새로운 구조 모델을 오픈 하지 않는다면? 중국이 그걸 대체 할 기술이 있을까요?
인프라와 아키텍쳐에선 중국이 미국을 넘어서기 힘들다고 봅니다.
중국은 미국처럼 전세계를 상대로 한 서비스도 없어서 그런 대용량 트래픽 처리 기술이 부족합니다.
젬마 4는 애초에 경량화 해서 노트북에서 온디바이스로도 돌아가게 하려고 만든 모델이고,
큐엔은 동급 최강의 범용 모델이 목표인데 그 두개를 왜 비교하시는지요
중국이 없다고 오픈 소스 커뮤니티가 안돌아간다는 건 과장 아닌가요?
무슨 말씀하시는 건가요.
트랜스포머 기술 안쓰는 LLM이 있습니까?
직설적으로 말하게 되서 죄송합니다만,
일부의 지식을 가지고 굉장히 많은 것을 알고 계신다고 착각하시는 것 같습니다
말씀하시는 내용 중 그 어떤 것도 정확한 부분이 없는데
이것을 진실인양 두루뭉실한 표현으로 덮어 확신에 가득차 말씀하시는 것은 왜일까요?
큐웬이나 여러 모델들을 미국 모델의 구조를 베껴온 것이라고 말씀하시면...뭐 서로가 서로를 베꼈다 정도에는 동의합니다만 그 오래된 모델을 ㅎㅎ....
확장 사고 영역에서는 오히려 미국이 중국을 카피했습니다만..무언갈 여쭤볼수록 말문이 턱턱 막히는 근요
당장 제프리힌튼이 회사 세워 매각할 때 참여했던 네 기업 중 하나가 바이두구요, 앤드류 응도 ai 기틀을 닦은 대부 중 하나입니다
중국은 ai 기술과 산업 초기 부터 참여해온 선두 리더 중 하나입니다
미국과 단 둘이라고 해야 정확하겠네요
이거 완전히 원천 기술과 그 위에 올라가는 상용 기술을 헷갈리리는 것 같은데, EUV를 asml에서 만든다고 삼성과 tsmc가 파운드리를 못하니 파운드리 리더는 네덜란드와 미국 입니까?
과장아니고 현실입니다
오픈 모델 하나라도 돌려보셨나요?
미국측의 최근 오픈 모델이 젬마4 그 전이 gptoss120b입니다
공개 안한지 한참됐어요
정의하시는 새로운 구조의 모델이라는게 도대체 뭔데요?
미국에서 모델 한두세개 공개하는 동안 중국이 쏟아낸 모델이 몇 개인데요?
그리고 젬마는 오픈 모델의 네이밍이고 그 중 일부 경량화 모델이 온디바이스에서 “돌릴 수 있는 수준”인거지, 돌리기 위한 모델이 아닙니다.
돌려보시면 정내미 떨어지실걸요ㅎㅎ
생각하시는 “상용 서비스” 생각해서
유효하게 사용하려면 moe고려해서 27b인데, 이걸 돌릴 기기가 몇 개나 될 것 같습니까? 전체 기기에 몇 퍼나 될 것 같으세요?