실 체감을 알아 보면 됩니다.
자! 중국의 개발자들이 가장 많이 쓰는 모델이 무엇일까요.
자기네 모델일까요. 그들도 클로드를 씁니다.
오픈소스 모델의 벤치 점수는 이제 더 이상 화제가 잘 되지 않습니다.
제미나이 3.0에 근접한 새 모델이 나와도 이제 신경 쓰는 사람이 없어요.
왜 그런지 잘 생각해 보면,
중국 모델에 알맹이가 없어서 그렇습니다.
점수는 높은데, 알맹이가 부족해서 그렇습니다.
그렇다면 이런 관점을 가져 볼 수 있겠죠.
그 알맹이가 무엇이고, 어떻게 극복이 가능한가로...
제가 그간 여러 번 이야기 한 일관성의 문제가 있습니다.
중국의 쏟아진다는 그 많은 이미지 모델...
나노바나나 1까지는 따라 왔었습니다.
그런데 아직도 그 선에 머물러 있습니다.
그 쏟아진다는 모델 중 각광 받는 것은 최적화를 통해 저 사양에서
꽤 좋은 이미지를 만들어 내는 z-Image 터보 모델 정도입니다.
이게 중요할까요. 아니면 일관성을 달성한 나노바나나 프로가 중요할까요.
즉, 중국 모델의 겉으로 보이는 점수가 아니라
맥점을 쥘 수 있는 기술이 나오는 가를 보면 됩니다.
아직 나오지도 않았는데, 나올 것만 같다... 나올 분위기다...
아직 나오지 않았으면 안 나온 그대로 평가해야 맞지 않을까요.
중국 LLM은 중요 분기점에 해당하는 연구 성과를 낸 적이...없습니다.
화제가 크게 되었던 딥시크R1도 그런 개념은 아닙니다.
지난 수 년간의 경쟁에서 가장 큰 길목을 쥐고 있는 것에 대해
이미 여러 차례 말씀 드린 바 있습니다.
1. 환각
2. 장기 기억
3. 일관성
이런 것들입니다.
자! 예전에 딥시크 R1이 처음 나왔을 때로 돌아가 봅니다.
그 때는 화제가 되었지만 나중에 바늘찾기 벤치로
장기 기억 관련 테스트를 해보니..... 바닥을 박박 기었습니다.
이번에 지피티5.2의 환각 개선은 어떤가요.
소프트웨어 엔지니어링에 있어서 중국 개발자들이
클로드에 집중 되어 있는 이유가 무엇일까요.
자!
제가 아주 쉽지만 놓치고 있는 대목을 하나 말씀드립니다.
요즘 개발자들 사이에 알음알음 나오는 이야기가 무엇이냐면,
API가 상대적으로 비싼 모델이 그 만큼 실수가 적고 더 정확한 결과를 낸다면,
시행착오를 줄이는 것으로 더 비싼 API 비용이 실제로는 더 싸다는 것입니다.
거기에 단지 보이는 비용이 아니라 보이지 않는 사람의 시간도 같이 들어갑니다.
왜 요즘 더 말이 많이 나올까요.
눈에 띄게 이런 부분의 체감이 이전 보다 더 확실하게 다가오는 시점이어서 그렇습니다.
둔감한 사람도 체감할 수 있게 되었다는 것입니다.
막연하게 중국의 오픈소스가 대단한 것 같다. 극복 할 것 같다...
이런 말은 사실 하나마나한 소립니다.
맥점을 쥐는 모습을 보이고 나서 말을 해야지요.
맥점을 쥔 적이 한 번도 없는데... 될 것 같다니요...
지나치게 막연한 느낌 아니겠습니까.
최근에 구글의 장기 기억 관련 또 다른 논문이 나왔습니다.
경쟁력의 핵심을 쥐기 위해 꽤 오래 전부터 준비 해온 이 장기 기억 관련 연구가
일종의 버전업을 해가면서 실질적인 경쟁력의 발판을 바닥부터 쥐고 가고 있다는 것입니다.
오픈AI 또한 과거 소식은 잘 알 수 없지만,
최근에 이 장기 기억 관련 상당한 성과를 보여줍니다.
핵심을 쥐고 가는 것은 보이지 않고,
보이는 오픈소스 점수만 본다면... 실질적인 경쟁력 차이를 알 수 없습니다.
넘어설 리가 없다. 절 대 안 된다... 이런 얘기가 아닙니다.
R1이 지금 보면 대단한 성능은 아니지만, 그 때 딱 한번 격차를 좁혔었고,
다른 여러 이유로 확실히 의미 있는 모습을 보였지만,
그 이후로 격차는 줄어들지 않고 오히려 얼마간 더 벌어졌습니다.
중국의 LLM이 대세가 될 수 있으려면...코어에 해당하는 기술에서
역전까지는 아니어도 역전이 보이는...기술 공개라도 되어야 할 것입니다.
현재까지는... 단 하나도 없습니다.
chatGPT를 뛰어넘어서 대단하다고 하는게 아니잖아요...
그것만 하더라도 중국은 대단한겁니다.
넘어설 것처럼 말씀하시는 분들이 있어서요.
말씀하신 부분으로 보면 대단한 것은 맞습니다.
저도 예전부터 중국의 AI기술 칭찬을 많이 했었습니다.
그런데... 앞으로 중국 LLM이 대세가 될 것처럼 말하는 부분은
아직 검증이 필요해 보이는데, 그리 될 것만 같이 말하는 부분에 대한 반론이었습니다.
한국 회사들이 하는 모델들은 공개조차 안하고 유료 구독이라도 하는게 하나도 없는데요...
검증은 당연히 필요한데 그 이전에 시도라도 하는거 자체가 부러운거죠..
괜히 미국회사나 정치가들이 중국 두려워 하는게 아니죠
제 관점은 약간 다릅니다.
제미나이나 지피티를 넘어설 모델이 나올 것을 걱정하는 것은 아니라고 생각하고 있습니다.
아직 그럴 기미도 없고, 가능성도 매우 낮게 보고 있습니다.
두려워하는 대목은 그런 부분이 아니라,
미국이 가지지 못한 여러 환경 때문으로 생각합니다.
예를 하나 들어 보겠습니다.
구글의 경우 안티그래비티를 내놓았습니다.
지피티는 검색 부분을 퍼플렉시티에 넘기지 않고 자체적으로 다 해결 되도록 가고 있습니다.
주로 자사 서비스 관련이거나 핵심으로 쥐고 가려는 서비스 관련입니다.
그런데, 그 외의 확장에 있어서는 중국의 풍부한 인력이 달려들어 할 수 있는 부분에 비해 상대적으로 열세입니다.
그래서 이미지편집 관련 오픈소스 같은 것들이 중국에서 더 많이 튀어 나옵니다. 상당한 차이로요.
그리고 여러 기능을 융합한 어플리케이션도 중국에서 먼저 나와 시장을 선점할 가능성이 있습니다.
중국 IT쪽은 이런 부분에 아주 아주 민감하고 빠른 실행력이 있습니다.
최근에 호주에서 SNS 규제 나올 때 그 틈새를 노린 서비스를 집중적으로 키우려 했던 것에서 볼 수 있듯이 발빠른 움직임이 다양한 아이디어와 추진력을 보입니다.
실제 돈을 버는 시장성 파악에서 중국이 더 빠르고, 서비스 응용을 더 잘합니다.
피지컬AI 에서도 안심할 수 없습니다.
오히려 중국이 더 먼저 치고 갈 가능성도 있습니다.
왜냐면... 오픈AI나 구글이 확실한 선점 효과를 누릴 정도까지 되지 못한 상태여서 그렇습니다.
미국이 두려워 하는 것은 확장 되는 여러 융합 기술 관련해서
중국의 능력이 발휘되는 것에 있지 않나 싶습니다.
내돈내산없이 중국 전기차, 중국LLM좋다고 하면 그렇구나 하면 되지요
그리고 거의 대부분의 기술에서 싸고 편한 기술이 고급의 비싼기술을 이겨왔기 때문입니다.
비디오테잎때도 그랬고 엠피쓰리도 그렇고 스트리밍으로 넘어갈때도 그랬고 넷플릭스도 그렇죠.
이차전지도 그렇습니다
싸고 편한걸 이길수는 없습니다.
중국이 오픈소스로 그짓을 하는중이죠..
다만, 산업계에서 그런 모델만 필요한건 아니라서요. 자체 구축을 위해선 특정 태스크를 위한 빠르게 처리할 수 있고, 적은 GPU 인퍼런스 환경에서도 잘 작동하는, 작고 효율좋은 무료 모델들이 더많이 필요합니다 (대규모 처리하는데 매번 api로 처리하면 비싸니, 자체구축을 조금씩 늘려가는 추세인 것 같습니다)
이런 분야에선 중국이 미국으로 압도하고 있는 상황입니다. 미국 뿐만 아니라 우리나라 빅테크와 스타트업들은 알게모르게 생각보다 중국 오픈소스들 많이 사용중입니다. OpenAI도 해당 시장이 급격하게 성장하자, GPT OSS 모델로 출시하여 대응하긴 했지만 워낙 중국에서 매주 오픈소스를 쏟아내고 있는 상황이라, 파이를 빼앗기 힘든 상황입니다. (물론 오픈소스라 당연히 돈이 될지는 모르겠습니다;;)
오히려 미국이 그랬어야할것 같은 짓을 중국애들이 앞서서 그러고 있죠. 기업적/비즈니스적으로 보면 비비지 못하는게 맞는데.. 로컬 입장에서는 중국이 하는짓이 반갑죠 뭐.
MoE 가 뉴노말이 되기전만 해도 llama3.1 정도가 거의 local llm 의 표준이었는데.. 이젠 qwen3 가
그 자리를 차지했습니다. 목적에 맞게 variation 도 많고 진화도 빠릅니다.
llama3.1 을 냈던 meta 가 llama4 가 치팅 이슈 등과 함께 폭망했고. openai 의 gpt-oss 가 꽤 기대를 받으며
공개되었는데 막상 까보니 반년전에 나온 qwen3 보다 성능이 좋지 않은것으로 평가됩니다.
local llm 에 한정된 얘기니 서버급에서 돌아가는 오픈소스는 좀 다를수 있겠는데. 그래도 서버급이라고
불리울만한 qwen3 120 모델도 가장 성능적으로 신뢰를 받는거 같습니다.
중국 모델이라면 손사래부터 치는 공기업과 정부쪽이야 성능 떨어져도 gpt-oss 쪽을 선호하긴 하는데..
기술적으로 사실 local 에서 돌릴거면 보안 걱정할 필요는 없죠. 그냥 중국이 잘하는거 같습니다...
비공개 하이엔드급은 물론 아직 실리콘밸리 쪽이 우위에 있지만요.
피지컬AI쪽은 저도 공감합니다.
아무리 미국이 잘 만들어 놓아도
그걸 불법으로 따라해서 따라잡는거죠...
따라잡히는게 시간문제고 가격도 후려칠게 분명하기에
그부분을 경계한다면 나머지 문제들이 해결될겁니다.
문제는 그것마저 초월할 초격차 기술이 개발되게 되면
미국은 규제와 윤리를 따지면서 개발할 시기에 중국은
규제와 위험성은 뒷전으로 물리고 마구잡이식으로 개발해서
사람들이 다치는 상황이 발생되는거죠
그것의 대표적인 예가 코로나 바이러스고요....
스카이넷이 생긴다면 미국은 통제하겠지만
중국은 통제 못해서 로봇에게 지배당할 가능성이 높아 중국에서 발생할겁니다.
생각해보니 공장도 많고 최적의 조건을 갖추고 있네요...