2022년 말에 챗지피티 써보니까... 영어로 프롬프트 할 때와 한국어로 할 때의 속도 자체가 다른 것을 아직도 기억하고 있습니다. 그래서 제가 요즘 영어 공부를 하고 있습니다. 영어권 화자는 어떤 식으로 생각하나? 인도유럽어계의 저맥락 언어와 성수격 변화는 대체 어떤 추상적, 철학적 사고를 가능케 하는가? 이런 데에 관심이 있습니다. 아직은 어쩔 수 없습니다. ASI가 나오기 전까지는 군비확충을 할 수밖에요.
근데 중국은 DeepSeek도 그렇고 좀 이 바닥에서 흥미로운 구석이 있군요.
memories_
IP 118.♡.65.97
03-04
2026-03-04 09:05:39
·
@님 AI가 이제 번역도 대부분 잘 한다고 하는데 아직은 최상의 답을 얻기 위해서는 영어로 묻고 영어로 답을 받는게 좋다고 하더군요.
OLIVER
IP 140.♡.29.3
03-04
2026-03-04 09:03:33
·
제가 잘 몰라서 그러는데... 이미 잘 하는 수준에 도달한걸 그대로 쓰지 않고 일부러 못하게 너프 시켜야 하는 특별한 기술적 이유가 있나요?
IP 121.♡.21.118
03-04
2026-03-04 09:04:25
·
@OLIVER님 투자적 이유가 클 거로 생각됩니다. 그 사람들 머릿속은 저도 모르구요.
memories_
IP 118.♡.65.97
03-04
2026-03-04 09:05:04
·
@OLIVER님 OpenAI는 GPT-4o 때문에 아첨이나 이런 부분 때문에 곤욕을 치러서 이런 부분에서 조심하는게 아닐까 하네요.
@OLIVER님 학습용 데이터셋을 추가, 재구성하는 과정에서 필요한 신규 한국어와 일본어 데이터셋을 구하지 못 해서 비율이 낮아졌고 그게 밸런스를 깨뜨렸을 겁니다. 기존의 5.3 pro 조차도 이,저,그를 혼동하고 존대 기준을 못 잡는 등 다국어 완성도는 제미나이와 클로드 대비 떨어지기도 했고요.
OLIVER
IP 172.♡.252.25
03-04
2026-03-04 12:40:11
·
@푸하핫님 (제가 문외한이라..) 기존 학습 데이터를 그대로 쓰거나 그냥 안건드리면 퀄리티도 계속 그 수준에서 유지되는게 아닌가 하는 생각이었는데, 오히려 잘 되던 시점보다 성능이 더 떨어진다는게 이해가 잘 안됐거든요. 비율을 말씀하신걸 보면 그런식으로 돌아가는게 아닌가보네요...
@OLIVER님 네 초거대LLM의 경우 한 번의 학습에 만단위 GPU로 수개월간 학습을 진행하게되고 특히나 최상위 모델들은 Dense 타입이라 시작시에 확정된 데이터셋은 수정,변경이 안 됩니다. 이러한 학습 라인을 여러 개 배치한 후 수주~월단위로 병렬로 학습하여 버전업을 해 나가는 것이라서 데이터셋 구성이 크게 달라지는 것 만으로도 다른 성향이나 결과를 보일 수 있습니다. Instant 는 다른 특성을 갖도록 구조를 구성했을 가능성이 있으며 그에 맞춰 데이터셋 구성 상당부분이 달라지면서 기대 범위를 벗어났을 것이라 생각됩니다.
OLIVER
IP 172.♡.252.27
03-04
2026-03-04 16:15:39
·
@푸하핫님 버전마다 학습용 데이터셋을 어떻게 구성하는지에 따라 성능이나 품질에 영향이 있을 수 있다는 말씀이군요. 이제서야 이해가 됩니다. 자세히 알려주셔서 감사합니다.
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp 지나치게 큰 이미지의 크기는 조정될 수 있습니다.
그래서 제가 요즘 영어 공부를 하고 있습니다. 영어권 화자는 어떤 식으로 생각하나? 인도유럽어계의 저맥락 언어와 성수격 변화는 대체 어떤 추상적, 철학적 사고를 가능케 하는가? 이런 데에 관심이 있습니다. 아직은 어쩔 수 없습니다. ASI가 나오기 전까지는 군비확충을 할 수밖에요.
근데 중국은 DeepSeek도 그렇고 좀 이 바닥에서 흥미로운 구석이 있군요.
기존의 5.3 pro 조차도 이,저,그를 혼동하고 존대 기준을 못 잡는 등 다국어 완성도는 제미나이와 클로드 대비 떨어지기도 했고요.
이러한 학습 라인을 여러 개 배치한 후 수주~월단위로 병렬로 학습하여 버전업을 해 나가는 것이라서 데이터셋 구성이 크게 달라지는 것 만으로도 다른 성향이나 결과를 보일 수 있습니다.
Instant 는 다른 특성을 갖도록 구조를 구성했을 가능성이 있으며 그에 맞춰 데이터셋 구성 상당부분이 달라지면서 기대 범위를 벗어났을 것이라 생각됩니다.