저는 올려놓고 보는중이요
챗봇 예)
"우리 전통옷"
한국판 AI : "한복"
= 한국데이터 기반의 빅데이터 모델로 한글식 맥락파악을 할 줄 알고, 한국스러운 데이터에 기반한 대답을 잘 함. 편향성이나 어쩔 수 없는 부분은 여러방향의 첨언을 하도록 설정하면 될
OO판 AI: " OO복"
= OO나라 기반 데이터로 맥락을 이해할 줄 알며, 제 아무리 한글로 질문해봤자 OO나라 기반의 대답을 한글로 해줄 뿐.
맥락 -> "우리 + 전통옷"이라는 조합의 앞뒤로 더 자주 붙는 단어나 어휘를 미리 수치상 알아두고, 수많은 레이어를 거쳐서 확률적 판단.
입는다, 한복, 베틀 등등 연관어가 한번 이상 학습데이터에서 맥락파악용으로 훑은적이 있다면, 빈도에 따라 가중치가 생깁니다.
세상의 모든 경우의 글자를 모델로 모두 모아둬도 좋겠지만, 작은 몇문장의 파악만 가지고도 모델 거의 전부를 잘 파악하는 알고리즘을 찾아냈다면 거기서부터 AI 구현으로 가는 추가적인 식들을 +++ 합니다