ChatGPT는 노동자용입니다. : 클리앙

https://v.daum.net/v/20230326083006469

노동자라는 표현이 좀 거슬리실 수 있겠습니다만 지식노동자라고 쓰면 느낌이 안 와서.. 엔드유저와 비교하고자 쓴 어그로 단어이니 널리 양해해주시길. 저는 어떤 당연함을 깨려고 발언하는 겁니다. 찬물을 끼얹는다고 느끼시겠지만, 누군가는 냉정하게 미래를 바라봐야 합니다. 한국의 언론에서는 마치 ChatGPT가 완전한 인공지능이냥 포장되는데, 저는 그게 아니란 걸 환기하려는 겁니다. 최근 네이버, 카카오 등에서 AI 시장을 뺐길 수도 있다는 위기감이 만연하고 있죠. 그런데 정말로 뺐길까요? 전 꼭 그렇게 보지는 않습니다. 물론 조건이 있습니다.

ChatGPT가 어떤 분야에서 혁명인 것은 맞지만, 오래전부터 NLP를 연구하신 분들은 이게 그렇게까지 파급력이 있는지 실감이 잘 나시지 않을 겁니다. 왜냐면 아직 근본적인 문제가 해결이 안 됐거든요. 처음 접하시는 분들은 신기하겠지만, TODS(Task oriented dialogue system)등을 연구한 필자로서는 그렇게 신기한 것도 아닙니다.

결론부터 말하자면, ChatGPT를 일반인은 사용하기 힘들 겁니다. 사용하더라도 덕후들 선에서 그칠 겁니다. IFTTT와 비슷해질 것 같아요. 얀르쿤이 트윗에서 밝혔듯이, 저걸 붙잡고 매번 모든 조건을 말해주는 건 고역입니다. 간단한 명령어는 지금의 인공지능 스피커도 하는 것이고요. 이런 건 인공지능 스피커 설계하시는 분들은 공감하실듯. 모든 엔드유저에 맞는 설정을 에이전트와 유저가 소통하며 맞춰야 하는데, 이걸 하드코딩으로 하는 게 간단한 일이 아닙니다. GPT-4의 인풋 사이즈가 커졌고 거기에 매번 유저의 디폴트 값(혹은 업데이트 된 값)을 입력할 수 있으므로 가능해 보이지만, 그렇게 해도 문제는 꼬리에 꼬리를 물게 됩니다. 인공지능 설계할 때 하드코딩의 블랙홀에 빠져보신 분들은 이해하실 것.

마이크로소프트의도 이런 걸 좀 언급했다고 하더군요.

일반이 인공지능에 열광하는 것은 "개떡같이 말해도 찰떡같이 알아들을 것"을 기대하기 때문입니다. 근데 그럴까요? 우리는 당연하게도 프롬프트 엔지니어링이 뜬다고 예상하고 있습니다. 왜 그럴까요? 현재의 LLM은 적확한 대답을 끌어내려면 맥락을 사용자가 매우 자세하게 입력해야 하기 때문입니다. 대충 쓰면 대충 대답한다는 말입니다. 질의응답 알고리즘을 아시는 분은 단박에 이해하실 겁니다. chatGPT와 유사한 테스크인 Q&A는 번역과 매우 유사한 학습법을 가집니다. 물론 RLHF는 좀 다르긴 하죠. 그러나 본질적으로는 거의 같습니다. 입력과 출력을 쌍짓는 겁니다.

이런 지점 때문에 일반인은 사용하기가 어렵습니다. 이런 거 좀더 훈련해서 보완하면 안 되겠냐고 생각하시겠지만, 서비스 레벨로 훈련을 시켜보신 분들은 이게 쉽지 않다는 것을 느끼셨을 겁니다. 본질적인 차이는 AI가 사용자에 질문을 하는 것에서 나올 겁니다. 이루다에서 이런 걸 좀 시도하는 것 같던데, 아쉽지만 LM을 그대로 사용한다기보다는 하드코딩으로 이벤트를 발생시키는 것일 겁니다. 질문을 해야하는 이유는 사용자는 가능한 서비스의 윤곽을 스스로 그릴 수 없기 때문입니다.

키오스크를 사용하는 사람들이 어려움을 겪는 이유는 롯데리아의 모든 메뉴를 모르기 때문입니다. 주로 어르신들이 그렇죠. 젊은 사람들이야 키오스크 이전에도 먹어봤었기 때문에 대충 쓸 수 있는 것과 대조적입니다. 하지만 여전히 많은 사람들이 사용하기에 불편함을 느낍니다. 왜 그럴까요? 키오스크가 사용자에게 먼저 묻지 않기 때문입니다. 사용자는 자신이 뭘 모르는지도 모릅니다. 반면 점원은 자신들의 메뉴를 완벽히 알고 있죠. 그러므로 그들은 사용자가 원하는 것을 물어볼 수 있습니다. 스무고개 하듯이 취향을 저격합니다. 이 작은 차이 때문에 사용자는 chatGPT를 사용하기 어렵게 됩니다. chatGPT는 절대로 먼저 물어보지 않거든요. 물론 빙챗에서 보듯이 일부 질문을 하는 척 할 수는 있습니다만,

인공지능이 다양한 사용자의 니즈에 유연하게 대처하자고 만든 본래 취지와는 대조적으로 이렇게 사전에 유형별로 구분되어 서비스를 해버리면 결국 구시대의 앱과 다를 게 없어집니다. 구시대의 서비스는 서비스 기획자가 사용자의 피드백을 받아서 니즈를 유형별로 정리하여 서비스를 디자인 했었는데, 현재의 인공지능은 과거의 서비스 기획자를 대체할 수 없습니다. 여전히 다양한 니즈(context)를 기획자가 유형별로 정리하여 훈련을 시키는 것이거든요. 먼저 묻는 게 별거 아닌 것 같지만, 이게 기술적으로 구현하는 게 하늘과 땅 차이입니다.

전 그냥 재를 뿌리려는 게 아닙니다. 넥스트 기술이 나오려면 아직은 시간이 좀더 걸린다는 걸 말씀드리고 싶은 겁니다. 관련 주제의 논문을 검토해봤는데, 아직은 넥스트가 나오지는 않았습니다. 물론 인간의 사회를 시뮬레이션하는 연구들이 조금씩 나오고는 있습니다. 이런 건 주목할 만 하죠. 아무튼 엔드유저 들이 원하는 것은 코파일럿이 아니라 파일럿입니다. 돈많은 사장이 똑똑한 비서를 고용하고 싶은 거죠. 매번 모든 조건을 말해줘야 한다면 그것은 사용되기 어려울 겁니다.

AI당

후기 ChatGPT는 노동자용입니다. 8