https://v.daum.net/v/20230326083006469
노동자라는 표현이 좀 거슬리실 수 있겠습니다만 지식노동자라고 쓰면 느낌이 안 와서.. 엔드유저와 비교하고자 쓴 어그로 단어이니 널리 양해해주시길. 저는 어떤 당연함을 깨려고 발언하는 겁니다. 찬물을 끼얹는다고 느끼시겠지만, 누군가는 냉정하게 미래를 바라봐야 합니다. 한국의 언론에서는 마치 ChatGPT가 완전한 인공지능이냥 포장되는데, 저는 그게 아니란 걸 환기하려는 겁니다. 최근 네이버, 카카오 등에서 AI 시장을 뺐길 수도 있다는 위기감이 만연하고 있죠. 그런데 정말로 뺐길까요? 전 꼭 그렇게 보지는 않습니다. 물론 조건이 있습니다.
ChatGPT가 어떤 분야에서 혁명인 것은 맞지만, 오래전부터 NLP를 연구하신 분들은 이게 그렇게까지 파급력이 있는지 실감이 잘 나시지 않을 겁니다. 왜냐면 아직 근본적인 문제가 해결이 안 됐거든요. 처음 접하시는 분들은 신기하겠지만, TODS(Task oriented dialogue system)등을 연구한 필자로서는 그렇게 신기한 것도 아닙니다.
결론부터 말하자면, ChatGPT를 일반인은 사용하기 힘들 겁니다. 사용하더라도 덕후들 선에서 그칠 겁니다. IFTTT와 비슷해질 것 같아요. 얀르쿤이 트윗에서 밝혔듯이, 저걸 붙잡고 매번 모든 조건을 말해주는 건 고역입니다. 간단한 명령어는 지금의 인공지능 스피커도 하는 것이고요. 이런 건 인공지능 스피커 설계하시는 분들은 공감하실듯. 모든 엔드유저에 맞는 설정을 에이전트와 유저가 소통하며 맞춰야 하는데, 이걸 하드코딩으로 하는 게 간단한 일이 아닙니다. GPT-4의 인풋 사이즈가 커졌고 거기에 매번 유저의 디폴트 값(혹은 업데이트 된 값)을 입력할 수 있으므로 가능해 보이지만, 그렇게 해도 문제는 꼬리에 꼬리를 물게 됩니다. 인공지능 설계할 때 하드코딩의 블랙홀에 빠져보신 분들은 이해하실 것.
마이크로소프트의도 이런 걸 좀 언급했다고 하더군요.
일반이 인공지능에 열광하는 것은 "개떡같이 말해도 찰떡같이 알아들을 것"을 기대하기 때문입니다. 근데 그럴까요? 우리는 당연하게도 프롬프트 엔지니어링이 뜬다고 예상하고 있습니다. 왜 그럴까요? 현재의 LLM은 적확한 대답을 끌어내려면 맥락을 사용자가 매우 자세하게 입력해야 하기 때문입니다. 대충 쓰면 대충 대답한다는 말입니다. 질의응답 알고리즘을 아시는 분은 단박에 이해하실 겁니다. chatGPT와 유사한 테스크인 Q&A는 번역과 매우 유사한 학습법을 가집니다. 물론 RLHF는 좀 다르긴 하죠. 그러나 본질적으로는 거의 같습니다. 입력과 출력을 쌍짓는 겁니다.
이런 지점 때문에 일반인은 사용하기가 어렵습니다. 이런 거 좀더 훈련해서 보완하면 안 되겠냐고 생각하시겠지만, 서비스 레벨로 훈련을 시켜보신 분들은 이게 쉽지 않다는 것을 느끼셨을 겁니다. 본질적인 차이는 AI가 사용자에 질문을 하는 것에서 나올 겁니다. 이루다에서 이런 걸 좀 시도하는 것 같던데, 아쉽지만 LM을 그대로 사용한다기보다는 하드코딩으로 이벤트를 발생시키는 것일 겁니다. 질문을 해야하는 이유는 사용자는 가능한 서비스의 윤곽을 스스로 그릴 수 없기 때문입니다.
키오스크를 사용하는 사람들이 어려움을 겪는 이유는 롯데리아의 모든 메뉴를 모르기 때문입니다. 주로 어르신들이 그렇죠. 젊은 사람들이야 키오스크 이전에도 먹어봤었기 때문에 대충 쓸 수 있는 것과 대조적입니다. 하지만 여전히 많은 사람들이 사용하기에 불편함을 느낍니다. 왜 그럴까요? 키오스크가 사용자에게 먼저 묻지 않기 때문입니다. 사용자는 자신이 뭘 모르는지도 모릅니다. 반면 점원은 자신들의 메뉴를 완벽히 알고 있죠. 그러므로 그들은 사용자가 원하는 것을 물어볼 수 있습니다. 스무고개 하듯이 취향을 저격합니다. 이 작은 차이 때문에 사용자는 chatGPT를 사용하기 어렵게 됩니다. chatGPT는 절대로 먼저 물어보지 않거든요. 물론 빙챗에서 보듯이 일부 질문을 하는 척 할 수는 있습니다만,
인공지능이 다양한 사용자의 니즈에 유연하게 대처하자고 만든 본래 취지와는 대조적으로 이렇게 사전에 유형별로 구분되어 서비스를 해버리면 결국 구시대의 앱과 다를 게 없어집니다. 구시대의 서비스는 서비스 기획자가 사용자의 피드백을 받아서 니즈를 유형별로 정리하여 서비스를 디자인 했었는데, 현재의 인공지능은 과거의 서비스 기획자를 대체할 수 없습니다. 여전히 다양한 니즈(context)를 기획자가 유형별로 정리하여 훈련을 시키는 것이거든요. 먼저 묻는 게 별거 아닌 것 같지만, 이게 기술적으로 구현하는 게 하늘과 땅 차이입니다.
전 그냥 재를 뿌리려는 게 아닙니다. 넥스트 기술이 나오려면 아직은 시간이 좀더 걸린다는 걸 말씀드리고 싶은 겁니다. 관련 주제의 논문을 검토해봤는데, 아직은 넥스트가 나오지는 않았습니다. 물론 인간의 사회를 시뮬레이션하는 연구들이 조금씩 나오고는 있습니다. 이런 건 주목할 만 하죠. 아무튼 엔드유저 들이 원하는 것은 코파일럿이 아니라 파일럿입니다. 돈많은 사장이 똑똑한 비서를 고용하고 싶은 거죠. 매번 모든 조건을 말해줘야 한다면 그것은 사용되기 어려울 겁니다.
저도 그렇게 낙관적이나 비관적으로 보지 않으려고 하는데, 미디어에서 하는 얘기나 찔끔 해봤다 정도에서 그치지 않으려고 합니다.
알고 당해야죠 ㅎ 여러가지의 관점과 통찰이 필요한 때라고 생각됩니다.
좋은 말씀해주셔서 감사합니다.
저는 개발자가 아니어서 잘 모르지만 일반 사용자 입장에서 말씀드리면 현재의 ChatGPT만 하더라도
너무도 놀랍다는 점입니다.
알파고가 처음 등장해서 프로기사들을 차례로 이기는 것을 보면서 충격을 받았었는데
현재 ChatGPT의 느낌이 그러합니다. 하드웨어가 점점 발전하고 양자 컴퓨터까지 등장하면
어떤 일이 벌어질까 두렵기도 하구요.
파일럿이 되어야 한다고 말씀하셨는데 저는 그게 위험하다는 생각이 듭니다. 결국은 그렇게 가게 된다 하더라도 저는 제 생각을 통찰하고 앞서는 똑똑한 비서가 아닌 그냥 제 조수로서의 역할만 똑똑하게 해주었으면 합니다~^^
무엇보다 현재로서도 인간이 제어할 수 없는 특정 부분에 대한 해결책이 없는 한 위험성도 그만큼 커질 수 있기에
하루라도 빨리 이 분야 전문가들이 함께 고민하고 토론하면서 불안감을 해소 시킬 수 있는 대책 수립도 함께 해나갔으면 합니다.
전문가들이 점점 한국 개발자들이 설 땅이 좁아지고 있어서 걱정이라는 말을 하는데 챠우님 같은 개발자 분들이 좋은 환경에서 개발에 몰두 할 수 있길 희망해봅니다.
엔트리 레벨에서는 상당한 변화를 줄 수 있는 기술이다... 라고 평하고 싶습니다.
노동자의 생산성 격차를 상당히 벌려줄 수 있는? 기술이라고 보이거든요. 제대로 쓰는 사람과 그냥 쓰는 사람, 안 쓰는 사람 사이의 생산성 격차가 엄청나게 발생할 거 같습니다.