미국 현지에서 세계 최초의 인공지능(AI) 의사 '왓슨'(왓슨 포 온콜로지)에 대한 회의론이 제기되고 있다. 암 치료의 새로운 미래를 열 것이란 기대와 달리 데이터 확보에 어려움을 겪으며 실제 진료 현장에서 제 역할을 못하고 있다는 지적이다. 한국에서도 정부와 병원, 기업들이 앞다퉈 의료 AI 개발에 나서고 있는 가운데, 아무리 똑똑한 AI도 정교한 데이터없이는 '속빈 강정'이 될 수 있다는 우려가 나온다.
22일 의료계와 외신보도 등에 따르면 최근 의학전문매체 STAT는 왓슨을 개발한 IBM의 내부문건을 근거로 "왓슨이 정확하지 않고 위험한 진단을 내린다"고 폭로했다. 이어 월스트리트저널(WSJ)은 "왓슨이 실제 환자에게 미치는 영향이 제한적이었다"고 평하며 이미 12개 기관이 왓슨과 관련한 암 치료 프로젝트를 중단하거나 축소했다고 보도했다.
전문가들은 왓슨이 만족할만한 치료법을 내놓지 못하는 이유로 '데이터 부족'을 꼽았다. 왓슨은 의사가 환자에 대한 정보를 입력하면 관련 문헌을 분석해 최적의 치료법을 찾는다. 이를 위해 의학논문과 교과서 등 1500만 페이지에 달하는 의료정보를 학습했고, 2012년부터 세계 3대 암센터 중 하나로 꼽히는 메모리얼 슬론 캐터링 암센터 의사들의 도움을 받아 진료정보를 습득하고 있다.
하지만 전문가들은 문헌자료와 연결할 실제 환자 데이터가 부족했다고 보고있다. 암 환자를 진료하기 위해선 개인 병력과 치료 결과, 과거 유사 환자 사례 등 다양한 데이터를 학습해야 하는데, 이런 데이터들이 각기 다른 형태로 여러 기관에 분산돼 있어 통합이 어려웠다는 지적이다. 또 특정 병원 의료진에게만 진료를 배우다보니 희귀암이나 재발암 등에 대한 다양한 데이터가 부족하고, 왓슨이 제시하는 치료법도 객관성이 떨어진다는 문제가 제기됐다.
(...)
AI가 사람을 대체하고나면, 더이상 AI를 가르칠(=의학정보를 만들어줄) 사람도 존재하지 않는다는게 가장 큰 문제이겠죠.
평균적인 의료의 질은 올라갈지 몰라도, 장기적으로는 의학 발전에는 도움이 안될수도 있겠습니다.
그리고 사람 존재 자체가 없어지는 것도 아니고...
사람은 계속 창의적인 연구를 하면 됩니다.
로봇이 인간은 도와줘야 하지 판단을 로봇에게 맡기려고 하니 그렇치
결국 책임 안질려는 회피도 가능 한거 아닐가요
데이터가 부족하면 어시스트로 쓰기에도 민망한 수준이 될거예요. 엑셀 추세선 수준 ㄷㄷ
영역에 따라 다르지만 어떨땐 1000만건 이래도 부족할 수 있어서..
IBM은 상당한 수준으로 환자 데이터를 끌어모았고, Watson for Oncology의 파트너사 였던 MSKCC에서도 상당한 수준으로 데이터를 끌어모았던 것으로 기억해요.
(물론 병원에서 환자 데이터를 모으는 것은 많이 까탈스럽고 또 비용도 많이 듭니다. P사 NLP팀원과 이야기를 해봤는데 실제 데이터를 끌어오는게 가장 큰 난관이라고 하더군요. 제 느낌에는 돈 문제가 가장 큰거 같았습니다. ;;)
가장 큰 문제는 왓슨이 제시하는 내용이 기존 모델이라던가 병원 내부에 통합된 시스템에 비하여 좋지 않다는 것이죠.
IBM과 MSKCC에서 공동으로 개발하던 Watson for Oncology도 그렇고 MDACC에서 개발하던 Oncology Expert Advisor도 그렇고 말이죠.
(다른 M 병원 역시 내부적으로 unsupervised 방식의 접근법을 살짝 연구해보다가 WTF 한 것으로 알고있습니다.)
사실 제가 생각했을 때의 문제점은 인공지능 라는 마케팅 용어에 우리가 너무 함몰한 것이 아닌가 생각해봅니다.
그 인공지능 이라는게 사실 별게 아닌데 말이죠. ;;
+ (잘은 모르는 부분이지만) 영상의학과에서 사용중인 시스템에도 이미 많은 부분 기계학습의 결과가 통합되어있다고 하더군요.
다만 그게 진단의 끝이 아니라 그것을 기반으로 사람의 신체 구조에 대한 지식과 환자의 정보와 결합해서 임상적 추론을 하는 과목이라서 말이죠. ;;
마치 포토샵에 인공지능 적인 요소가 지속적으로 들어가서 노가다를 줄여주기는 하지만, 그게 끝은 아닌 것 처럼 말이죠.
내부적으로도 갸우뚱 하는 수준 이니깐요
아직 기계님께 가르쳐드릴만큼 인간의 의학이 충분히 발달되지 않은 것 같아요
한 이미지에 부정확한 추정진단만 수십개라면 그 데이터 넣어봤자 도움이 될까요
어렵습니다~~~