CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·주식한당 ·아이포니앙 ·MaClien ·일본산당 ·방탄소년당 ·자전거당 ·개발한당 ·소시당 ·이륜차당 ·AI당 ·패스오브엑자일당 ·안드로메당 ·나스당 ·걸그룹당 ·사과시계당 ·노젓는당 ·클다방 ·노키앙 ·전기자전거당 ·축구당 ·IoT당 ·윈폰이당 ·창업한당 ·바다건너당 ·물고기당 ·디아블로당 ·젬워한당 ·여행을떠난당 ·골프당 ·가상화폐당 ·키보드당 ·리눅서당 ·3D메이킹 ·X세대당 ·ADHD당 ·AI그림당 ·날아간당 ·육아당 ·배드민턴당 ·야구당 ·농구당 ·블랙베리당 ·곰돌이당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·캠핑간당 ·냐옹이당 ·문명하셨당 ·클래시앙 ·콘솔한당 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·개판이당 ·동숲한당 ·날아올랑 ·e북본당 ·갖고다닌당 ·이브한당 ·패셔니앙 ·도시어부당 ·FM한당 ·맛있겠당 ·포뮬러당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·KARA당 ·꼬들한당 ·덕질한당 ·어학당 ·가죽당 ·레고당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·오른당 ·영화본당 ·MTG한당 ·소리당 ·적는당 ·방송한당 ·PC튜닝한당 ·찰칵찍당 ·그림그린당 ·소풍간당 ·심는당 ·라즈베리파이당 ·품앱이당 ·리듬탄당 ·달린당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·나혼자산당 ·스타한당 ·스팀한당 ·파도탄당 ·퐁당퐁당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·터치패드당 ·트윗당 ·VR당 ·시계찬당 ·WebOs당 ·소셜게임한당 ·위스키당 ·와인마신당 ·WOW당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

모두의공원

의사 vs chatgpt 3

2025-09-09 20:05:25 182.♡.231.161
깨끗이

이세돌은 2016년 2월 22일, JTBC 뉴스룸 손석희 앵커와의 인터뷰에서 “이번만큼은 제가 이길 수 있을 거라 확신한다”**고 자신감을 드러냈다.


그는 4대1로 패배한다. 이후 더 발전된 알파고 제로는 이세돌이 4대 1로 졌던 알파고 버전을 9대 0으로 압승한다.


현재 프로 바둑 기사 중 그 누구도 인공지능 바둑 기사를 이길 수 있는 사람은 없다. 현재 인공지능은 구글의 알파고 제로가 아니다. 구글의 알파고 팀은 알파고를 해체하고 떠났으며 현재의 AI는 모두 그 아류일 뿐이다.


그리고 2025년, 여러 연구에서 chatgpt와 의사의 진단을 비교했다. 그래서 chatgpt가 의사보다 낫냐? 아래 구체적인 사례를 보면 알겠지만 텍스트 기반에서는 일반적인 의사보다는 낫고, 전문의와는 비슷하거나 조금 낮은 경향을 보였다. 특히 영상 진단에서는 점수가 낮았다.


그러니 chatgpt에 증상을 말하고 진단을 묻는 건 당연한 거다. 심지어 접근성과 편이성 부문에서 의사에 비할 바가 아니다.


그리고 전문의가 아닌 일반의보다는 더 나으니 동네 일반의에게 chatgpt 진단을 가져가서 상담하는 게 이상할 이유도 없다.


ps) 이 글은 다른 곳의 글을 저자 허락 하에 옮겨왔습니다.


1. 텍스트 기반 임상 시나리오에서의 성능

a) 미국 의사 면허시험(USMLE) 및 유사 시나리오

GPT‑4 Omni (GPT‑4o)는 750문항에서 90.4% 정답률을 기록했으며, GPT‑4는 81.1%, GPT‑3.5는 60.6%, 그리고 의대생 평균은 59.3%였습니다.PMCPubMed

진단 관련 문항(“Diagnostics”)에서 GPT‑4o는 92.7%, 치료 계획(“Management”) 문항에서는 88.8%의 정확도를 보였습니다.JMIR Medical Education

b) 공식 레지던트 시험 대비 성능

이스라엘 레지던트 5개 핵심 전문분야 시험에서 GPT‑4는 정신과에서 상위 75th percentile, 내과 및 외과는 중간 수준, 소아과 및 산부인과는 낮은 성능을 보였지만 합격 점수 이상을 기록했습니다.NEJM AI

c) 응급의학 및 내과 실제 사례

응급실 내원 100명 사례를 대상으로 비교한 연구에서, GPT‑4는 진단 정확도 평균 1.76점 (2점 만점)으로, GPT‑3.5 (1.51점) 및 응급 레지던트(1.59점)를 모두 뛰어넘었습니다 (P<.01).JMIRPubMed

d) 일본 GM‑ITE 시험 성능

GPT‑4는 레지던트 평균 55.8% 대비 70.1%의 높은 점수로, 특히 내과(+26.1pp), 산부인과(+30.9pp), 난이도 높은 문항에서 뛰어난 성능을 보였습니다. 다만, 의사소통/전문성 관련 항목에서는 인간보다 낮게 나타났습니다.JMIR Medical EducationPMC

e) 안과 사례 평가

GPT‑4는 87개의 환자 사례 평가에서, 초급 의사보다 뛰어난 성능을 보였고, 많은 전문의 수준과 유사한 성능을 보였습니다.Financial Times


2. 영상 기반 및 멀티모달 진단에서의 성능

a) 골격 영상 (방사선과)

GPT‑4 (텍스트만 입력)는 106 골격 사례 중 43% 정확도를 기록, 방사선 레지던트(41%)와 유사, 전문의(53%)보다는 낮았으나 통계적으로 유의미한 차이 없음.

GPT‑4V (이미지 입력 포함)는 8% 정확도에 그쳤습니다.SpringerLinkPubMed

b) 다양한 영상 (CT/MRI/X‑선/초음파)

GPT‑4V는 영상 모달리티 인식은 뛰어나 (100%)지만, 병리 인식 정확도는 전체 35.2%, 특히 초음파는 9.1%, CT/MRI/X‑선은 36~66.7% 수준으로 나타났습니다.PubMed

c) Radiology ‘Diagnosis Please’ 사례

GPT‑4V (온도 조절 T=1)는 190개 사례에서 49% 정확도, 방사선 전문의는 61%, 차이는 통계적으로 유의하지 않을 수 있으나 인간이 더 우수한 경향을 보였습니다. 특히 1차 감별 진단에서는 전문의 48% vs GPT‑4V 15%였고, GPT‑4V는 처리 속도는 매우 빠름 (~19초/case) RSNA Pubs

d) 전반적인 영상 진단 한계

GPT‑4V는 의료 영상 해석 및 진단능력은 아직 부족하며, 보고서 생성도 실패 수준이라는 연구도 있습니다.arXiv+1

더 포괄적인 평가에서도, GPT‑4V는 영상 모달리티와 해부학만 인지할 뿐, 진단과 보고서 작성은 어려움이 있다는 결론도 있습니다.arXiv


깨끗이 님의 게시글 댓글
SIGNATURE
모든 글은 기본적으로 무단 전재 가능합니다.
서명 더 보기 서명 가리기
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [3]
장구속
IP 89.♡.101.12
09-09 2025-09-09 20:38:32
·
얼마나 걸릴까요. 6개월?
Harmonics
IP 112.♡.166.48
09-09 2025-09-09 22:10:27
·
근데 노련한 의사들의 경우 단순 증상만 보고 판단하는게 아니고 촉진이나 환자의 행동 냄새 등등 여러가지를 보고 판단하는 거라 당분간은 보조 진단용밖에는 안될 듯 합니다.
protos
IP 183.♡.90.185
11-17 2025-11-17 14:15:41 / 수정일: 2025-11-17 14:17:48
·
사실 의사입장에서도 환자들이 AI를 잘 활용하여 미리 예습을 해오는 것을 환영합니다.
자기 병에 대해서 의사보다는 그 병에 걸린 환자가 더 열정이 있지 않겠습니까?

의사야 A라는 병에 걸린 환자만 보는게 아니라 일반의라면 수백가지...전문병원/분업화 되었다 해도 수십가지 질병환자를 상대하는 반면, A라는 병에 걸린 환자에게는 A질병에 자신의 모든 주말시간과 여가 에너지를 쏟을만큼 절실한 것이기에. AI를 통해 전세계 논문들과 이론들을 섭렵한 뒤에 해당질환의 의사를 만나서 상담하는 것이 서로에게 시간낭비를 줄일수 있죠. 의사는 다만 한국의료보험이 너가 섭렵한 AI가 제안한 최적의 치료를 제공한다는구나/못한다는구나 정도의 "인생사 실전이야"스러운 의료보험 삭감정보를 제공할 수 있구요.
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.