https://www.nature.com/articles/s41390-025-04166-y
일단 요약 하자면
LLM이 수학에 약한것 처럼 공식등을 이용해 임상 효과에 대하여 LLM이 진단할때도 온갖 환각효과가 발생해서
임상 오류가 많다는 내용입니다.
물론 현재 모델로서 평가하는거라 앞으로 개선된 모델들이 얼마만큼의 정확도를 보여줄지는 모르겠지만
LLM의 특성상 수학이나 분석 부분에서는 아직은 더 많은 개선이 필요할것으로 보입니다.
https://www.nature.com/articles/s41390-025-04166-y
일단 요약 하자면
LLM이 수학에 약한것 처럼 공식등을 이용해 임상 효과에 대하여 LLM이 진단할때도 온갖 환각효과가 발생해서
임상 오류가 많다는 내용입니다.
물론 현재 모델로서 평가하는거라 앞으로 개선된 모델들이 얼마만큼의 정확도를 보여줄지는 모르겠지만
LLM의 특성상 수학이나 분석 부분에서는 아직은 더 많은 개선이 필요할것으로 보입니다.
조태흠 기자님 안녕하세요 고소는 하지마세요 아참 뉴스타파 많이들 도와주세요 https://www.newstapa.org/donate_info
그런데 의사소통 원활한 성인도 아 배가 아프긴 한데 어떻게 아픈지 표현은 못 하겠고 그런데 통증까지는 아니겠고 불편감이랄까, 기침은 아니고 재채기 이런 식으로 표현하는게 현실인데 소아 같이 본인 증상에 대한 표현이 제약이 있는 환자군은...LLM도 어느정도 한계가 있을 수 밖에 없겠죠
작문적 환각효과가 제어되지 않는다면 위험하긴 할 것 같습니다.
산업계통도 마찬가지라고 보고요.....
앞으로 더더욱 추론 로그를 포함한 프라이빗 AI가 더더욱 증대될 것 같습니다.