코딩/수학 쪽에 강하다고 써있길래요.
아래와 같이 물었습니다.
질문.)
대략 5%의 유병률로 알려진 질병에 대한 진단 키트가 정확도 95%일때, 양성으로 판별되었다는데 실제로 감염되었을 확률은 어느정도 되지?
이 문제는 베이즈 정리(Bayes' theorem)를 사용하여 해결할 수 있습니다. 주어진 정보를 바탕으로 실제 감염되었을 확률을 계산해 보겠습니다.
용어 정의:
- 유병률 (Prevalence): 질병을 가지고 있을 사전 확률. P(감염)=0.05 (5%)
- 민감도 (Sensitivity): 질병이 있는 사람이 검사 결과 양성으로 나올 확률. P(양성∣감염)=0.95 (정확도 95%)
- 특이도 (Specificity): 질병이 없는 사람이 검사 결과 음성으로 나올 확률. P(음성∣비감염)=0.95 (정확도 95%)
여기서 "정확도 95%"는 일반적으로 민감도와 특이도 모두 95%임을 의미한다고 가정합니다.
우리가 구하고자 하는 것: 양성 판정을 받았을 때 실제로 감염되었을 확률, 즉 P(감염∣양성) 입니다.
계산 과정:
-
질병에 걸리지 않았을 확률:
P(비감염)=1−P(감염)=1−0.05=0.95
-
위양성률 (False Positive Rate): 질병이 없는 사람이 양성으로 잘못 판정될 확률.
P(양성∣비감염)=1−P(음성∣비감염)=1−특이도=1−0.95=0.05
-
양성으로 판정될 확률 P(양성) 계산:
양성 판정은 두 가지 경우에 발생합니다:
- 실제로 감염되었고 양성 판정을 받은 경우 (진양성, True Positive): P(양성 이고 감염)=P(양성∣감염)×P(감염)=0.95×0.05=0.0475
- 실제로 감염되지 않았지만 양성 판정을 받은 경우 (위양성, False Positive): P(양성 이고 비감염)=P(양성∣비감염)×P(비감염)=0.05×0.95=0.0475
- 따라서 전체 양성으로 판정될 확률은 이 두 확률의 합입니다:
P(양성)=P(양성 이고 감염)+P(양성 이고 비감염)=0.0475+0.0475=0.095
-
베이즈 정리를 이용한 실제 감염 확률 계산:
P(감염∣양성)=P(양성)P(양성∣감염)×P(감염)
P(감염∣양성)=0.0950.95×0.05
P(감염∣양성)=0.0950.0475
P(감염∣양성)=0.5
결론:
진단 키트에서 양성으로 판별되었을 때, 실제로 해당 질병에 감염되었을 확률은 50% 입니다.
해석:
진단 키트의 정확도가 95%로 매우 높아 보이지만, 질병의 유병률이 5%로 낮기 때문에 양성 판정을 받아도 실제 감염 확률은 생각보다 낮게 나올 수 있습니다. 이는 위양성(False Positive)의 영향 때문입니다. 즉, 건강한 사람(95%의 인구) 중 5%가 위양성 판정을 받는 숫자와, 실제로 병에 걸린 사람(5%의 인구) 중 95%가 정확히 양성 판정을 받는 숫자가 같아지기 때문입니다.
이런 결과는 낮은 유병률을 가진 질병 검사에서 흔히 나타나는 현상이며, 이 때문에 확진을 위해서는 추가적인 검사나 정밀 검사가 필요한 경우가 많습니다.
=
음...맞는 말인가요..ㅋㅋ
P(양성) = 0.95*0.05+(1-0.05)*0.05 = 0.095
0.95*0.05/0.095 = 0.5
(보통 검사법에는 정확도가 아니라 민감도와 특이도를 별도 표시해둡니다.)
_____
단계적으로 민감도, 특이도를 추정하라하고 각각의 시나리오에 대해 계산을 해보라고 하면 될겁니다.
perplexity에게 시켜보니 민감도 100% ~ 80%까지 범위에서 49.8%~50.1%가 나옵니다.
대충 50%로 보면 맞기는 하지요
숫자나 사례를 좀 틀어서 물어봐 보시고, 가능하면 여러 서비스를 통해 교차검증 해보시는 것도 좋습니다.