https://www.clien.net/service/board/park/18701362CLIEN 원글에 이이서 내려온 글입니다.
대조군에 대한 자료가 부족하다고 하여 다른 데이터를 가져와봅니다.
대조군은 출구조사 결과와 실제 투표 결과가 거의 유사하게 나온 지역을 우선으로 분석하였습니다.
강릉지역의 출구조사 득표율은 김종남:권성동 44.7:53.2 로 분석되었습니다.
마찬가지로 본투표 대비 사전투표의 득표율 차를 계산한 후 평균으로부터 얼마나 분산되어있는지를 봅니다.
각 투표소마다 전체적으로 평균 -5.99% 만큼 김종남 후보가 표를 얻지 못했기에 낙선하였습니다.
다만 그 득표율 차의 편차는 아래 그래프처럼 분산되어 분포합니다.
이 경우에 표준편차의 평균은 약 0.011로 나타납니다.
반대로 충북 증평진천음성 지역에서는 민주당 임호선 후보가 당선되었습니다.
이곳의 출구조사 결과 임호선:경대수 의 차이가 53.3대 46.7이었습니다.
마찬가지로 본투표 대비 사전투표의 득표율 차를 계산한 후 평균으로부터 얼마나 분산되어있는지를 봅니다.
각 투표소마다 전체적으로 사전투표 대비 평균 -5.82% 만큼 임호선 후보가 표를 얻지 못했지만 당선되었습니다.
다만 그 득표율 차의 편차는 아래 그래프처럼 분산되어 분포합니다.
표준편차의 평균은 약 0.01 입니다.
본투표 대비 사전투표에서 득표율의 차이가 발생하더라도 위에서처럼 하나의 값으로 수렴하는게 아니라
평균을 기준으로 분포하는게 정상적입니다.
그럼 도봉갑의 결과를 보죠.
안귀령이 모든 사전투표소에서 승리를 했지만 본투표에서는 고르게 6.34%만큼 잃으면서 낙선하였습니다.
여기서 문제가 그럼 얼마나 고르게 표를 잃었느냐는 겁니다.
아래 그래프를 보면 -6.34%에서 표준편차 0.0058 사이를 왔다갔다 합니다. (다시말해 분포도가 매우 작습니다)
또 봅니다.
여기는 이광재 안철수가 붙은 분당갑 입니다.
역시 여기도 한곳을 제외하고 이광재가 모든 사전투표소에서 승리하였으나
본투표에서 득표율차가 평균 -8.96%나 발생하면서 낙선하였습니다.
본투표-사전투표의 득표율차의 분포는 0.006로 나옵니다. 다시말해 여기도 득표율 차이의 분포가 매우 적다는 의미입니다.
출구조사 결과가 비교적 정확하게 나타난 지역과 정반대의 결과가 나타난곳의 차이가 이렇게 극명하게 드러납니다.
본투표 대비 사전투표의 득표율 차이가 이렇게 작은 값으로 분포한다는 말은
다시말해 어떤 이유로 인해 사전투표 만큼의 계수 조정이 본투표에서 일어났다는 것을 의미합니다.
본투표를 하는 사람들 개개인이 그걸 알고 투표를 할 수 있을까요?
좀더 화려하고 이해하기 쉬운 인포그래픽을 만들고 싶지만 일단 여기까지입니다.
혹시 출구조사 결과와 투표 결과가 거의 근접하는데 사전투표와 본투표의 득표율 차이의 표준편차가 0.006 대로 발생하는
데이터가 있으면 알려주시면 좋겠습니다.
"A가 의심스럽다, 이것과 다른 패턴의 B가 있기 떄문에"
-> 이게 아니라
"A가 의심스럽다. 다른 충분한 샘플은 전부 B의 패턴인데 A만 이탈하기 때문에"
-> 이렇게 하시란 말씀입니다.
데이터가 다른 패턴을 발견하고 가설을 세울 수는 있지만, 증명은 이래야지요.
다시말해
출구조사와 거의 유사하게 본투표 결과가 나온 지역에서도 본투표/사전투표 간의 득표율 차이가 일정하게 분포하더라 하는 자료를 가져와서 제시해주세요.
그게 올바른 논쟁 아닌가요?
수 많은 샘플 중에 일부 A와 B를 가져와서, A와 B가 다르니 A가 이상하다 주장하는 자체가 설득력이 떨이지기 때문에 받아들여지지 않습니다.
의심이 가는 것까지는 이해해 드릴 수 있어요.
그런데, 그걸로 타인을 설득하려면 본인이 찾은게 우연이 아니라는 통계적 근거를 뒷받침 해야 하는 것이지, 타인이 반례를 찾아와야 되는게 아닙니다.
통계가 어떻게 사용해야 인정 받는지를 모르시는 것 같습니다. 누군가 반박을 하는 수고를 안 한다고 본인의 주장이 진실이 되는게 아니에요.
통계적으로 유의한 분석을 하지 않고 취사선택 된 데이터를 기반으로 주장하는 것을 음모론이라고 합니다.
반복해서 하는 이야기인데, 님이 틀렸다고 확신해서 이야기 하는게 아니라, 남을 설득시킬 근거가 부족하다는 이야기입니다.
그 사이 만큼 유세나 각 후보들의 투표호소등이 다 달라서 그만큼 결과가 달랐을수도 있다고 봅니다..
이런게 진짜 문제였다면 선관위에서 사전투표를 없앴겠죠.. 황교안이나 민경욱이 계속 사전투표 없애라고 그러는데...
대선이든 총선이든 매번 보면 이런 선거 조작 의심이 나오는데 진짜 문제였으면 누가 양심선언 하지 않았을까요? 본인이 스타될 기회인데
이처럼 실제 결과와 출구조사가 다른 원인으로는 31.28%로 역대 최고치를 찍은 사전투표율이 꼽힙니다.
공직선거법상 사전투표일에는 출구조사를 진행할 수 없어 사전투표 참여 유권자 1,384만 9,043명의 표심이 반영되지 않으므로 방송사의 데이터 보정 정확도가 떨어질 수밖에 없다는 것입니다.
특히 이번 총선은 '60세 이상' 유권자 수가 2030 청년층보다 많아 변수로 부상했는데, 실제로 60세 이상의 사전투표 차지 비중이 37.7%로 4년 전 총선(30.6%)과 비교해 크게 늘었습니다.
https://n.news.naver.com/mnews/article/057/0001811537
출구조사가 틀린건 과거 대비 사전선거의 연령 비중이 달라져서 보정 값이 틀렸다고 봅니다.
지금 지적하는건 출구조사와 사전투표의 차이를 말하는게 아니고요.
왜 출구조사가 틀리는 곳일수록 사전투표와 반대되는 본투표 결과가 상호 균등해지도록 분포되었느냐를 지적하는 겁니다.
사전투표와 본투표의 차이는 있을 수 있으나 그 차이가 일정한 값에 수렴하도록 조정되었다가 핵심이지
사전투표에서 누가 얼마나 더 찍었냐 아니냐를 문제삼는게 아니라고요.
데이터가 말하는건 사전-본투표의 투표 성향이 아니라 얼마만큼 차이가 났냐를 보여줍니다.
차이가 나더라도 어느정도 사전투표의 결과를 반영해서 본투표에도 나타나야하는데
그 차이가 사전투표의 반대로 나왔다면 왜 그런가를 봐야합니다.
그냥 투표 성향이 달랐다? 어떻게 밑도끝도 없게 그렇게 주장하죠? 왜 그런 현상이 유독 특정 지역에만 몰리나요?
왜 그럼 그 차이값은 왜 한쪽에 유리하게 나오나요? 이게 음모론인가요? 따져묻지 않을 수 없네요.
근본적으로 사전투표랑 본투표 할때의 집단이 동일한 평균과 동일한 표준분포를 이룬다는 가정 하인데, 그게 가능한 이야기인가요?
몇번을 설명한 내용인데 본문을 좀더 이해하시고 글을 다시면 좋겠네요.
사전투표와 본투표자가 동일한 평균과 분포를 보인다가 아니고요
사전투표와 정바대로 나오는 본투표가 발생할때 왜 사전투표에서 득표한 만큼만 반대로 나왔냐 이걸 말하는겁니다. 그 편차가 놀라울정도로 적게 말입니다.
그렇지 않은 투표 결과에서는 편차가 분산되어 있습니다.
음모론 아니고 데이터에서 이상다하는 겁니다.
정당이나 출구조사 오보한 지상파 3곳에 제보하시면 어떨까요?
동전 열번던져서 9번이 앞면나오면 조작일까요??