일어나자마자 ㄱㄱㅇ가 아주 맛있는 밥상을 차려뒀길래 바로 통계분석에 들어가봤다.
ㄱㄱㅇ 피셜 참여를 원한 인원 41명, 불참은 390명이다.
그 41명에 대해서 복수응답으로 시간에 대해서 조사를 했다고 하는데
평일오후 19
주말오후 17
평일저녁 16
주말오전 15
평일오전 14라는 결과를 받았다고 한다.
이번에 분석해보고자 하는 내용은 저 시간에 대한 데이터값이 과연 통계적으로 얼마나 다른지에 대한 조사를 해보고자 한다.
chi-square test는 관측한 표본집단에서의 결과와 가설을 세운 기댓값과 비교하여 두 집단 사이에 어떠한 차이가 있는지를 보여주는 통계 기법이다.
자 엑셀한테 일을 시켜서 카이제곱 검정을 시작해보자

우리 대신 귀찮은 검정을 해준 엑셀님의 결론에 의하면 이 사건의 p-value는 0.9226으로 우연히 이런 집단이 뽑혔을 확률이 92%라는 뜻이다. 고로 저 평일오후에 19명이 몰린 결과는 우연에 의한 결과라고 통계적으로 볼 수 있다.
결론: ㄱㄱㅇ의 평일오후 선동은 우연에 의한 결과를 유의미하다고 주장하는 하등 쓸모없는 쓰레기 데이터이다.
상식이 뒤진 해여도 통계학에서 이 말은 오늘도 패배하지 않았다.
Garbage in Garbage Out.
주의사항: 다중응답의 경우에는 원래 o-e를 이용한 카이제곱검정이 불가능하기때문에, 지금 저렇게 분석한 결과는 총 81명이 1개씩 선택해서 고른 결과에 대한 해석이라고 봐야함. 하지만 ㄱㄱㅇ가 그런 지식까지는 알 리 없겠지