(바쁜 사람은 다 거르고 맨 밑에 세 줄 요약 보면 됨)



이번 시가지 비나 인세인 난이도에서 2601 택틱 고점 트라이를 해 본 사람이라면 한 번씩은 의문이 들었을 것이다...


"아니 시발 왜 수우이 다음에 아카네 안 잡힘? 내가 운이 없는거야 좆주작인거야"





그렇다. 필자도 몇 번(수백번)의 리트 끝에 그런 좃같은 의구심이 들기 시작했고,

물론 이 코딩뭉치가 딱히 그따위 유치한 주작을 했을 것 같지는 않지만,


코딩뭉치니까 첫 스킬 사용 후 손패의 확률을 완전한 랜덤으로 짜지 못했다면?

그래서 정말 1/3 확률이 아닌거라면? 이라는 생각에 이르게 되었다...





의심된다면 직접 검증해보면 되는 것 아닌가?

나는 고등학교 때 확률과 통계도 배우고 대학교 1학년 때 일반통계학도 배운 자랑스러운 이과인 아닌가???



사실 일반통계학을 수강한 것은 2017년 1학기였다. 무려 7년이나 지났기에 기억이 가물가물함(사실 아예 안 남)

통계나 수학 전공도 아니다. 그냥 평범한 공돌이임




아무튼 잡소리는 집어치우고 한 번 과학적으로다가 손패리트 확률이 1/3이 맞는지 검증해보자.




우선 실험 설계부터



위와 같은 방식으로 파티를 구성하였다.

아카네가 2코라서 스킬 젤 빨리 쓰고 재시작할 수 있어 실험시간 줄이기에 적합하여 채용하였고, 수로코도 마찬가지 이유로 채용.



나머지는 그냥 손에 잡히는대로 했다. 어차피 아카네 첫 스킬 쏘고 손패 잡히는것만 확인한 뒤에 바로 재시작 누를거라 뭘 넣어도 상관 없다.


오토 눌러놓고 아카네 ex 사용 후, 아카네가 있던 자리에 누가 오나 체크하여 표시(편의상 체리노:A, 마키:B, 수로코:C로 표기함)하고

재시작을 눌러 다시 하기를 150회 반복하여 데이터를 얻어내었다.



실험 결과의 raw data는 아래와 같다.




A:57회, B:49회, C:44회 총합 150회의 결과를 얻어내었다.


그래서 이 결과로 1/3이 맞는지 아닌지 어떻게 검증할 수 있을까?



그냥 대충 보고 1/3이면 50 50 50인데 얼추 비슷하니까 맞겠지~라고 할거면 자네는 통계학 C도 받기 글렀다.




눈치가 빠른 블붕이라면 위의 raw data에 내가 계산 끄적여둔 거 보고 알아차렸겠지만,


이럴 때에 가설 검증을 위해 유용하게 사용할 수 있는 것이 바로 '카이제곱 검정'(chi-squared test)라는 것이다.


통계학 수업을 위해 작성한 글이 아니니 자세히 알고 싶다면 위키에 검색해보거나 일반통계학 교재를 펴보도록 하고,


개념과 방법만 대충 설명해보겠다. 귀찮으면 아래로 내려서 계산 결과만 보면 됨



----------------------------------------------------------------------------------------<대충 설명하는 내용>---------------------------------------------------------------------------------------------------


우선, χ²=Σ(관측값-기댓값)²/기댓값을 계산한다. 이 수치가 쉽게 말하면 너의 "억까 수치"라 보면 된다.


간단하게 생각해서, 우리의 경우에 A,B,C 등장횟수의 기댓값이 각각 50회인데,


실험을 통해 얻은 데이터가 50,50,50이었다면 카이제곱 값이 0이 나올 것이고,


관측된 데이터가 50,50,50과 거리가 멀 수록 카이제곱 값이 커지게 될 것이다.


그럴 일은 없지만 극단적으로 150,0,0이라는 데이터를 얻었으면 카이제곱 값은 300이 나오겠지.


대충 이해가 가지?




이 억까수치가 클수록 너의 표본은 니가 기대하는 확률과 동떨어져있다는 의미가 되는 것


역으로 기대하는 확률을 정확히 모르는데 대충 킹리적 갓심이 들 때,(이를 가설이라 한다)


위의 방식으로 계산한 억까수치를 가지고 이 가설이 맞는지 검증할 수 있다는게 카이제곱 검정의 골조이다.

(다시 한 번 말하지만 일반통계학 배운 지 7년이나 지나서 틀린 설명일 수도 있다. 통계 전공하는 블붕이들의 지적 환영)




자 그럼 이 카이제곱 값이 얼마나 커야 우리의 가설이 틀렸다고 할 수 있느냐?


이는 카이제곱 검정표가 있어서, 대충 표 보고 니가 구한 카이제곱 값이랑 비교만 해보면 된다. 아주 쉽다



"아니 블붕아, 표만 보고 비교하면 된다면서 표가 좃같이 쌈뽕하게 생겼구나"

라고 할 수 있는데, 이건 여러 가지 케이스의 정보를 다 담고 있는거라 복잡해 보이는거 뿐이다. 겁먹지 말자.


우선, 표의 왼쪽 라인에서 우리 실험에 알맞는 df값을 찾는다.


df가 뭐냐?  degrees of freedom, '자유도'라는 건데... 사실 나도 잘 모른다.


내가 이해한 바로는 실험에서 나올 수 있는 경우의 수? 같은 느낌이다.


우리의 경우에는 df=2로 놓고 보면 된다.


"아니 블붕아, 너 병신이니? 아카네 다음에 올 수 있는건 3가지인데 df가 2라니 그게 무슨 말이니..."



라고 생각하는게 보통일거다. 그러나 한 번 생각해보자.




간단하게 동전 던지기를 예로 들어보자. 동전을 던지면 앞면/뒷면 2가지의 케이스가 있지만,


잘 생각해보면 동전을 던져서 앞면이 나오지 않으면 결과는 반드시 뒷면이 나오게 마련이다.


즉, 표면상 경우의 수는 2가지지만, 실험 결과를 결정하는 요인은 1가지 뿐인거다.


우리 실험의 경우에도 마찬가지로 A,B,C 3가지의 경우가 있지만 사실 A가 아니고 B도 아니면 반드시 C일 수밖에 없으므로 df가 2라는거다.


의심이 가겠지만 그렇다면 책을 펴보도록 하고 일단 믿고 가자.




df값을 정했으면, 위쪽 라인에서 α값을 결정해주어야 한다.


이게 무엇이냐? 그림을 보자.



위 그림은 우리가 이 좃같은 실험을 했을 때의 카이제곱분포도를 나타낸 것이다.


쉽게 말해 카이제곱 값의 확률분포도?라고 보면 된다.


x축이 카이제곱의 값(억까수치)이고, y축이 확률밀도이다.


정규분포랑은 또 다르게 생긴 모습이다.




다들 정규분포 정도는 알지? 그거에 빗대어서 설명하자면 저 분포도에서 오른쪽 끄트머리로 가면 상위(하위) n%의 운빨에 든다고 할 수 있다.


그 n%컷을 critical value라 부르고 그걸 결정하는게 바로 α값이라 이해하면 되겠다.




위의 표를 보며 다시 이해해보자.


df=2인 경우에서, α값을 0.1로 정했다고 하자. df=2, α=0.1인 칸에 적힌 숫자는 4.61이다.


계산한 카이제곱 값이 4.61보다 크다면, 하위 10% 이내의 운빨이라 할 수 있는거지.




그럼 α값을 얼마로 정해야 하는데?


그건 니 마음이다. 다만 대체적으로 통계적으로 가설 검정을 할 때에는 주로 0.05(5%)나 0.01(1%)컷을 이용하는 것 같다.


해당 수치보다 낮은 확률로 얻을 수 있는 표본은 가설과 일치하지 않겠다고 보는 것이다.




주로 수 백에서 수 천 이상의 시도에서 얻어진 표본이 상위(하위) 5%나 1%에 들어야만 나올법한 수치라는 것은


표본 평균이 가설을 잘 따르고 있지 않다고 보는게 적합하다는 것이고, 일응 타당해 보인다.


따라서 우리도 α=0.01로 두고 검정을 해 볼 것이다.


-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------


실험 결과는 A:57, B:49, C:44였다.


검정하고자 하는 가설은 당연하게도 A:B:C의 비율이 1:1:1(1/3:1/3:1/3)이라는 것이다.


먼저 카이제곱 값을 계산해보면,


χ²=(57-50)²/50+(49-50)²/50+(44-50)²/50

=49/50+1/50+36/50=86/50

=1.72

이다.


df=2, α=0.01일 때의 critical value는 9.21이다.


계산된 카이제곱 값이 critical value보다 작으므로 우리의 표본은 가설에 잘 들어맞는다고 할 수 있겠다.


한 마디로 첫 수우이 이후에 아카네가 잡히지 않는 것 같다면 그건 니 실력이라는 소리다.





이런 글 써보는게 처음이라 가독성이 좋은지 모르겠네.


잡소리도 주저리주저리 많았던 것 같은데 여기까지 전부 읽었다면 읽어줘서 고맙고


오늘 비나 막날인데 아직 주차 못 한 인원이 있다면 나같은 개짓거리 말고 리트나 열심히 하도록 하자.


근데 이미 난 주차 끝났음 ㅋㅋ 수구 ㅋㅋ



*아니 근데 글 다 썼는데 서버 왜 터짐?




<세 줄 요약>

1. 손패리트의 확률이 1/3이 맞는지 의심됨

2. 통계적인 방법으로 확인해보니 1/3이 맞음

3. 니 실력이지~ 어이 김씨 헛소리 말고 리트나 해