통계볼 때 표본수의 중요성 - 히어로즈 오브 더 스톰 채널

히어로즈 오브 더 스톰 채널

알림 알림 중 알림 취소

구독자 2332명 알림수신 22명 @가능친구

♚히어로즈 오브 더 스☆톰♚ 한국 최대 커뮤니티 아카라이브 히오스 채널!

공략 통계볼 때 표본수의 중요성

ㅇㅇ (59.23)

추천 6 비추천 4 댓글 34 조회수 1117 작성일 2022-01-23 05:23:06

https://arca.live/b/heroes/43001866

https://arca.live/b/heroes/42998280

하츠로그 데이터에 자유의손길 승률이 더 높은것을 보고 자유의손길도 괜찮은거 아닌가? 라는 생각을 가지게 된 모습이다.

하지만 하츠로그 데이터는 내가 올린 heroesrprofile 데이터에 비해 압도적으로 타당성이 적다.

왜냐하면 표본수 차이 때문이다.

heroesprofile은 최근에 가장 활성화되있는 사이트고, 그래서 2.55-2.53 데이터로 찾았을때 특성하나당 대체로 만판 이상의 표본수를 확보 할 수 있었다.

300명 조사하는것보다 만명 조사하는게 더 신뢰도가 높다는건 당연한 얘기지만, 어느정도 표본수의 게임을 확보해야 믿을만한 숫자일까?

이산확률분포의 표준편차 식에서, p(1-p)는 히오스 통계의 경우 p와 1-p가 45%-55% 사이에서 형성되므로, 거의 1/4로 봐도 무방하다.

그러면 (루트 표본) 곱하기 (1/2) 이 표준편차라고 볼 수 있다.

예를 들어, 10000판 시행의 표준편차는 50이므로, 승률로 환산하면 0.5%가 된다.

그리고 신뢰도 95.4% 구간은 표본평균 - 2표준편차 < 실제승률 < 표본평균 + 2표준편차다.

이를 적용해서, 표본수 10000판 승률 51%의 신뢰도 95.4%구간을 구해보면, 50% - 52% 가 된다.

실제 성능이 50 - 52% 급일 가능성이 95.4%라는 뜻이다.

표본수 800판 승률 50% 면 어떨까? 루트 800은 28정도이므로, 표준편차는 14이며

95% 신뢰구간은 372승 < 실제승수 < 428승 , 67% 신뢰구간은 386승 < 실제승수 < 414 승이며,

이를 승률로 환산하면

46.5% - 53.5% (95%) 48.25% - 51.75% (67%) 이다.

대통령 지지도 조사와 같은 경우 그럭저럭 쓸만한 수치이지만,

5% 차이가 하늘과 땅인 히오스 특성 통계에서 의미있다고 보기 힘들정도로 범위가 넓다.

간단히 말해서, 표본수 800판 통계는 쓸모가 없다.

정리

1. 표본수가 매우 중요하다.

2. (루트 표본수) 곱하기 (1/2) = 표준편차

3. 통계를 볼때는, 나와있는 승률에서 ± 2표준편차 정도가 승률 값이라고 생각하면 된다.

댓글 글쓰기

컨트롤러

2022-01-23 05:25:55 답글

프로비는?

펼쳐보기▼

ㅇㅇ

2022-01-23 05:38:45 답글

ㅇㅇ (222.239)

2022-01-23 05:53:31 삭제 수정 답글

같은 이유로 니가 좋다고 빠는 병신 특성들은 표본 수가 정석특에 비해 적다

펼쳐보기▼

어일

2022-01-23 05:56:36 답글

무슨말인지 모르겠는데

펼쳐보기▼

ㅇㅇ

2022-01-23 06:08:36 답글

특성끼리 픽률 자체가 엄청나게 차이가 남. 예를 들어 특정 상황에서만 좋은 특성은 픽률이 낮고 승률이 높을 수 있는데 그게 그 특성이 좋다는 걸 의미하진 않음.

펼쳐보기▼

어일

2022-01-23 06:14:15 답글

그것도 백번 맞는말이긴 하지만 승률 4%씩 차이나는걸 커버할만큼 중대한 사항은 아님.

펼쳐보기▼

ㅇㅇ

2022-01-23 06:17:35 답글

애초에 저티어들 통계로 다 끌어온 것 자체가 의미를 결론을 왜곡하려는 시도로 보인다. 이렐 자체도 난이도가 높은데 당연히 내려갈수록 어려운 특성을 활용하지 못 하기 때문. 물론 니가 좆밥일수록 그게 너한테 맞을 확률이 높다.

펼쳐보기▼

어일

2022-01-23 06:19:14 답글

마스터 이상에서도 카라보르랑 나루의 선물이 승률 더 높다...

펼쳐보기▼

ㅇㅇ

2022-01-23 06:21:05 답글

니 주장에 비해 승률 차이가 확연히 줄어드는데 반해 픽률 차이는 훨씬 커진다 이게 무슨 뜻일까

펼쳐보기▼

어일

2022-01-23 06:27:49 답글

뭐 당연히 활용하기 어려운 특성은 고티어에서 더 잘 쓰겠지. 근데 중요한건 그 특성의 포텐셜을 90%이상 활용하는 사람들 사이에서도 충분히 다른 특성이 메리트가 있다는거고, 결국 플레 다이아 정도 되는 나름 고수들도 그걸 제대로 못살리니까 나루의 선물을 추천하는건데 그게 뭐가 문제가 되는지 모르겠네. 나는 마스터이상에서의 성능이 진짜 성능이라고 생각하지 않음.

펼쳐보기▼

ㅇㅇ

2022-01-23 06:18:44 답글

그러나 버러지들 사이에서 리리가 아무리 깡패여도 리리를 일반적으로 좋다고 하진 않는다.

펼쳐보기▼

어일

2022-01-23 06:17:56 답글

lolaltycis 같은 사이트에서는 기본적으로 표본수가 어마어마하게 많고 조건도 되게 상세하게 달 수 있어서 되게 입체적으로 그런것까지 고려해서 증명할 수 있는데, 히오스 통계사이트들은 그게 안됨. 그리고 내가 몇년간 통계사이트 뒤적거리면서 메타 변화 관측한 경험으로는 결국은 장기적으로 봤을때 승률 높은 쪽으로 정석이 굳어졌음. 거드라 우르곳같은거

펼쳐보기▼

ㅇㅇ

2022-01-23 06:19:23 답글

그리고 롤에서도 당연히 티어랑 픽률 고려해야하는데 왜 여기선 그거 씹음?

펼쳐보기▼

어일

2022-01-23 06:21:45 답글

내가 뭐 글에서는 가독성 좋게 내가 주장하는 바를 명확히 보여주는 자료만 선별해서 올리는데, 확인하는 자료는 당연히 티어별로 승률 차이나는것도 고려해서 결론을 내는거임. 그리고 롤이든 히오스든 어려운 영웅일때 높은 티어로 갈수록 지표 떨어지는 것도 맞지만, 승률 2% 3% 차이를 극복할정도로 큰 차이가 나는 경우는 잘 없음.

펼쳐보기▼

ㅇㅇ

2022-01-23 06:23:30 답글

상황에 따라 좋은 특성과 일반적으로 좋은 특성은 당연히 구분해야하고 통계적으로 이런 식의 차이가 난다. 만약 투지 자손 찍은 모든 판을 카라보르 나루로 바꿔 찍었으면 승률이 더 올랐을까? 절대 아니란 뜻 ㅇㅇ

펼쳐보기▼

어일

2022-01-23 06:30:24 답글

그건 뭐 해봐야 아는거겠지만 내가 본 경험상으로는 승률 4%차이는 그정도 변수로 뒤집을 수 있는게 아님. 방관 자야 같은거 (모든 판을 방관자야로 바꾸면 승률이 더 올랐을까? 절대 아님 ㅇㅇ) 이렇게 생각하는 사람 ㅈㄴ 많았는데 결국 주류되고 너프까지 먹음

펼쳐보기▼

ㅇㅇ

2022-01-23 06:31:20 답글

혹시 투사가 무슨 역할인지는 알고 있니

펼쳐보기▼

어일

2022-01-23 06:31:54 답글

다이아임 ㅇㅇ

펼쳐보기▼

ㅇㅇ

2022-01-23 06:35:00 답글

api도 공개 아니라서 통계도 개판이라 지금까지 히오스에서 통계충 새끼들 개소리가 들어맞은 적은 없음 ㅇㅇ

펼쳐보기▼

어일

2022-01-23 06:36:28 답글

api가 공개가 아니라서 사설 업로드에 의존한다는건 잘 형성된 표본이 아니라는 뜻이기는 하지만, 나는 뭐 업로드 안하는 플레티넘 유저와 업로드 하는 플레티넘 유저의 플레이스타일이 극명하게 갈려서 유의미한 승률 차이가 나타날 것이라고 생각하지는 않음.

펼쳐보기▼

ㅇㅇ

2022-01-23 06:35:23 답글

그리고 투지 자손이 쓰기 힘들면 이렐을 하지마라

펼쳐보기▼

ㅇㅇ (222.239)

2022-01-23 06:24:07 삭제 수정 답글

그래서 니 티어가?

펼쳐보기▼

어일

2022-01-23 06:28:00 답글

다이아

펼쳐보기▼

어일

2022-01-23 06:34:34 답글

일차원적인건 맞지만 승률 4% 5% 차이는 일차원적으로 결론을 낼만큼 강력함. 6번 찍는것중에 3개만 찍는건 표본수 부족해서 어쩔수 없는거고.

펼쳐보기▼

Moriart

2022-01-23 06:37:07 답글

*수정됨

재밌게 읽었습니다. 한가지 제안은 티어를 구분해서 t-test를 해보는게 더 정확하지 않을까 싶습니다. 물론 이런 경우에도 평균의 차이가 유의미한지만 알 수 있을뿐 정확한 승률 차이를 구하기는 어려울 것 같습니다. 하지만 통계분석을 하기전에 이 데이터 자체에 문제가 있는거같은데, random sampling은 아닌거같습니다. garbage in, garbage out. 의미있는 결론을 도출할수있는 자료도 아니고 다른 시각이 있어도 충분히 반박할 증거도 안된다는 이야기.

펼쳐보기▼

어일

2022-01-23 06:49:58 답글

티어를 구분해서 하는건 이미 해봤는데 제 시각으로는 다이아 이하에서는 거의 비슷한 경향성을 보였습니다. 그리고 random sampling은 아니더라도 저는 업로드 하는 사람과 업로드 안하는 사람의 차이가 승률 1% 이상의 차이를 만들어 낼거라고는 생각하지 않습니다. 그나마 생각해볼만한건 실제보다 플레티넘 이상 상위 유저의 비중이 높아서 전체 구간을 볼때 왜곡이 생긴다 정도? 그 외에는 무작위 표본과 일치하지 않을 어떤 이유도 제 머리속으로 상상이 안됩니다. 이건 증명할 수 없는 부분이긴 하지만 절대로 garbage는 아니라고 생각합니다.

펼쳐보기▼

Moriart

2022-01-23 06:54:08 답글

리플레이 파일을 웹에 업로드까지 하는 유저수가 폭리 대충 몇판돌리고 끄는 전체 유저수에 비해 몇 퍼센트나 될까요. 그 집단부터가 통계적으로 이상치라고 생각합니다.

펼쳐보기▼

어일

2022-01-23 06:59:33 답글

유저수로 따지기보다는 판수로 따지는게 좀 더 타당하다고 생각이 듭니다. 그리고 그런 경향의 유저가 어떤 특징을 지녀서 표본에 영향을 줄 것인가? 로 따지면 평균적인 티어가 상승한다 - 이정도가 상식적으로 생각할 수 있는 끝이고 사실 이건 분석하는 입장에서 큰 문제는 아니죠. 티어별로 구분할 수도 있고, 영웅게임 성능 분석같은 경우 일부러 실력이 높은 표본을 과대표하는 자료를 이용하니까요.  업로드하는 플레티넘 유저가 업로드하지않는 플레티넘 유저에 비해 카이팅을 잘한다던지, 원거리를 잘 다룬다던지, 정화를 잘쓴다던지 하는 실질적 분석에 영향이 갈만한 요소는 99% 일치할거라고 봅니다.

펼쳐보기▼

Moriart

2022-01-23 07:06:42 답글

글쎄요 저희가 통계를 이야기할때는 철저히 이론에 기반해서 이야기를 해야하는데, 적어주신 줄 마다 객관이라기보단 주관에 더 가까운데 공리처럼 깔아놓고 전개하시니깐 대답이 어렵네요.. 유저수라고 제가 적긴 했습니다만 sample size로 통일된다는 면에서 분석측면에서 판수와 동의어 아닌가요? 그리고 이런 케이스(라고 부른다면)가 평균티어를 상승한다는 가정이 어떻게 "상식적"인 생각의 끝인지 저는 이해하지 못하겠습니다.

펼쳐보기▼

Moriart

2022-01-23 07:35:22 답글

어일님께서 가정하시는 모든 사항들이 문제없는 가정이라고 받아들여도, %차이로 특성 우월을 논할수도 없고, 좀더 정확하게 이야기할려면 분산분석을 하는게 맞지 않나요? 그게 단일 티어면 one-way하는거고 티어간 비교해보고싶은거면 two-way하는거고요. 이 모든걸 한다고 쳐도 특성간 성능차이가 정확히 몇 %다 라고 통계적으로 이야기할 수 있는 방법이 없어요 단지 차이가 있다라고만 결론낼수있지

펼쳐보기▼

어일

2022-01-23 07:57:50 답글

저는 통계를 공부하지 않아서 어떤 방법을 통해 엄밀하게 제 의견을 입증할 능력은 안됩니다. 제 주관적인 경험이나 생각에 기대서 말하는데 불쾌한 말을 자꾸 듣다보니 지나치게 강한 어조로 말했던 것 같습니다. 그래도 게임 커뮤니티 수준에서는 표본수와 신뢰구간의 관계, 비교적 승률이 높은 특성의 존재 정도의 정보만으로도 충분히 의미 있다고 생각합니다.

펼쳐보기▼

Moriart

2022-01-23 09:03:59 답글

*수정됨

Confidence interval까지 아시길래 전공하신거같아 댓글달아봤습니다. 싸울려는 의도가 전혀 아니고 처음에 쓴거같이 재밌어서 댓글단거니 오해 안하셨으면  좋겠습니다. 통계는 커녕 숫자도 못세서 3:5 한타나 15레벨대 16레벨 한타가 비일비재한 히오스판에선 형님이 테슬라십니다

펼쳐보기▼

ㅇㅇ (222.239)

2022-01-23 06:39:06 삭제 수정 답글

그럼 히오스크 가서 직접 증명해

펼쳐보기▼

ㅇㅇ (211.57)

2022-01-23 06:39:59 삭제 수정 답글

아래 글쓴 사람인데 이런건 생각하기 나름인거같음 네가 말한 표본 자체가 1년간의 데이터인데 그 사이에 메타가 안바뀐것도 아니고 해서... 그리고 특성은 상황보고 더 잘먹힐거 같은걸 가는게 더 중요하다고 생각함

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 새소식 공략 창작 클립&리플레이 잡담 🦍(우끼끾) 막고라/저격 공지

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 27929056

공지 히오스 종합 정보 모음

Maiev 2021.07.06 22063

공지 [필독] 히어로즈 오브 더 스톰 채널 공지 21.11.07

가능친구 2021.09.02 10615

공지 영웅별 공략 및 정보

Maiev 2021.06.22 43026

숨겨진 공지 펼치기(1개)

819 공략 빠대 레이너 1렙 특성 추천 [4]

ㅇㅇ (210.97) 2022.05.29 517 0

818 공략 도살자충이 쓰는 도살자 공략 [10]

일생럽라 2022.05.29 1676 11

817 공략 리리알못들을 위한 특성 공략.namuwiki [9]

ㅇㅇ (61.42) 2022.05.27 1375 7

816 공략 임페리우스 라인전 공략 [5]

갈취 2022.05.27 1359 7

815 공략 빠대 그메

김부장 2022.05.24 416 0

814 공략 0티어 투사 데하카를 알아보자 [16]

호감고닉 2022.05.23 2492 13

813 공략 초보를 위한 특성 3분 공략 - 그레이메인 [6]

ㅇㅇ 2022.05.23 1251 10

812 공략 길 잃은 바이킹 공략임. [9]

린페 2022.05.17 526 4

811 공략 살아님이 라그계실때, 써보는 개인적 라그 분석 (장단점, 특성, 궁극기) [7]

잉도 2022.05.16 478 -1

810 공략 아바투르 공략입니다 [26]

ㅇㅇ (121.163) 2022.05.13 1690 3

809 공략 응징자 2차 점프타이밍 계산못하는 유인원들을 위한 팁 [4]

ㅇㅇ (220.117) 2022.04.15 1286 11

808 공략 깡스탯 버프 너프 생각보다 무서운 이유. [18]

ㅇㅇ (220.117) 2022.05.10 5832 52

807 공략 초보를 위한 특성 3분 공략 - 레오릭 [4]

ㅇㅇ 2022.05.02 1593 11

806 공략 초보를 위한 특성 3분 공략 - 아나 [12]

ㅇㅇ 2022.04.26 1217 9

805 공략 초보를 위한 특성 3분 공략 - 캘타스 [22]

ㅇㅇ 2022.04.19 1673 9

804 공략 초보를 위한 특성 3분 공략 - 정타족 [9]

ㅇㅇ 2022.04.20 1565 10

803 공략 씹살자 갖고 빠대돌리면서 욕 안쳐먹는 방법 [7]

쎅씨가이 2022.04.22 727 1

802 공략 캘타스 궁 피해량 수학적으로 비교해드림 [26]

OdotD 2022.04.19 4497 41

801 공략 초보를 위한 특성 3분 공략 - 빛나래 [13]

ㅇㅇ 2022.04.14 1254 13

800 공략 말티엘 공략 (빠대/폭리/난투) [16]

ㅇㅇ (211.186) 2022.04.14 2459 10

799 공략 루시우 공략 [21]

ㅇㅇ (221.167) 2022.04.12 4749 34

798 공략 지뢰 백도어 햄마 [5]

ㅇㅇ (121.167) 2022.03.27 415 2

797 공략 초반 캠프의 중요성(맵리) [17]

ㅇㅇ (220.70) 2022.03.21 2333 16

796 공략 히오스 맵별 기본 운영 - 저주받은 골짜기 편 [5]

공벌레 2022.02.25 1126 8

795 공략 리바이벌 시즌6 4일차 특성, 밴픽 정리 [10]

LMB 2022.02.23 2362 11

794 공략 공지 안 본 히챈 뉴비는 이글부터 봐라

ㅇㅇ 2022.02.23 739 3

793 공략 리바이벌 시즌6 3일차 특성, 밴픽 정리 [3]

LMB 2022.02.23 1209 9

792 공략 리바이벌 시즌6 2일차 특성, 밴픽 정리 [7]

LMB 2022.02.22 1530 6

791 공략 리바이벌 시즌6 1일차 특성, 밴픽 정리 [9]

LMB 2022.02.21 1805 12

790 공략 그레이메인 독주트리 [10]

중국산바코드 2022.02.15 1213 3

789 공략 Hide 클래식 레가르 특성트리 [14]

중국산바코드 2022.02.11 2181 5

788 공략 히오스 티어표 정리 (2/2 패치) [19]

LMB 2022.02.07 5369 2

787 공략 말퓨 16렙 이세라의 선물, 조화로운 달빛 비교 [2]

OdotD 2022.02.03 581 5

786 공략 내가 죽으면 팀들이 다같이 죽는이유 [5]

청소업체 2022.02.02 810 1

785 공략 여태까지 첸 해보면서 썼던 특성들 [5]

ㅇㅇ 2022.01.24 1754 9

784 공략 통계볼 때 표본수의 중요성 [34]

ㅇㅇ (59.23) 2022.01.23 1118 2

783 공략 이렐 통계분석 [6]

ㅇㅇ (59.23) 2022.01.22 878 2

782 공략 현재 히오스 티어표 정리 [48]

LMB 2022.01.16 10797 13

781 공략 [정보] 아무것도 안하고 풀발기 시키는법 [5]

고무통 (61.78) 2022.01.15 819 -9

780 공략 히오스7년, 롤2주차가 느낀 롤 장단점 [17]

공벌레 2022.01.07 2399 4

779 공략 봇전충이 쓰는 디바 공략아닌 공략

쥬띵 2021.12.30 438 4

778 공략 데하카 통계분석 [9]

ㅇㅇ (59.23) 2021.12.22 1714 10

777 공략 발리라 빠대 하면서 겪은 거 [12]

ㅇㅇ (218.49) 2021.11.29 998 -1

776 공략 폭리 몇개 팁 적어본다

히오스 2021.11.25 1862 12

775 공략 플딱계의 아이어의 수호자가 알려주는 초No간단 아르타니스 해설 [13]

플딱탈출101 2021.11.21 3238 11

글쓰기

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.