똑?같나 궁금해서 실험해봄


모든 세팅을 동일하게 + 학습이미지 동일
4에포치 리핏 왕창올린 16640 스텝 (4160스텝/에포치)
VS

리핏을 1/8로 내리고 32에포치로 올린 16640 스텝 (520스텝/에포치)

스케쥴러 코사인
학습이미지의 순서를 내 맘대로 못 정하니 뭐가 학습률 높은 구간(앞쪽)에 오는지는 아직 몰?루인데
똑같은 세팅으로 일부러 2연속 해서 학습이미지 순서가 랜덤이 아닐거같다는건 확인을 해 둔 상태(결과가 거의 비슷함)
이미지 순서 섞는줄 알았는데 아닌가봄 + 셔플캡션은 극단적인 변화가 안생김


만일 결과가 다르다면, 골고루 섞여들어갈 32에포치가 뭔가 나은 결과를 내 줄거라 기대했는데

리핏 높은 4에포치 쪽이 결과가 더 마음에 듬
꽤나 의외인데


달랑 한 번 해보고 이게 어떠쿵 하긴 좀 뭐해서 실험을 몇 차례 더해볼 생각인데
혹시나 학습결과가 맘에 안 드는 챈럼은 같은 세팅에서 에포치를 낮추고 리핏을 높여봐봐
장담은 못한다


비교용 짤. 검정배경은 둘다 병신이네



이론적으로는 LR웜업이 없는 콘스탄트 스케줄러라면 뭔 짓거릴 해도 결과가 같아야? 겠지만
이것도 아마 다를거같다
이거 실험 몇 번 더해보고, 다음번엔 학습률 N배 & 총스텝 1/N 체크해볼 생각
과연 쾌속취사가 병맛인지 아닌지