며칠 전에 질문글이 있었는데 삭제됨

제목은 데이터 수가 늘어남에 따라 하이퍼 감마 세팅할 때 바꾸어야 하는 수치가 있냐는 거였음


근데 댓글에서 step for cycle은 10, 멀티플라이어는 2가 최적화(?)된 수치라는 논문이 있다는 거였음


1. 진짜임? 이런 논문이 있음? (있다는)교차 검증 좀

2. 전에 본 하이퍼 감마 가이드에서는 step for cycle과 데이터 셋 양을 관련지어야 한다고 써있던 거 같은데, 그럼 강제로라도 데이터 셋을 10의 배수로 하고 배치 사이즈를 늘리는 게 맞나?

Ex 원래 데이터가 24개 있는데 4개를 버리더라도 step for cycle 10 batch size 2로 하는 게 더 나은 결과를 보여주는가?


어쩐지 어떤 건 학습이 잘 되고 어떤 건 잘 안 되던데... 이거 때문인가...

지금 집이 아니라 직접 실험은 못 하는데 답변 부탁해