layer normalization 킨 상태에서 rate 얼마 줌?

낮게주면 학습이 안되고, 높게주면 금방 망가져버린다

얼마를 줘야 제대로 학습하는지 모르겠노