1, 2, 4, 2, 1

swish, normalization, dropout

임베딩 러닝 레이트 5e-6

하이퍼네트워크 러닝 레이트 1e-5(얘는 얼마 줘야될지 몰라서 기본값으로)

배치사이즈2

이미지 1264장


이렇게 돌리니깐 vram 20~23.5gb 까지 사용함