그럼에도 하이퍼네트워크 공유는 계속된다. 학습이 잘 된건지는 모르겠지만?
다운로드 https://mega.nz/file/5ONG3LZC#9dZ39z8bcOjo77UkbZ_reorfcvOnfBNdJfq66akguN4
적용
미적용
학습 정보
[1.0, 0.5, 1.0]
Activation function is swish
Weight initialization is Normal
Layer norm is set to False
Dropout usage is set to False
LR 0.0001:1000, 0.00005:2000, 0.000025:3000, 0.00001:5000, 0.000005:10000
MAX steps 10000
Batch size 1