Stable Diffusion v1하고 Stable Diffusion v2는 하고 구조가 다르다고 하던거 같던데 궁금해서 Stable Diffusion v2 기반 모델중 하나인 Plat Diffusion v1.3.0에서 학습해본 히로마치 나나미.
아직 Stable Diffusion v2 기반 아니메 스타일 모델이 별로 없고 있어도 성능이 미묘해서 이런것도 해볼 수 있구나 정도로 가볍게 2000스텝으로 진행.
학습 정보
[1.0, 2.0, 1.0]
Activation function is swish
Weight initialization is Normal
Layer norm is set to False
Dropout usage is set to False
Activate last layer is set to False
Optimizer name is AdamW
No saved optimizer exists in checkpoint
Choose latent sampling method ramdom
Max staps 2000
Batch size 1
LR 0.00015:50, 0.0001:100, 0.00005:200, 0.000025:300, 0.00001:400, 0.000005:500, 0.00015:550, 0.0001:600, 0.00005:700, 0.000025:800, 0.00001:900, 0.000005:1000, 0.00015:1050, 0.0001:1100, 0.00005:1200, 0.000025:1300, 0.00001:1400, 0.000005:1500, 0.00015:1550, 0.0001:1600, 0.00005:1700, 0.000025:1800, 0.00001:1900, 0.000005:2000
적용
미적용
결론은 Read parameters (prompt, etc...) from txt2img tab when making previews에 문제가 있어서 이 단게에서 엄청 오래 걸리는것 말고는 그럭저럭 되긴 하는듯.