Stable Diffusion v1하고 Stable Diffusion v2는 하고 구조가 다르다고 하던거 같던데 궁금해서 Stable Diffusion v2 기반 모델중 하나인 Plat Diffusion v1.3.0에서 학습해본 히로마치 나나미.


아직 Stable Diffusion v2 기반 아니메 스타일 모델이 별로 없고 있어도 성능이 미묘해서 이런것도 해볼 수 있구나 정도로 가볍게 2000스텝으로 진행.


학습 정보

[1.0, 2.0, 1.0]

Activation function is swish

Weight initialization is Normal

Layer norm is set to False

Dropout usage is set to False

Activate last layer is set to False

Optimizer name is AdamW

No saved optimizer exists in checkpoint

Choose latent sampling method ramdom

Max staps 2000

Batch size 1 

LR 0.00015:50, 0.0001:100, 0.00005:200, 0.000025:300, 0.00001:400, 0.000005:500, 0.00015:550, 0.0001:600, 0.00005:700, 0.000025:800, 0.00001:900, 0.000005:1000, 0.00015:1050, 0.0001:1100, 0.00005:1200, 0.000025:1300, 0.00001:1400, 0.000005:1500, 0.00015:1550, 0.0001:1600, 0.00005:1700, 0.000025:1800, 0.00001:1900, 0.000005:2000


 

적용


미적용


결론은 Read parameters (prompt, etc...) from txt2img tab when making previews에 문제가 있어서 이 단게에서 엄청 오래 걸리는것 말고는 그럭저럭 되긴 하는듯.