학습 조건

WD1.3, 512x512 얼굴 크롭 20장, 5e-6, 2500스텝, 코랩 T4


       

학습 데이터 중 일부


학습 중간 경과









이 작가는 선이 칼같이 정리된 스타일이 아니기도 하고,

엄청난 고화질 데이터는 거의 없기 때문에 학습 자료가 흐린 감이 있음.

근데 원래의 화풍과 이 흐린 느낌이 서로 상충하는 개념이 아니기 때문에 되려 좋은 결과라 볼 수 있음.


CFG Scale은 낮은 쪽(~11)이 원래의 화풍과 유사하게 나오고,

Step은 30 이상으로 높이는 건 아직은 좋지 않아 보임.


다음엔 얼굴 뿐만 아니라 다양한 자세나 배경을 포함한 약 30장 정도를 더 추가해서,

학습 스텝 별 차이도 보려고 일단은 생각하고 있음.


처음에 2500스텝을 선택한 이유는

1. 선명한 화풍이 아님

2. 학습 데이터에 섞인 유추하기 어려운 신체 부위나 화려한 장식

3. 배경이 많이 섞여 들어감


위의 이유로 상정한 2000스텝보다 더 돌렸는데 꽤 괜찮았음.

Loss는 계속 보고 있으니 0.38 ~ 0.4 정도가 평균적으로 찍히길래 결과 박살 날 거 같아서 쫄았는데,

결과물을 보니 안심이 좀 됐음 ㅋㅋ


배경까진 무리더라도 신체나 자세 표현이 꽤 괜찮은 단계까지 올라왔다고 생각되면 모델 공유하겠음.