그냥 무조건 데이터셋을 다양한 구도로, 적당히 30장 이내로 준비해서, 태깅을 공통된 특징을 잡아서 잘 하는게 핵심인듯.

특히, 1.5에서는 나름 괜찮게 먹혔던 얼빡샷 등으로 데이터셋 늘리기는 최대한 지양해야 함. 그러면 말 그대로 그냥 얼빡샷만 튀어나오는 과적합의 지옥에 빠짐. SDXL이 워낙 Unet 학습능력이 좋다 보니 생기는 역효과 아닌 역효과인듯.


정리하자면 캐릭터 학습, 특히 마이너 캐릭터 학습은 과유불급, 양보다 질임. 30장의 비슷한 구도만 반복되는 데이터셋보다 차라리 10장 정도의, 다양한 구도, 다양한 의상의 데이터셋이 훨씬 더 좋은 학습결과를 가져옴.