joepenna에서 기본 설정이었던 token padding 기본으로 지원하고(shivam에도 얼마전에 추가됨), 

text encoder 학습 가능

정규화이미지 없이 학습하는 fine tuning도 동시지원

image augmentation 기능

diffuser 기반이라 최적화 잘되어 있고 shivam repo에 있는 최적화 옵션 다 지원함

multi subject 학습도 가능하고 이미지별 캡션도 지원함

xformers 지원함

clip skip 2로 설정해서 학습가능(nai 모델에 권장)

*이 repo에만 있는 기능들은 볼드로 강조 표시 해 놓음


아직 버그 문제가 몇개 있긴한데 사소한거라 신경은 안쓰임

아 그리고 자동으로 sample 이미지가 안나오더라 


현재 기준으로는  아래 repo가 최상위 호환인거 같음

https://github.com/bmaltais/kohya_ss