한국 도착하면 뉴럴닙스에 나온 SD관련 신기술들 좀 모아서 정리해야겠다


https://github.com/giannisdaras/multires_textual_inversion

솔직히 그렇게 대단한건 아님

기존 TI가 디퓨전 첫단계(t=T)에서의 임베딩을 역산하는거라면

이거는 그렇다면 디퓨전 중간단계에서 임베딩을 역산하면 어떻게 되나요? 라는 생각으로 기존 훈련에 파라미터를 이것저것 추가한거라

WebUI에 적용하면 좀 지저분할거임


파라미터를 조절하면 input 이미지로부터 어떤 특성을 배울 것인지 조절할 수 있다는 것이다

오른쪽 위를 보면 진주 귀걸이 소녀 그림의 동글동글한 부분만 임베딩에 적용되었다

이런식으로 캐릭터 학습과 스타일 학습에 각각 다른 파라미터를 넣음으로써 좀 더 최적화된 임베딩 훈련이 가능할 것으로 파악됨

자세한건 나중에 여기에 추가함~ 아니면 딴사람이 논문읽고 써'줘'