지금 다들 쓰는 로컬모델이랑 신경망 규모는 같은데 , 기본모델은 애니 그림체 훈련 자체가 거의 안됨



반실사는 또 잘뽑아줌. 

이건 작년에 스테이블 디퓨전 공개되자마자 기본모델로 바로 뽑은것. 로라는 커녕 드림부스도 없을때니깐


NAI유출도 없고, 로라도 없던 시절이라 2D는 한두달동안 그냥 멸망이었음








SDXL에서는 애니그림체가 어느정도 훈련이 되어있어서 NAI유출사태같은게 없어도 개인단위의 추가훈련으로 쓸만한 모델이 나옴. 


특히 실사와 반실사쪽은 기본모델부터 경쟁력 있는데다 개인단위에서 SD1.5용으로 써먹은 훈련자료들 재활용하니 순식간에 현재모델을 압도할것으로 예상함.

미드저니처럼 서버규모의 신경망에서 돌아가는 퀄리티는 못따라잡겠지만, SDXL은 최소사양이 확 올라가면서 달성가능한 최대 퀄리티도 올라가니까




한가지 아쉬운점은 지금 훈련할때 태깅툴이 문장이 아니라 단부루 태그로 생성하는게 대세라는점.

NAI섞이기 이전에는 문장형 프롬프트를 해석할 수 있었다. 왼손은 위로 뻗고 오른손은 허리를 만지는중 이라는 문장을 이해하는 지능이 있었다는것

저 단부루태그가 계속 쓰인다면 믹스모델들이 섞일수록 문장 해석 능력을 망각하게된다.