1. 이미지는 무조건 정사각형. 

세로나 가로로 길쭉한 직사각형 이미지 넣으면 납작하게 만든 결과물이 나옴.


2. 정규화이미지는 직접 만들자.

기본으로 제공되는 person_ddim은 까보면 사람형상도 아닌 현대미술 낙서들만 1200장이 들어있다. 이걸로 학습 돌리느니 개새끼 사진 200장으로 돌리는 게 더 나음. 그러니 버리고 직접 만들어 쓰자.


3. 이미지 화질은 무조건 선명한 걸로.

화질구지 추가해서 데이터 몇백장으로 뿔리는 것보다 선명한 이미지 수십장이 퀄 더 좋음.


4. SD, WD는 쓰레기다.

와! AI가 내가 넣은 이미지를 비슷하게 출력해 줘요! 씐기해요!에서 만족할 거 아니면 NAI를 쓰자. 실사든 씹덕이든 SD랑 WD보다 잘 뽑음. 무엇보다 학습이 잘되어 있어서 그냥 아무거나 학습시켜도 일정 퀄리티 이상은 자동으로 보장해줌.


5.yaml을 수정하자.

Config/StableDiffusion 들어가면 언프로즌 어쩌고 하는 yaml파일이 있을 거다. 여기서 다양하게 학습 환경을 수정할 수 있음. Batch_size와 Num 뭐시기는 1에서 늘리면 트레이닝 시간을 줄일 수 있도 num_vecter 라고도 있는데 이건 수를 늘려주면 받아들이는 벡터가 더 많아져 이미지가 선명해짐.

6. 정규화이미지 어디서 구해요?

NAI를 쓰던 webui를 쓰던간에 스텝수를 최저로 낮춰놓으면(7~10) 다량의 이미지를 빠르게 뽑을 수가 있음. 어차피 정규화용 이미지는 선명할 필요 없으니 이렇게 뽑으면 됨. 그냥 girl로 하지말고 프롬프트 복잡하게 넣어서 너가 학습시키고 싶은 분위기와 캐릭터 특징을 맞춰라.


7. Class 관련 꼼수

씹덕캐를 학습시킬 때 제로베이스인 girl에서 시작하는 것보다 비슷한 외형의 캐릭터에서 시작하면 빠르다. 마이너한 핑챙캐를 학습시킬 때 class=girl에서 시작하는 것보다 비슷한 핑발인 사쿠라에서 시작해 class=Skura(naruto) 에서 시작하는 게 빠르다는 뜻.


8.학습시킨 토큰을 불러올 땐 꼭 클래스도 같이 써라.

(아무프롬프트)+토큰

이러면 어딘가 어색한 결과물이 나옴. 클래스도 꼭 같이 붙여라. class=girl이었으면 (아무프롬프트)+토큰+girl이렇게 쓰라는 뜻.


9.학습 수는 충분히 많이, 이미지 수도 충분히 많이 

많이 학습시키면 과적합된다 하는데 상관없다. 어차피 그 캐릭터를 최대한 가깝게 재현하는 게 목적이잖아? 과적합돼도 checkpoint merge기능으로 다시 nai모델과 합쳐쓰면 돌아온다. 이경우 비율은 7:3~6:4가 적당함. 많은 쪽이 학습시킨 모델.