이건 경험에 따른 거임, 각자 방식에 따라 다르게 나 올 수 있음.


1.이미지 전처리

학습할 이미지가 많이 있다면 대략 (50장 이상) 배경이나 썸네일 같은 건 안지워도됨

오히려 지우면 다양화가 덜해짐, 배경이 잘 안 먹는다 던지 그런거.

대신 배경 때려 박을 때는 태깅을 꼭 해줘야 함.


2.이미지 크기

이미지 짜르는 것도 안해도됨. AI는 멍청하지 않음

그림체 학습 768x768, 캐릭터 학습 640x768 추천


3. 태깅

태깅은 왠만 해서는 자동으로 해주는 확장자들 사용하샘,

개노가다 짓은 안하겠지만 직접 작성하면 AI가 인식하는 대상이랑 내가 지시하는 대상의 괴리가 생겨서 학습이 이상해 질 수 있음


4. 레이블 처리

img/(하위폴더)  이것도 매우 중요한게 하위 폴더를 여러개로 나누고 ai가 인식하는 폴더 이름으로 학습 시키면 개념을 나눠서 이해 시키는게 가능함

예를 들어. (숫자)_face, (숫자)_body, (숫자)_swimsuit, (숫자)_school uniform, 이런 식으로 img 하위 폴더로 두면

각 개념들을 개별적으로 더 잘 학습됨. 이를 이용해서 로라 하나에 여러 캐릭터 쑤셔넣는 것도 되는데 비추함


5. 키워드 프롬프트

<로라> 말고도 프롬프트로 작동되는 키워드 프롬프트임.

주로 하위 폴더 명칭이 키워드로 작동되고, 태깅 할 때 가장 빈도수가 높은 프롬 또한 키워드로 작동됨

그래서 폴더와 태깅 둘다 통일 시키면 키워드가 더 잘 먹힘

예시 : (숫자)_swimsuit, 폴더 안에 메모장 태깅 작성시, swimuit, 1girl, hair, black eyes, ~ ~ 

그리고 실제 쓰는 프롬을 안 써도 되고 일반 명사들을 사용해도됨. 해당 단어에 대한 개념을 학습 시키는 거로 이해하면 된다.


6. 리핏, 에포

리핏+이미지+에포  해서 총 5000~ 7000 쯤 나오게 해야 과적합 없이 잘 나옴

그래서 리핏+이미지=1500 ~ 2000 쯤 나오게 데이터 셋 만든 다음 에포 1~5 정도 돌리면 3~4 에포에서 적당한거 건져내면 됨