로라 관련 글 외국꺼랑 국내꺼 쭉 읽어보고 개인적으로 사용할수 있는 툴을 만들어서 돌려보는중

처음에는 accelerate 툴 관련해서 헷갈린게 많았는데 일단 툴 만들고 나니까 Fine-tune보다 공장처럼 찍어내는게 가능해진듯
가장 눈에 띄는 그림체라서 한번 찍먹해봄



----


그림체라서 DIM=256 해봤고


학습 레이트 지정해봄:

   UNET=0.00011

   ENCODER=0.00008

   지정해본 이유는 인코더를 너무 쎄게 학습 시키면, 다른 거랑 간섭이 일어나더라고.

   특히 작품 이름, 사람 이름 같은거 넣으면 작품이름이나 사람 이름 때문에 정확도 나락가더라... (아티스트는 1명만 하는것 추천)

   신체가 변하거나 상세 응용이 필요한 부분 (옷 스타일) 등은 클래스 이미지가 필요한듯. 클래스 이미지로부터 어느 부분을 변경

   해야하는지에 대한 힌트를 얻는것 같더라.


512^2 데이터셋 500개 

(원본 데이터셋 220개정도)


그외 나머지는:

   CLIP_SKIP=2

   MAX_TOKEN=150

    BUCKETED

   XFORMERS

   LR_SCHEDULER="cosine_with_restarts"

   8BIT_ADAM

   GRADIENT_CHECKPOINT / 30 BATCH



만든 툴은... 오늘 아침에 만든거라서 사실 그냥 뭐 공유할만한 단계는 아니라고 보면되서 좀 기다려야함...


----


해봤다구 그냥

데이터 처리 및 구성은 빠삭한데 이걸 학습시키는 기초 이론이 부족하니까 막막하네

어디 좋게 공부할데 있으면 알려주라

MNIST정돈 암 ㅠㅠ


덤으로 고오급 호텔 로라랑 같이 올려봄거





아... 업로드는 피곤해서 나중에 다른거랑 같이함