캐릭 로라같은건 하도 매진하는 사람들이 많아서 걍 검색해서 받는게 낫겠다 치고
신체 조작 로라같은거 만들어볼 요량으로 도전해왔는데
아무리 생각해도 AI가 로라를 학습하는게 아니라 로라 학습에 관해 내가 학습한다는 생각을 지울 수가 없네...


제일 쉬운 인어를 학습하고 나서 다음 단계로 나아가려 했는데
쉬운은 개뿔... 튜토리얼도 못 벗어나고 버벅거리다가
캡션에 가중치 넣는게 제대로 역할을 해 줫다



일단 결론부터 말하자면

"학습시킬 주제(트리거?)" 태그는 가중치를 낮게
배제시킬 태그는 가중치를 높게
태깅하고 학습하면 결과가 괜찮더라는 거


캐릭 로라 학습할때 전신+상반신+얼굴 이렇게 학습한다고들 이야기하는데
이건 역으로 얼굴 학습 시켜봐야 그림체만 조져버리니까 모가지(or 허리위)를 날리고 학습시켰더니만 듀라한 비율이 존나 높아짐

그래서 "head_out_of_frame"을 넣어서 학습시켰는데 넣었는지 말았는지 간에 기별도 안 오더라. 1/2은 참수화상 발생

그래서 학습 이미지에 태깅된걸 (head_out_of_frame:1.5)로 모조리 바꿔버리고 학습하니까 참수가 안 뜬다


가중치 1.5를 넣어서 참수 이미지가 결과로 떴으니, 역으로 가중치 1.5까지 안 먹이면 모가지가 안 날아가지 않겠냐는 역발상
마찬가지로, mermaid라는 프롬프트는 이미 모델에 "완전히 오염된 상태로" 존재하고 있으므로

로라의 영향력을 키우기 위해 0.8의 가중치로 태깅을 싸악 고쳐놓고 학습

별개의 트리거태그를 사용하겠다면(즉 모델에 존재하지 않는 제3의 프롬프트를 적용) 이짓 안해도 될 듯?


캐릭 로라를 학습시키면서 다수의 증명사진 학습데이터에 출력 이미지는 전신샷을 노린다면

태깅할때 face_focus에 가중치를 왕창 퍼맥이고 학습하면 될?듯 


아래는 시도해본거

전신샷 450여장과 참수이미지(?) 200여장으로 3000스텝 급속취사로 만듬

로라 사용/미사용




아직 적절한 LR을 세팅을 못해서 프롬프트 가중치가 중구난방인데 목 날아가는 거는 확실히 완화되었다
역으로 (head_out_of_frame:0.6)으로 학습하고 네거티브에 넣어봤는데 미동도 안하더라
뭘 학습시켜 네거에 넣는건 좋은 접근이 아닌거같음.


태깅은 webUI 태거에서 기준치 0.35로 오토태깅(온갖 잡것들도 걍 싹 태깅)

학습시킬 태그와 제거할 태그를 쿄햐 유틸리티에서 수동으로 제거
수동추가로 가중치 넣은 태그를 추가



저 옵션이 있는지도 모르고 구버전을 주구장창 쓰고 있었는데

학습챈이었는지 그림챈이었는지 누가 저 옵션을 언급해서 바로 업데이트

업데이트하면 뭐 느려진다/비램많이먹는다 부작용 언급도 봤었던거 같은데 에라 모르겠다 하고 지름

근데 저 가중치 언급한 글을 암만 찾아도 어디서 봤는지 모르게따...

옵션의 설명글에도 있지만 캡션에 가중치를 넣을때에는 각 태그마다 넣던가, 아니면 캡션 드랍아웃 / 셔플 캡션 옵션을 꺼야함

(1girl, mermaid:1.3) 이런식으로 태깅하고 셔플캡션을 켜면

(1girl
mermaid:1.3)

이렇게 쪼갈라져 섞인다는 모양(괄호안 쉼표와 괄호밖 쉼표를 구분못함)


기왕지사 하는거 full body도 모조리 0.9 먹여서 학습시켰음