일단 영어 이슈로 내가 엉터리로 이해한게 있을 수도 있으니 이 점 참고해주세요
1. 캐릭터 태그는 잘 이해하는데 그에 비해 작가 그림체 태그는 맛없던 이유 :
모델 학습할 때 작가 태그는 학습하지 못하도록 했나 봄.
As PD does not allow artist style replication we are playing on hard mode.
*수정*
인 줄 알았으나 제작자들이 일부러 작가나 일부 캐릭터 태그를 변형해서 학습했던 것으로 보인다
https://arca.live/b/aiart/101087212?p=1 <- 참고
1-1. 그럼 그림체를 어떻게 지정해야 함? :
일단 로라로 특정 스타일의 그림체를 지정하는걸 추천
( civitai에 유화, 실사, 만화 등등 그림 스타일을 지정하는 로라를 같이 추천 )
아니면 자기가 학습해서 쓰던가
퀄리티를 높이려면 추가로 score_x 태그를 이용함
2. score_9, score_8_up, score_7_up, ... 같은 태그는 뭐임? :
학습할 때 이미지 퀄리티와 관련된 태그를 새로 만들었다고 함.
단순히 좋아요가 많거나 인기 많은 작품이 좋은 작품이다 라고 하면 대부분이 다 야짤일테니까
직접 데이터 셋 중 2만 장을 주관적인 점수로 분류하고 (잘 그렸으면 높은 점수, 못 그렸으면 낮은 점수)
이를 다시 학습시켜 인공지능이 학습할 나머지 데이터셋에 그림점수를 매김
그렇게 해서 인공지능이 점수를 매기고, 이를 태그를 반영하도록 해서
score 이 높을수록 잘 그렸다라고 판별하게 됨 (해당 모델을 제작한 사람의 취향을 기준으로)
따라서 score_n 은 10점 만점을 기준으로 n~n+1점 퀄리티의 그림, score_n_up은 n~10점 퀄리티의 그림
=> 요약하자면 10점 만점 기준 score_8 는 8점 ~ 9점, score_8_up은 8점~10점 퀄리티의 이미지고,
이를 통해 negative 프롬프트나 masterpiece, hd 같은 퀄리티 태그를 필요없게 설계했다고 함
3. rating_xxx , source_xxx 같은 태그는 뭐임? :
마찬가지로 rating_xxx 태그와 source_xxx 태그를 부착해서 학습하는데 사용했다고 함.
rating_ 은 선정성 : (순한맛) <- rating_safe , rating_questionable , rating_explicit -> (매운맛)
source_ 는 해당 이미지의 전체적인 스타일에 추가로 도움을 주는 느낌? :
source_pony , source_furry , source_cartoon , source_anime
(ex : 내가 말박이라서 포니를 그릴 거다 -> source_pony, feral
아닌데 난 그냥 수인 털박이인데? -> source_furry, furry
난 그냥 사람 그릴래요 -> source_cartoon 또는 source_anime )
+ Pony diffusion V7 관련 소식 (2024.02.29 공지)
- 데이터 세트로 2,500만장을 수집하고 그 중 좋은 퀄리티의 1,000만 장을 선별하려고 함.
- 포니 6 가 좋은 성능이 나온건 좋은 성능의 자연어 캡션을 이용했기 때문인데, V6의 데이터 세트 중 절반만 이걸 사용했었고, 이 캡션이 내 기대에 비해 별로였던 적도 많아서 성능을 올리기 위해 시도 중.
- 마찬가지로 V7 에서도 프롬프트(태그)로 작가 그림체를 특정하는 건 금지할 것이고, 현재도 유사한 스타일을 계속 사용하려면 로라를 사용하도록 했음 (유화, 실사... 등) -> V7 에서는 이걸 태그만으로 간단하게 스타일을 고정할 수 있도록 하고 있음.
정보로 하기엔 좀 빈약할 것 같아서 그냥 일반에 작성함.
지금도 대단한데 v7 나오면 진짜 엄청나긴 할 듯.