PAG: https://arca.live/b/aiart/102651788
PAG가 어떤 원리로 동작하는지는 페이퍼 봐도 잘 모르겠음.
난 어짜피 딸깍이니 딸깍이 방식으로 써 봄.
아직 확장으로 나온 건 없어서 diffusers로 돌려봄.
모델은 데모 페이지에서 쓰고 있는 SoteMixV2.2 (SD1.5 모델) 그대로 썼고,
크기는 512x768, 스케줄러는 DPM++ 2M Karras( DPMSolverMultistepScheduler(use_karras_sigmas=True) ), steps는 30으로 놓았음.
CFG, PAG, CFG+PAG 비교
CFG 6.0 / PAG 0 | CFG 0 / PAG 6.0 | CFG 6.0 / PAG 6.0 |
1girl, solo, casual, simple background, anime style, anime coloringworst quality, backlighting, bad hands, crossed legs, blurry
CFG 6.0 / PAG 0 | CFG 0 / PAG 6.0 | CFG 6.0 / PAG 6.0 |
1girl, solo, smile, summer, bikini, sea, joy, beach ball
worst quality, backlighting, bad hands, crossed legs, blurry
CFG 6.0 / PAG 0 | CFG 0 / PAG 6.0 | CFG 6.0 / PAG 6.0 |
1girl, solo, casual, indoors, potted plant, wooden floor, window, sunbeam, sunrays, sitting on couch
worst quality, backlighting, bad hands, crossed legs, blurry
이 비교를 한 이유는 페이퍼에서 PAG가 CFG와 비교하고 있어서 "PAG가 CFG를 대체할 수 있는가?"하는 궁금증이 생겨서임.
결과적으로 봤을 때, CFG가 1로 뒀을 때보다는 좋은 이미지가 나오지만,
이상한 모양의 공이나 다리 같은 걸 보면 CFG가 낮을 때 보이는 현상이 좀 보임. (저자분께서는 프롬프트를 안따른다고 언급함)
대신 CFG랑 PAG를 같이 썼을 때 퀄리티는 꽤 괜찮은데, 특히 마지막 이미지들처럼 인물이 작을 때 CFG만 썼을 때 보다 좋아보임.
생성속도는 아래와 같음.
CFG 100%|███████████████████████████| 30/30 [00:00<00:00, 30.52it/s] PAG 100%|███████████████████████████| 30/30 [00:01<00:00, 29.66it/s] CFG+PAG 100%|███████████████████████████| 30/30 [00:01<00:00, 21.35it/s]
CFG나 PAG 단독으로 썼을 때는 속도가 비슷한데, 같이 쓰면 더 느려짐.
사견
모델 특성인지 애니메 모델은 다 그런지 모르겠지만, PAG 값을 10~15정도까지 높이는 게 더 좋은 느낌.
CFG 12 | PAG 15 | CFG 12 / PAG 15 |
프롬프트 없이 돌리기
그리고 페이퍼에서 언급한 대로 프롬프트 없이(unconditional) 생성할 때 상당히 괜찮은 이미지가 나옴.
CFG 8 | PAG 10 | CFG 8 / PAG 10 |
프롬 X
...막짤 PAG 10 만 준 건 학습한 게 그대로 나온 게 아닐까 한 수준인데ㄷㄷㄷ
소감
- 장점 : 건드릴 속성값이 하나 더 생김
- 단점 : 건드릴 속성값이 하나 더 생김
- 프롬없이 PAG로 생성했을 때가 프롬 넣었을 때보다 퀄 좋아 보임
- SoteMixV2.2 꽤 괜찮은 모델인 듯. XL 나오기 전에 알았다면 많이 썼을 거 같다.
나중에 시간되면 XL에도 적용되는지 보고 animagine으로 랜덤 돌려봐야겠다.
SDXL은 지원안하나 봄ㅠㅠ