PAG: https://arca.live/b/aiart/102651788


PAG가 어떤 원리로 동작하는지는 페이퍼 봐도 잘 모르겠음.


난 어짜피 딸깍이니 딸깍이 방식으로 써 봄.

아직 확장으로 나온 건 없어서 diffusers로 돌려봄.


모델은 데모 페이지에서 쓰고 있는 SoteMixV2.2 (SD1.5 모델) 그대로 썼고,

크기는 512x768, 스케줄러는 DPM++ 2M Karras( DPMSolverMultistepScheduler(use_karras_sigmas=True) ), steps는 30으로 놓았음.


CFG, PAG, CFG+PAG 비교

CFG 6.0 / PAG 0CFG 0 / PAG 6.0CFG 6.0 / PAG 6.0

1girl, solo, casual, simple background, anime style, anime coloring
worst quality, backlighting, bad hands, crossed legs, blurry


CFG 6.0 / PAG 0CFG 0 / PAG 6.0CFG 6.0 / PAG 6.0

1girl, solo, smile, summer, bikini, sea, joy, beach ball

worst quality, backlighting, bad hands, crossed legs, blurry


CFG 6.0 / PAG 0CFG 0 / PAG 6.0CFG 6.0 / PAG 6.0

1girl, solo, casual, indoors, potted plant, wooden floor, window, sunbeam, sunrays, sitting on couch

worst quality, backlighting, bad hands, crossed legs, blurry


이 비교를 한 이유는 페이퍼에서 PAG가 CFG와 비교하고 있어서 "PAG가 CFG를 대체할 수 있는가?"하는 궁금증이 생겨서임.

결과적으로 봤을 때, CFG가 1로 뒀을 때보다는 좋은 이미지가 나오지만,

이상한 모양의 공이나 다리 같은 걸 보면 CFG가 낮을 때 보이는 현상이 좀 보임. (저자분께서는 프롬프트를 안따른다고 언급함)

대신 CFG랑 PAG를 같이 썼을 때 퀄리티는 꽤 괜찮은데, 특히 마지막 이미지들처럼 인물이 작을 때 CFG만 썼을 때 보다 좋아보임.



생성속도는 아래와 같음.

    CFG 100%|███████████████████████████| 30/30 [00:00<00:00, 30.52it/s]
    PAG 100%|███████████████████████████| 30/30 [00:01<00:00, 29.66it/s]
CFG+PAG 100%|███████████████████████████| 30/30 [00:01<00:00, 21.35it/s]


CFG나 PAG 단독으로 썼을 때는 속도가 비슷한데, 같이 쓰면 더 느려짐.


사견

모델 특성인지 애니메 모델은 다 그런지 모르겠지만, PAG 값을 10~15정도까지 높이는 게 더 좋은 느낌.

CFG 12PAG 15
CFG 12 / PAG 15



프롬프트 없이 돌리기

그리고 페이퍼에서 언급한 대로 프롬프트 없이(unconditional) 생성할 때 상당히 괜찮은 이미지가 나옴.

CFG 8PAG 10CFG 8 / PAG 10

프롬 X


...막짤 PAG 10 만 준 건 학습한 게 그대로 나온 게 아닐까 한 수준인데ㄷㄷㄷ



소감

  • 장점 : 건드릴 속성값이 하나 더 생김
  • 단점 : 건드릴 속성값이 하나 더 생김
  • 프롬없이 PAG로 생성했을 때가 프롬 넣었을 때보다 퀄 좋아 보임
  • SoteMixV2.2 꽤 괜찮은 모델인 듯. XL 나오기 전에 알았다면 많이 썼을 거 같다.


나중에 시간되면 XL에도 적용되는지 보고 animagine으로 랜덤 돌려봐야겠다.

SDXL은 지원안하나 봄ㅠㅠ