https://arca.live/b/aiart/78544550




README에 워낙 설명이 잘되어있어서 그걸 그대로 따라하면 됨


일단 그대로 설명함





StableSR을 포함 2개의 확장을 먼저 설치해야함


https://github.com/pkuliyi2015/sd-webui-stablesr


https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111


Tiled Diffusion & VAE은 일단 옵션이지만 그냥 필수임 무조건 설치


확장을 설치하고 필수파일을 따로 받아야함


어찌보면 이 업스케일러의 최대 단점이라고 생각함

약 6.4기가 정도를 따로 다운받아야하고 또 디스크공간을 차지함


먼저 Stable Diffusion V2.1 512 EMA checkpoint


https://huggingface.co/stabilityai/stable-diffusion-2-1-base/tree/main


여기서 v2-1_512-ema-pruned를 받으면 됨 ckpt나 safetensors 둘중 아무거나 하나 선택 용량은 약 5.21기가


받은 파일은 models/Stable-Diffusion/ 에 넣어줘라




그다음 StableSR 모듈과 전용 VAE파일을 받아야함 약 1.2기가


https://huggingface.co/Iceclear/StableSR/resolve/main/weibu_models.zip


받은 압축파일중에서 stablesr_webui_sd-v2-1-512-ema-000117.ckpt 파일은  extensions/sd-webui-stablesr/models/  에 넣고


vqgan_cfw_00011_vae_only.ckpt 파일은  models/VAE/ 에 넣어라


vqgan_cfw_00011_cfw_only.ckpt 이 파일은 그냥 무시해도 됨




이제 img2img 탭으로 가서 리사이즈 할 이미지를 불러오고


체크포인트를 v2-1_512-ema-pruned 로 변경해주고

VAE도 vqgan_cfw_00011_vae_only 로 변경하면 됨


그다음 맨 아래 스크립트에서 StableSR 을 고른다음 Scale Factor 배율을 고르고

SR Module 에서 맨 오른쪽 새로고침을 눌러주고 stablesr_webui_sd-v2-1-512-ema-000117.ckpt 를 선택해주면 됨


추천 설정대로 세팅하고 돌리면 됨


추천 설정

샘플러 : Euler a

CFG Scale : 2 이하

스텝 : 20 이상

디노이즈 : 취향대로 - Pure Noise 옵션을 활성화하면 디노이즈가 무시된다고 하는데 나같은경우엔 변화가 있었음


일단 추천설정은 이정도고 프롬프트는 여러번 돌려봤는데 그냥 영향을 안주는거같음 아예 전부 비워두고 돌려도 됨

정 넣고 싶으면 로라/리코리스 임베딩은 삭제할것 SD2.1로 돌리는거라 어차피 적용 안됨

시드도 별 영향 없는거 같음


이미지 사이즈가 512이상이면 Tiled Diffusion & VAE을 쓰라는데 사실상 무조건 쓰라는거임



설정은 이렇게 하면 됨 이건 VRAM 24G 기준 설정이니까


자신의 VRAM이 딸리거나 아웃오브메모리 뜨면


Tiled Diffusion Latent tile batch size 를 낮추고 (VRAM이 심하게 딸리면 1로)

Tiled VAE Encoder Tile Size 를 1024

Decoder Tile Size 를 128 로 낮추고 돌리면 됨


실제로 저세팅으로 돌리면 24G 기준으로 좀 여유가 많을거임


그럼 Latent tile size 를 width, height 둘 다 96이나 128로 올리고 돌리면 VRAM은 더 먹지만 속도가 좀 빨라질거임




내가 실제로 돌려본 결과물




원본 XSMix 견본 640x960

https://civitai.com/models/31473





2배 업스케일링 1280x1920

스텝 40 디노이징 0.6


4090으로 소모시간 약 40초






4배 업스케일링 2560x3840

스텝 40 디노이징 0.6


소모시간 약 1분40초






5배 업스케일링 3200x4800

스텝 40 디노이징 0.6


소모시간 약 2분40초




참고로 배율설정은 16배까지 할수있음



Pure Noise 옵션은 완전한 랜덤 노이즈를 생성하는 옵션라고함

이게 StableSR 기본 옵션이지만 원하면 끌수있는데 만약 끈다면 무조건 디노이즈를 1.0으로 설정하라고 함

https://imgsli.com/MTgwMTMx/2/1

비교짤



Color Fix 옵션은 타일 방식의 고질병인 색변조를 방지한다고 함 이것도 역시 기본이 켜는거

AdaIN 방식은 구리니까 쓰지 말라고함

https://imgsli.com/MTgwNDg2/0/1

비교짤