날림 소개라서 설명이 이상하거나 부족할 수 있음.


https://gist.github.com/Stella2211/ab17625d63aa03e38d82ddc8c1aae151

이거 써보니 돌아가기는 하는둣.


윈도우 기준 설치 방법. 테스트에 사용된 그래픽카드는 4070ti 이지만 3060도 가능할지도?

CUDA Toolkit 11.7 설치후 path를 11.7만 있도록 설정.

위 링크의 DeepFloyd_IF_VRAM12GB.py 를 다운받아 어딘가에 둔 다음

python -m venv venv 으로 가상환경 만들고

.\venv\Scripts\activate 으로 가상 환경 들어가고

pip install deepfloyd_if==1.0.2rc0

pip install xformers

pip install git+https://github.com/openai/CLIP.git --no-deps

pip install --upgrade diffusers~=0.16 transformers~=4.28 safetensors~=0.3 sentencepiece~=0.1 accelerate~=0.18

pip uninstall torch torchvision torchaudio

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

pip install https://github.com/acpopescu/bitsandbytes/releases/download/v0.38.0-win0/bitsandbytes-0.38.1-py3-none-any.whl

까지 해서 이것저것 설치. pip에서 deepfloyd_if 의존성 문제가 있다고 경고가 뜨겠지만 아무튼 돌아갈거임.

python .\DeepFloyd_IF_VRAM12GB.py 으로 실행

이후 DeepFloyd_IF 모델 접근 가능한 허깅페이스 계정 토큰 물어본 다음 엄청난 용량의 다운로드를 할것이니 참고.

스테이지 3 까지 돌려서 모든 모델을 다 다운받은 다음 나중에 프로그램을 가동하는 경우 DeepFloyd_IF_VRAM12GB.py 로그인 관련을 지우거나 주석 처리하면 편함. 그 외에도 워터마크 제거도 가능.


성능은 그럭저럭으로 SD 2.1 보다 괜찮은듯.


GitHub - neonsecret/IF
VRAM 8GB 버전도 있다고는 하는데 이건 안써봐서 모르겠음.