최종 수정일자 기준으로 의미가 없는 글입니다.


40시리즈를 사셨다니 축하드리고 열심히 그림을 뽑아주세요




현재 빌드 기준으로, WebUI의 기본 pytorch 버전은 1.31.1+cuda 11.7입니다.


해당 버전에서 사용하는 cuda 11.7은, 40시리즈를 미지원하는 버전이라 기본적으로 절반 정도의 성능밖에 나지 않습니다.


이를 임시적으로 해결하는 방법은 간단한데, cudnn 파일을 교체하면 됩니다.


아래와 같이 하세요.


1. 엔비디아 공식 사이트에 가입하거나 다른 방법으로 cudnn을 받습니다. 11.x 용, zip파일로 받으면 됩니다.

가입시 정보는 가라로 넣으면 됩니다. 저는 서울대생 AI 연구가라고 함.


-> 환경에 따라 구버전(cudnn 8.7.0 혹은 8.6.0)이 빠른 경우가 있는 듯 합니다. 아카이브(8.7.0, 8.6.0)에서 구버전을 받은 뒤 비교해 보시는 것을 추천함.


2. 압축을 풀고, bin 폴더 안에 있는 dll 파일을 전부 복사합니다.



3. 복사한 파일을 (WebUI 설치폴더)\venv\Lib\site-packages\torch\lib\ 에 붙여넣습니다.

(원클릭 설치는 (WebUI 폴더)\cache\virtualenv\Lib\site-packages\torch\lib)


4. 속도가 두배가 됐습니다.



참고로, cudnn을 제외한 pytorch, cuda 버전은 제가 실험해봤을 땐 딱히 영향이 없었습니다. GPU 부하가 적은 경우 영향이 있습니다. 참고로 GPU 부하가 적은 경우에는 CPU의 싱글코어 속도 영향 또한 큽니다. 4090으로 512x512 한장 40it 찍고 이런거 보면 13900k 56배수 같은 환경이니까, 한장 뽑지 말고 batch size나 해상도를 늘렸을 때 속도를 확인하시면 됩니다.


이거 몰라서 인생 절반 손해본 40오우너들 좀 있는거같아서 다시씀.


알고있던거라도 념글좀 보내줘


키워드 : 4090, 4080, 4070ti, 4070, 4060, cudnn, 쿠단