SDXL 1.0 kohya_ss LoRA GUI 학습 사용법 (12GB VRAM 기준)

AI그림 학습 채널

알림 알림 중 알림 취소

구독자 8788명 알림수신 125명 @Anon

그림 AI 학습 정보를 공유하는 채널

정보 SDXL 1.0 kohya_ss LoRA GUI 학습 사용법 (12GB VRAM 기준)

포리X

추천 7 비추천 0 댓글 37 조회수 11345 작성일 2023-07-29 02:37:21 수정일 2024-01-20 06:06:19

https://arca.live/b/hypernetworks/82339134

2024년 1월 20일 간단 추가. Animagine XL V3가 타겟인 경우에는 Animagine XL V3 Base 모델로 학습을 해야됨.

2023년 9월 25일 수정. 이 글이 처음 작성한 시점에서는 순정 SDXL 1.0의 성능이 기대 이하라서 생성 품질이 좋지 않았지만, 점점 잘 튜닝된 SDXL 모델들이 등장하면서 어느정도 좋은 결과를 기대할 수 있음.

이 설정은 SDXL에서만 사용할 수 있으며 SD 1.x와 SD 2.x는 사용할 수 없음.

1.0 기준으로 1.1 이후의 미래에는 달라질 수 있음. 일부 설치 사용법은 https://arca.live/b/aiart/68205055 에서 긴빠이 해옴.

1. 필요한 것

- 권장 VRAM 12GB 이상 NVIDIA 그래픽 카드

- 최소 VRAM 8GB 이상 NVIDIA 그래픽 카드 (768,768만 가능)

- 라데온은 윈도우에서 불가능함. 리눅스라면 방법이 좀 다르지만 가능할지도?

- Windows 10/11

- 리눅스에서 설치는 가능하나 방법이 좀 다름.

- python 3.10 하고 git

- 설치 시 PATH 환경 변수 추가 하기.

- stable diffusion WebUI (automatic1111 또는 vladmandic)

- WD Tagger 1.4 https://github.com/picobyte/stable-diffusion-webui-wd14-tagger

- ComfyUI (옵션)

- 학습할 데이터셋 (리사이징 안 해도 된다고 함)

2. 설치

먼저 설치할 곳에서 파워쉘을 열어야한다. Shift + 우클릭 한 다음 여기에 Powershell 창 열기를 선택하면 창이 열림.

그런 다음 git clone https://github.com/bmaltais/kohya_ss.git 입력

그런 다음 kohya_ss 폴더 안의 setup.bat 실행.

이런 창이 뜨면 1 입력

이렇게 메세지가 뜨면 2 입력.

설치를 하다보면 accelerate config으로 진입할건데

This machine [엔터]

No distributed training [엔터]

NO [엔터] - 기본값이 NO 엔터만 쳐도 됨!

NO [엔터]

all [입력]

fp16 [숫자 1 눌러서 선택 후 엔터]

설치가 완료되면 창을 닫는다. bitsandbytes_windows 설치는 하지 않는다. 다른 optimizer 사용으로 bitsandbytes를 사용하지 않을것이다.

3. 실행

kohya_ss 폴더 안의 gui.bat 실행.

이렇게 뜨면 창에서 안내하는 local URL을 입력하여 접속한다.

보통은 127.0.0.1:7860이지만 다른 webui 프로그램이 실행중이면 주소가 다를 수 있다.

먼저 LoRA를 클릭한다.

그런 다음 Configuration file을 클릭한다.

https://mega.nz/file/gSVhBLCK#q9DyBNuZXEN5NDItwkUY61sq6GTKFxL5lHyeUORUpfE

을 다운받는다. 설정 파일임.

그런 다음 Open을 클릭해서 해당 설정 파일을 연다.

그런 다음 SDXL이 있는 모델의 절대 위치를 지정한다. 어떻게 지정하는지 모르겠디만 우측에 있는 파일 버튼을 클릭하면 된다. 순정 SDXL 모델로 학습하지 않으면 LoRA 호환성이 대폭 하락하니 주의. 튜닝된 SDXL로 학습하는 경우 유의미한 LoRA 퀄리티 상승이 있는지는 아직 확인을 안해봤음.

폴더 탭으로 넘어간 다음 이미지/아웃풋/로깅 폴더 등등을 지정한다. 학습이 처음이라서 뭔지 모른고 어떻게 해아할지 모른다면 https://arca.live/b/aiart/68205055 의 8번을 참고하여 진행할것. 참고로 태깅은 해당 확장 프로그림의 지원 종료로 https://github.com/picobyte/stable-diffusion-webui-wd14-tagger 를 사용해야함.

파라미터스는 미리 세팅이 되어 있지만 일부 값은 건들어도 됨.

Train batch size 사이즈는 배치 사이즈로 1~4 중에서 선택. VRAM이 낮을 수록 낮은 값을 사용해야하고 VRAM이 넉넉하다면 4 정도면 충분할지도.

Epoch와 Max train epoch는 동일한 값을 입력해야하며, 보통은 6 이하로 잡음.

train_batch_size x Epoch x Repeats가 총 스텝수이다. SD 1.x LoRA 학습에서는 10000을 넘길일이 없는데 SDXL는 정확하지 않음. 캐릭터는 대체로 500~1500 스텝 사이에서 결정나는것 같고 그림체는 10000 스텝 정도 해도 잘 안되는거 같음.

Learning rate, Text Encoder learning rate, Unet learning rate는 0.0004로 설정되어 있는데 초보자라면 이 값을 건들지 않는것이 좋임. 초보자가 아니고 모험을 좋아한다면 영문으로 관련 정보를 습득하는것이 좋음.

Max resolution - 최대 해상도. 보통은 1024, 1024가 권장되지만 약간 빠른 학습과 안정적인 VRAM 사용을 위해서 768, 768로 설정함. 물론 하고싶다면 1024, 1024 사용해도됨.

Network Rank (Dimension), Network Alpha는 LoRA 사이즈를 담당함. 그냥 둬도 되지만 크기를 늘리거나 줄이거나 해도 큰 상관은 없음. 다만 큰 LoRA가 큰 품질을 만드는것은 아닌듯.

Advanced Configuration에 대해서 세팅하는 방법은 생략. Shuffle caption 같은 일부 기능은 VRAM 절약 옵션때문에 사용할 수 없을것이고 그냥 미지원 기능도 있으니 참고.

세팅이 끝나면 Save (덮어쓰기) 또는 Save as... (다른 이름으로 저장하기) 클릭해서 세팅을 저장한다. 안그러면 다시 세팅해야함.

그런 다음 아래에 있는 Start training를 누른다음 학습이 끝날때까지 콘솔창을 바라본다. 뭔가 잘못되면 에러메세지는 콘솔창에 뜰것이다. 그래픽카드 성능에 따라 30분에서 2시간 정도 걸릴 수 있음. loss=값에 nan 안뜨면 잘 되고 있는것이고 nan 뜨면 망한거임.

SDXL 1.0에서 아니메 캐릭터 학습 결과물을 SDXL 1.0에서 이미지를 생성한 경우에는 이정도라서 실사용이 어렵지만

최근 잘 튜닝된 SDXL 모델의 등장으로 아니메 스타일로 개조된 SDXL 모델에서 사용하면 그럭저럭 괜찮은 결과를 기대할 수 있음.

엑시옴

2023-07-29 02:52:19

노랑노랑

2023-07-29 03:19:01

WDXL 기다린다 흡

펼쳐보기▼

포리X

2023-07-29 04:17:29

톤배

2023-07-29 12:26:59

탐9생활

2023-07-29 14:02:49

thec

2023-07-30 04:40:22

Durume

2023-07-30 14:48:04

SDXL이 실사용이고 WDXL이 2D용인건가?

펼쳐보기▼

포리X

2023-07-30 23:04:59

SDXL = 튜닝되지 않은 범용 모델. 모델 성향 자체는 실사용이지만 LoRA 도움 없이는 약간 무리가 있다는 평가.
WDXL = SDXL를 2D용으로 튜닝한 모델. SDXL 1.0을 튜닝한 WDXL는 아직 안나욤.

펼쳐보기▼

Durume

2023-07-31 07:35:23

오 감사합니다

펼쳐보기▼

ㅇㅇ

2023-07-31 11:18:18

그래요

2023-07-31 12:35:23

새로 바뀐 ui에서 repeat 어디서 지정해요? 예전엔 폴더 설정할때 바꿨는데요

펼쳐보기▼

포리X

2023-07-31 14:40:36

img 폴더안에서 폴더 만들때 첫번째 숫자가 repeat으로 폴더 이름을 6_iom style 으로 한다면 6이 repeat.

펼쳐보기▼

ㅇㅇ

2024-01-29 10:01:42

이번에 fp8 학습이 생겼는데 4070으로 1024할려면 bf16 설정을 그냥 fp8로만 바꾸면 되나요?

펼쳐보기▼

포리X

2024-01-29 10:03:33

4070이나 4070ti이나 같은 12GB라서 본문에서 말하듯이 full bf16 설정에서 fp8 설정을 "추가" 하면됨. full bf16 빼면 일부 연산 과정이 fp32가 될 수 있음.

펼쳐보기▼

ㅇㅇ

2024-01-29 10:04:16

포리X

2024-01-29 10:07:05

아 이글이 아니었구나. fp8은 이것을 참고하면 좋음. https://arca.live/b/hypernetworks/97739758

펼쳐보기▼

에반게리온

2024-01-29 10:04:15

*수정됨

막짤 시오리코 인줄

펼쳐보기▼

포리X

2024-01-29 10:04:44

에반게리온

2024-01-29 10:04:58

시오리코가 아니었어?

펼쳐보기▼

포리X

2024-01-29 10:05:43

아 댓글이 수정되었네. 시오리코 맞음. 그런데 Animagine XL V3에서는 LoRA 없이 모델 깡성능으로 어느정도 나옴.

펼쳐보기▼

에반게리온

2024-01-29 10:06:27

아 animagine 에 없는 캐 뽑을려고

펼쳐보기▼

포리X

2024-01-29 10:07:54

그렇다면 최근에 fp8 기능이 추가되었으니 이 글을 참고하면 좋음. https://arca.live/b/hypernetworks/97739758

펼쳐보기▼

에반게리온

2024-01-29 10:09:14

로라 데이터셋 어떻게 모으는지도 모르는...

펼쳐보기▼

포리X

2024-01-29 10:11:21

사진은 단부루 갤부루 픽시브 등등 사진 많은곳에서 직접 긁어오면 됨.

펼쳐보기▼

에반게리온

2024-01-29 10:11:57

애니메이션 짤을 쓰는건 안되지?

펼쳐보기▼

포리X

2024-01-29 10:15:02

안될건 없지만 화질이 조금이라도 떨어지면 품질 저하를 각오해야하고, 그것만 쓰면 그림체가 그렇게 될 수 있음.

펼쳐보기▼

에반게리온

2024-01-29 10:15:52

옛날애니라 화질 떨어질거같네
쨌든 고마워!

펼쳐보기▼

에반게리온

2024-01-29 10:09:51

https://arca.live/b/aiart/84182288
이거 참고해도됨?

펼쳐보기▼

포리X

2024-01-29 10:11:00

과라무이

2024-01-31 11:42:46

감사합니다... 보고 따라해볼게요

펼쳐보기▼

sdklo02

2024-02-13 13:48:56

이렇게 메세지가 뜨면 2 입력<<<<
설치를 하다보면 accelerate config으로 진입할건데
This machine [엔터]
No distributed training [엔터]
NO [엔터] - 기본값이 NO 엔터만 쳐도 됨!
NO [엔터] 
NO [엔터] 
all  [입력] 
fp16 [숫자 1 눌러서 선택 후 엔터]

1번 입력하는곳까지는 되는데 2 입력하는곳부터 막힙니다 ㅠ 2입력하는 문구가 나오지않고 1번 입력하는 화면으로 반복이되네요 그래서 다음 단계로 진행이 안되는데 
kohya_ss 폴더 안의 gui.bat 실행<< 이거는 실행이 됩니다 제대로 설치가 된것일까요?

펼쳐보기▼

포리X

2024-02-13 14:02:59

버전 업데이트로 달라진거 같은데 최신 kohya_ss 문서를 참고하여 설치할것.

펼쳐보기▼

ㅇㅇ

2024-04-01 06:44:31

예전 sd1.5 학습때는 텍스트 인코더를 unet lr 절반값이나 1/10 값으로 설정하는게 좋다했는데
1:1로 사용하는 이유가 혹시있음?

펼쳐보기▼

포리X

2024-04-01 07:47:23

*수정됨

이 가이드가 SDXL 초창기에 작성된 거라서 이유가 없음. LR값 수정도 필요하고 정보 업데이트가 필요하긴함.

펼쳐보기▼

ㅇㅇ

2024-04-01 08:02:33

루민이

2024-04-21 15:19:04

선생님 총스텝수 공식에서 배치사이즈는 나누기로 들어가는거 아닌가요? 곱으로 하나요?

펼쳐보기▼

포리X

2024-04-21 15:24:41

"총" 스텝수는 곱하기가 맞음.

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 정보 그림 드림부스 임베딩 하이퍼

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28098116

공지 파딱 마음대로 작성한 AI그림 학습 채널 규정 - [24-01-24]

포리X 2023.10.29 1977

공지 [리퀘스트] 탭이 추가되었습니다.

선한_하얀_사자 2023.02.10 3375

공지 신문고

Anon 2023.02.21 3167

공지 각종 학습파일 적용법

거만한_보라_달팽이 2023.01.24 39285

공지 그림 학습법 모음

거친_핑크_외계인 2022.10.30 72283

숨겨진 공지 펼치기(1개)

488 이미지 한장으로 학습 & 영상뽑기 (roop-unleashed) [13]

ㅇㅇ 2024.04.19 1301 11

487 정보 아주 간단한 underfit, overfit 판단 방법 [5]

Dalcefo 2024.04.16 741 9

486 정보 뉴비가 쓰는 데이터셋 50장 미만으로 로라 만드는 법 [6]

ㅇㅇ 2024.04.12 1960 35

485 정보 챈이 반 죽어서 쓰는 학습률 설명 [3]

딸기맛봇치 2024.02.29 1841 9

484 정보 Stable Cascade kohya_ss LoRA CUI 학습 사용법 [19]

포리X 2024.02.20 2035 6

483 나도 AI출력물로 AI학습해봤는데 [6]

비비빛 2024.02.14 2047 12

482 정보 인텔 Arc A770 16GB SDXL 학습 간단 후기 [14]

포리X 2024.01.30 1318 5

481 Animagine XL V3와 Pony Diffusion V6 XL의 캐릭터 학습 간단 후기 [15]

포리X 2024.01.21 1911 5

480 정보 webui 1.7.0 버전 wd tagger 속도 빠르게 하는방법 [4]

유찌 2024.01.17 1326 6

479 정보 Text Encoder 학습도 고려해볼만 한 것 같음 [8]

Rainfrog 2024.01.06 1152 5

478 그림 sakifox 작가 Gosuzun 로라 만들어 봄 [1]

ㅇㅇ 2024.01.09 1262 5

477 정보 AI 출력물로 학습데이터 재활용 4 [2]

몬TDAI 2023.12.20 1862 5

476 정보 공지에 있는 로라 학습법에 오류가 있고, 공지대로 했으면 저사양로라를 쓰고 있는거임. [12]

바이오틴 2023.12.13 2040 10

475 정보 아래 의상 학습한사람이 쓴 의상학습법 [6]

ai 2023.11.07 1763 6

474 정보 자료가적은 학습 방법 (1장+) [5]

ai 2023.11.08 3740 11

473 정보 슬라이드 LoRA (복사기 LoRA)를 만드는 방법 [11]

포리X 2023.10.17 2521 11

472 SDXL 로라 성능 걍 미쳤음 [23]

Rainfrog 2023.08.16 5011 6

471 정보 로라 학습법의 모든 것. [8]

serina 2023.08.19 13536 13

470 정보 KOHYA_SS 에서 triton 에러 메세지 제거 방법 [11]

엑시옴 2023.08.15 1804 11

469 정보 SDXL 1.0 kohya_ss LoRA GUI 학습 사용법 (12GB VRAM 기준) [37]

포리X 2023.07.29 11346 7

468 정보 로라 학습 코랩 사용법 (초보 대상) (+ 학습 코랩 한글화 공유) [11]

해머임팩트 2023.07.17 3400 12

467 정보 [실사로라6|심화학습5] weighted caption은 진짜 효과가 있나? [8]

엑시옴 2023.07.10 2769 5

466 정보 SDXL 0.9/1.0 kohya_ss LoRA CUI 학습 사용법 (12GB VRAM 기준) [5]

포리X 2023.07.11 3027 5

465 [실사로라7|응용학습1] 그림 한 장으로 로라 만드는 과정 [11]

엑시옴 2023.07.07 4611 10

464 하이퍼 요즘 뜬금없이 하이퍼네트워크 질문이 늘어나고 있네 [1]

포리X 2023.06.13 1541 9

463 [실사로라5|심화학습4] clip skip은 얼마로 로라를 만들어야 할까? [13]

엑시옴 2023.06.06 2433 9

462 [실사로라2|심화학습1] Train batch size - 배치를 올리면 Learning rate를 같이 올려야 한다고?응 맞아. [19]

엑시옴 2023.05.31 2258 6

461 정보 [실사로라3|심화학습2] 데이터 가공과 퀄 [19]

엑시옴 2023.06.02 6609 13

460 정보 [실사로라1|모든 과정] 실사로라 만드는 과정 전부 - xRica 님의 실사로라 캠페인 참여 [26]

엑시옴 2023.05.28 14051 21

459 정보 BRA v5 모델이 실사로라의 베이스 모델로 아주 좋음 [17]

엑시옴 2023.05.19 4175 10

458 정보 코이카츠 그림체 lora를 통한 자캐 lora 학습 단순화 [4]

ㅇㅇ 2023.04.23 3766 11

457 정보 civitai에 올라온 로라 학습법 [11]

ai 2023.04.19 13681 16

456 로라 블록 (혹은 레이어) 학습 - 필요한 것만 중점적으로 학습시킬 수 있을 지 [15]

엑시옴 2023.04.15 2459 5

455 정보 학습 모델 5개 비교 [7]

머팔로 2023.04.05 5573 7

454 LORA 학습을 위한 KOHYA가 업데이트 되면서 특정 블록만을 지정해서 학습시킬 수 있다고 하는 데, HOXY 해보신 분? [23]

엑시옴 2023.04.05 4117 14

453 정보 학습 해상도 차이 및 태그 정제 유무 비교 [20]

머팔로 2023.04.01 5341 19

452 정보 누군가는 궁금할 수 있었던 그 그림체 로라 학습세팅 [16]

까나리아 2023.03.31 6590 13

451 정보 로라 학습 간단 팁 - 1 [10]

asde31c 2023.03.26 8448 10

450 장사꾼들은 좀 꺼져라 [4]

Anon 2023.03.22 2949 22

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.