SDXL 0.9/1.0 kohya_ss LoRA CUI 학습 사용법 (12GB VRAM 기준)

AI그림 학습 채널

알림 알림 중 알림 취소

구독자 8788명 알림수신 125명 @Anon

그림 AI 학습 정보를 공유하는 채널

정보 SDXL 0.9/1.0 kohya_ss LoRA CUI 학습 사용법 (12GB VRAM 기준)

포리X

추천 6 비추천 1 댓글 5 조회수 3026 작성일 2023-07-11 17:42:39 수정일 2023-07-27 22:40:49

https://arca.live/b/hypernetworks/80857931

2023년 7월 27일 SDXL 1.0 업데이트 수정

GUI가 아니라서 절망스럽겠지만 SDXL kohya_ss LoRA CUI 학습 사용법임.

1.0 기준으로 1.1 이후의 미래에는 달라질 수 있음. 일부 설치 사용법은 https://arca.live/b/aiart/68205055 에서 긴빠이 해옴.

1. 필요한 것

- 권장 VRAM 12GB 이상 NVIDIA 그래픽 카드 (1024,1024)

- 최소 VRAM 8GB 이상 NVIDIA 그래픽 카드 (768,768)

- 라데온은 윈도우에서 불가능함. 리눅스라면 방법이 좀 다르지만 가능할지도?

- Windows 10/11

- 리눅스에서 설치는 가능하나 방법이 좀 다름.

- python 3.10 하고 git

- 설치 시 PATH 환경 변수 추가 하기.

- stable diffusion WebUI (automatic1111 또는 vladmandic)

- WD Tagger 1.4 https://github.com/yjunej/stable-diffusion-webui-wd14-tagger

- ComfyUI

- 학습할 데이터셋 (리사이징 안 해도 된다고 함, 학습할 해상도보다 크기만 하면 됨)

- 관련 지식 (원 클릭, 세 줄 요약, 기본 설명 그런 거 없다)

https://github.com/kohya-ss/sd-scripts/tree/sdxl 을 기반으로 설명할 것임

2. 설치

먼저 설치할 곳에서 파워쉘을 열어야한다. Shift + 우클릭 한 다음 여기에 Powershell 창 열기를 선택하면 창이 열림.

그런 다음 git clone https://github.com/kohya-ss/sd-scripts -b sdxl 입력. 그럼 sd-scripts 폴더가 생겼을거임.

그런 다음 cd sd-scripts 입력. 팁을 하나 주자면 sd 까지만 입력하고 TAB 키를 누르면 자동완성 해주기도 한다.

그런 다음 python -m venv venv 입력해서 가상환경 만들고

그런 다음 .\venv\Scripts\activate 입력해서 가상환경에 진입한다.

그런 다음 pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 입력하고

그런 다음 pip3 install --upgrade -r requirements.txt 입력하고

그런 다음 pip3 install xformers==0.0.20 입력해서 이것저것 설치한다.

bitsandbytes_windows 설치는 생략한다. 다른 optimizer 사용으로 bitsandbytes를 사용하지 않을것이다.

그런 다음 accelerate config 입력하고

This machine [엔터]

No distributed training [엔터]

NO [엔터] - 기본값이 NO 엔터만 쳐도 됨!

NO [엔터]

all [입력]

fp16 [숫자 1 눌러서 선택 후 엔터]

sd-scripts에 있는 PowerShell 창은 닫을 필요는 없음. 닫았다면 sd-scripts 폴더에서 Shift + 우클릭 한 다음 여기에 Powershell 창 열기를 선택한 다음 .\venv\Scripts\activate로 다시 실행하면 됨.

3. 데이터셋 태깅하기.

그림체 학습인 경우에는 태깅을 권장하지 않음.

데이터셋을 아직 구하지 못했다면 픽시브 단부루 구글 기타등등 알잘딱 구해놓 길 바람. 그리고 데이터셋만 잘 구하면 학습은 잘된다. 데이터셋을 목적에 맞게 잘 수집하길 바람. 잘 구하는 방법은 너무 길어서 여따 적진 않을거임.

잠시 WebUI를 키고 확장기능을 다운 받는다. https://github.com/yjunej/stable-diffusion-webui-wd14-tagger

혹시 설치 안 했으면 설치해라. 설치하고 webui 재시작. 인풋 이미지 경로에 너가 모아둔 이미지 파일들 경로 적어두고 밑에 설정에 두 개 체크한 다음에, 가중치는 0.35가 적절한데 바꾸고 싶으면 바꾸든가 해라. 높을수록 더 정확한 태그만 붙여줌. 설정 다 했으면 interrogate 누르면 끝. 이제 WebUI는 꺼도 됨. 태깅 끝.

4. 학습 설정

GUI 버전과 다르게 CUI 버전은 toml 파일을 만들어서 진행해야한다. 이 세팅은 아직 정확한 세팅이 아니니 참고.

메인 설정의 toml 파일과 데이터셋 설정용 toml 파일 총 두개의 toml 파일을 만들어야 한다.

toml 파일에는 \ 또는 역슬래시 문자가 들어가면 안됨.

일단 메인 toml 파일. 대충 이렇게 생겼다.

pretrained_model_name_or_path = "C:/dos/sdxl/sd_xl_base_1.0.safetensors"

dataset_config = "C:/dos/sdxl/data.toml"

output_dir = "C:/dos/sdxl/sdxl"

output_name = "sdxl"

resolution = "1024,1024"

train_batch_size = 4

max_train_steps = 500

enable_bucket = true

bucket_no_upscale = true

full_bf16 = true

save_model_as = "safetensors"

optimizer_type = "adafactor"

optimizer_args = [ "scale_parameter=False", "relative_step=False", "warmup_init=False" ]

lr_scheduler = "constant_with_warmup"

lr_warmup_steps = 100

learning_rate = 0.0002

no_half_vae = true

xformers = true

mixed_precision = "bf16"

save_precision = "bf16"

cache_latents = true

cache_text_encoder_outputs = true

gradient_checkpointing = true

save_every_n_epochs = 1

network_train_unet_only = true

min_timestep = 0

max_timestep = 1000

network_module = "networks.lora"

pretrained_model_name_or_path는 sd_xl_base_1.0.safetensors이 있는 절대 위치를 입력해줘야 한다.

dataset_config는 데이터셋 설정용 toml이 있는 절대 위치를 입력해줘야 한다.

output_dir는 LoRA 파일이 저장되는 위치.

output_name는 LoRA 파일 이름.

resolution는 학습 해상도. VRAM 8GB이라면 768,768로 변경해야한다.

train_batch_size는 배치 사이즈. VRAM 8GB이라면 1로 변경해야한다.

max_train_steps는 정지하는 시점의 스텝. 주의할것은 GUI 버전하고 다르게 CUI 버전의 총 스텝수는 max_train_steps에 train_batch_size를 곱한 수이다. 안그러면 바짝 타버린 LoRA가 나올 수 있다.

이 이하의 세팅값들은 나도 잘 모름. 다만 learning_rate는 대충 눈 감고 고른거니 참고.

그런 다음 데이터셋 설정용 toml. 대충 이렇게 생겼다.

[[datasets]]

[[datasets.subsets]]

image_dir = 'C:/dos/sdxl/ika'

class_tokens = 'anime ikamusume 1girl'

num_repeats = 5

caption_extension = ".txt"

image_dir는 데이터셋이 있는 위치. 주의할것은 GUI 버전하고 다르게 CUI 버전은 이미지가 들어있는 폴더를 지정해야한다.

class_tokens는 이 데이터셋에 대한 설명.

num_repeats는 리피트. 대충 에포크가 10을 넘지 않도록 설정한다. (max_train_steps x train_batch_size) ÷ (num_repeats x 데이터셋 이미지수 수) 의 올림 수치가 에포크 수이다.

caption_extension은 캡션 파일 확장자.

이렇게 텍스트 파일을 만든 다음 확장자를 .toml로 저장하자. 여기서는 메인 toml 파일을 C:\dos\sdxl\run.toml 로 저장했고 데이터셋 설정용 toml을 C:\dos\sdxl\data.toml 으로 저장했다.

5. 학습 가동

닫았다면 sd-scripts 폴더에서 Shift + 우클릭 한 다음 여기에 Powershell 창 열기를 선택한 다음 .\venv\Scripts\activate로 다시 실행하면 됨.

sd-scripts에 있는 PowerShell 창에 아래처럼 입력한다.

accelerate launch sdxl_train_network.py --config_file="C:\dos\sdxl\run.toml"

정상적으로 가동되면 평소처럼 학습을 진행할거임. 그래픽카드 성능에 따라 30분에서 2시간 정도 걸릴 수 있음.

loss=값에 nan 안뜨면 잘 되고 있는것이고 nan 뜨면 망한거임.

6. LoRA 사용 방법

먼저 ComfyUI을 설치한 다음 실행하고 https://comfyanonymous.github.io/ComfyUI_examples/sdxl/ 의 사진을 다운로드 받은 다음 ComfyUI으로 드래그한다.

그런 다음 LoRA를 로드할 수 있도록 설정한다.

끝

SDXL 1.0 캐릭터 학습 결과물.

엑시옴

2023-07-12 02:17:29

자동좌가 뭘 업데이트 하는 것 같은데....

펼쳐보기▼

포리X

2023-07-12 05:30:36

webui AUTOMATIC1111 버전은 아직도 SDXL에 대해서 아무런 준비가 되어 있지 않아서 힘들거 같고 vladmandic 버전은 간이 지원 정도라서 당분간 강제로 ComfyUI 배워야할듯.

펼쳐보기▼

토르스톰

2023-07-12 02:53:17

kohya_ss에 이번에 추가되긴 했는데 기존이랑 셋팅법이 좀 다른거 같아서 일단 보류중...

펼쳐보기▼

포리X

2023-07-12 05:13:09

GUI는 뭘 해야할지 감이 안잡힘. 일부 프리셋들도 추가되고 있는데 NaN하고 OOM이 반겨줌.

펼쳐보기▼

ㅇㅇ

2023-07-12 11:57:53

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 정보 그림 드림부스 임베딩 하이퍼

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28094313

공지 파딱 마음대로 작성한 AI그림 학습 채널 규정 - [24-01-24]

포리X 2023.10.29 1976

공지 [리퀘스트] 탭이 추가되었습니다.

선한_하얀_사자 2023.02.10 3375

공지 신문고

Anon 2023.02.21 3167

공지 각종 학습파일 적용법

거만한_보라_달팽이 2023.01.24 39284

공지 그림 학습법 모음

거친_핑크_외계인 2022.10.30 72279

숨겨진 공지 펼치기(1개)

488 이미지 한장으로 학습 & 영상뽑기 (roop-unleashed) [13]

ㅇㅇ 2024.04.19 1297 11

487 정보 아주 간단한 underfit, overfit 판단 방법 [5]

Dalcefo 2024.04.16 741 9

486 정보 뉴비가 쓰는 데이터셋 50장 미만으로 로라 만드는 법 [6]

ㅇㅇ 2024.04.12 1957 35

485 정보 챈이 반 죽어서 쓰는 학습률 설명 [3]

딸기맛봇치 2024.02.29 1841 9

484 정보 Stable Cascade kohya_ss LoRA CUI 학습 사용법 [19]

포리X 2024.02.20 2035 6

483 나도 AI출력물로 AI학습해봤는데 [6]

비비빛 2024.02.14 2047 12

482 정보 인텔 Arc A770 16GB SDXL 학습 간단 후기 [14]

포리X 2024.01.30 1318 5

481 Animagine XL V3와 Pony Diffusion V6 XL의 캐릭터 학습 간단 후기 [15]

포리X 2024.01.21 1911 5

480 정보 webui 1.7.0 버전 wd tagger 속도 빠르게 하는방법 [4]

유찌 2024.01.17 1326 6

479 정보 Text Encoder 학습도 고려해볼만 한 것 같음 [8]

Rainfrog 2024.01.06 1152 5

478 그림 sakifox 작가 Gosuzun 로라 만들어 봄 [1]

ㅇㅇ 2024.01.09 1262 5

477 정보 AI 출력물로 학습데이터 재활용 4 [2]

몬TDAI 2023.12.20 1862 5

476 정보 공지에 있는 로라 학습법에 오류가 있고, 공지대로 했으면 저사양로라를 쓰고 있는거임. [12]

바이오틴 2023.12.13 2040 10

475 정보 아래 의상 학습한사람이 쓴 의상학습법 [6]

ai 2023.11.07 1763 6

474 정보 자료가적은 학습 방법 (1장+) [5]

ai 2023.11.08 3740 11

473 정보 슬라이드 LoRA (복사기 LoRA)를 만드는 방법 [11]

포리X 2023.10.17 2521 11

472 SDXL 로라 성능 걍 미쳤음 [23]

Rainfrog 2023.08.16 5010 6

471 정보 로라 학습법의 모든 것. [8]

serina 2023.08.19 13536 13

470 정보 KOHYA_SS 에서 triton 에러 메세지 제거 방법 [11]

엑시옴 2023.08.15 1802 11

469 정보 SDXL 1.0 kohya_ss LoRA GUI 학습 사용법 (12GB VRAM 기준) [37]

포리X 2023.07.29 11344 7

468 정보 로라 학습 코랩 사용법 (초보 대상) (+ 학습 코랩 한글화 공유) [11]

해머임팩트 2023.07.17 3400 12

467 정보 [실사로라6|심화학습5] weighted caption은 진짜 효과가 있나? [8]

엑시옴 2023.07.10 2769 5

466 정보 SDXL 0.9/1.0 kohya_ss LoRA CUI 학습 사용법 (12GB VRAM 기준) [5]

포리X 2023.07.11 3027 5

465 [실사로라7|응용학습1] 그림 한 장으로 로라 만드는 과정 [11]

엑시옴 2023.07.07 4611 10

464 하이퍼 요즘 뜬금없이 하이퍼네트워크 질문이 늘어나고 있네 [1]

포리X 2023.06.13 1541 9

463 [실사로라5|심화학습4] clip skip은 얼마로 로라를 만들어야 할까? [13]

엑시옴 2023.06.06 2433 9

462 [실사로라2|심화학습1] Train batch size - 배치를 올리면 Learning rate를 같이 올려야 한다고?응 맞아. [19]

엑시옴 2023.05.31 2257 6

461 정보 [실사로라3|심화학습2] 데이터 가공과 퀄 [19]

엑시옴 2023.06.02 6609 13

460 정보 [실사로라1|모든 과정] 실사로라 만드는 과정 전부 - xRica 님의 실사로라 캠페인 참여 [26]

엑시옴 2023.05.28 14049 21

459 정보 BRA v5 모델이 실사로라의 베이스 모델로 아주 좋음 [17]

엑시옴 2023.05.19 4175 10

458 정보 코이카츠 그림체 lora를 통한 자캐 lora 학습 단순화 [4]

ㅇㅇ 2023.04.23 3766 11

457 정보 civitai에 올라온 로라 학습법 [11]

ai 2023.04.19 13680 16

456 로라 블록 (혹은 레이어) 학습 - 필요한 것만 중점적으로 학습시킬 수 있을 지 [15]

엑시옴 2023.04.15 2458 5

455 정보 학습 모델 5개 비교 [7]

머팔로 2023.04.05 5572 7

454 LORA 학습을 위한 KOHYA가 업데이트 되면서 특정 블록만을 지정해서 학습시킬 수 있다고 하는 데, HOXY 해보신 분? [23]

엑시옴 2023.04.05 4116 14

453 정보 학습 해상도 차이 및 태그 정제 유무 비교 [20]

머팔로 2023.04.01 5341 19

452 정보 누군가는 궁금할 수 있었던 그 그림체 로라 학습세팅 [16]

까나리아 2023.03.31 6590 13

451 정보 로라 학습 간단 팁 - 1 [10]

asde31c 2023.03.26 8447 10

450 장사꾼들은 좀 꺼져라 [4]

Anon 2023.03.22 2948 22

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.