kohya_ss GUI fp8 학습 후기 - AI그림 학습 채널

AI그림 학습 채널

알림 알림 중 알림 취소

구독자 8806명 알림수신 126명 @Anon

그림 AI 학습 정보를 공유하는 채널

정보 kohya_ss GUI fp8 학습 후기

추천 3 비추천 0 댓글 22 조회수 1574 작성일 2024-01-28 20:02:31 수정일 2024-01-28 20:07:54

https://arca.live/b/hypernetworks/97739758

다른분이 옆챈에서 먼저 이 기능을 소개하긴 했는데, 여기에서는 글이 없어서 작성.

fp8 학습 기능은 최신 버전의 kohya_ss에서 추가된 기능이라고 함.

최신 버전의 kohya_ss GUI로 재설치 한 다음 기본 12GB VRAM용 Full bf16 세팅에서 새로 생긴 fp8 base training 딸깍하면 끝.

그렇게 돌려보면 2배치 기준 6.5GB로 나옴.

기존의 12GB VRAM용 Full bf16 세팅에서는 10.5~11.5GB로 나오니 상당히 VRAM 사용이 절감되고 이렇다면 8GB VRAM에서도 SDXL 학습이 가능해보임.

RTX 4060 8GB 구입할 돈으로 인텔 Arc A770 16GB 구입해서 8GB VRAM 테스트는 다른 사람이 해주겠지.

학습 속도는 bf16이랑 비슷하니 VRAM 부자는 불필요한 옵션일지도. fp8 추론에서도 속도는 비슷하거나 느리다고 보고되니 당연한 결과이긴 하지만.

간단하게 Animagine XL V3 Base로 캐릭터 학습을 해봤는데 데이터셋이 Animagine XL V3 입맛에 안맞았는지 그림체도 학습되었네. 이건 데이터셋 문제이니 학습 자체는 잘 된다고 봐야할지도. 캐릭터는 뱅드림의 아오바 모카.

Cache text encoder outputs 안쓰고 --network_train_unet_only 안써서 text encoder 학습까지 시도하면 2배치 기준 7.9~8.1GB로 보고됨.

12GB VRAM 그래픽카드에서는 Cache text encoder outputs 제약에서 벗어나서 다양한 학습 세팅을 할 수 있게 되었음.

댓글 [22]

2024-01-28 21:22:35

4090이라도 그라디언트 체크포인트 사용을 강제당하는 만큼 속도증가의 여지는 있어보임
이건 나중의 즐거움으로 남겨둬야지

펼쳐보기▼

2024-01-29 03:42:11

2024-01-29 01:22:44

오우 실험 감사

펼쳐보기▼

2024-01-29 03:42:22

2024-01-29 01:58:21

4096에서도 배치를 왕창 늘일 수 있어서 효과가 꽤 좋습니다.
기존 배치2에서 배치4로 늘릴 수 있어요. 소요시간이 많이 줄어듭니다. 결과물의 퀄도 나쁘지 않더군요.

펼쳐보기▼

2024-01-29 03:41:58

2024-01-29 03:00:13

xl넘어가면 써야겠구만

펼쳐보기▼

2024-01-29 03:42:38

2024-01-29 05:31:58

2024-01-29 09:37:04

2024-01-29 11:36:10

근데 업데이트할혀면 재설치 밖에 없음?

펼쳐보기▼

2024-01-29 11:41:03

git pull 하니까 되네

펼쳐보기▼

2024-01-29 11:44:38

실행이 안 되네..

펼쳐보기▼

2024-01-29 14:58:23

git pull 이후 재설치 해야함.

펼쳐보기▼

2024-01-29 12:17:02

이러면 gpu 램 널널해지는데 추천하는 세팅 있나요

펼쳐보기▼

2024-01-29 14:58:51

지금 사용중인 그래픽카드에 따라 다름.

펼쳐보기▼

2024-01-29 16:15:45

4070이에요

펼쳐보기▼

2024-01-29 22:47:07

그러면 기존의 12GB VRAM 세팅에서 Cache text encoder outputs 안쓰고 Shuffle caption 쓰고 정도인듯. --network_train_unet_only 제거는 선택사항.

펼쳐보기▼

2024-01-30 04:23:21

2024-01-30 16:40:31

2024-02-04 01:11:39

4080은 어떻게 세팅하면 좋을까요?

펼쳐보기▼

2024-02-06 12:25:03

4080이 없어서 정확한 답변은 어렵지만 Cache text encoder outputs 안쓰고 --network_train_unet_only 안써서 text encoder 학습까지 하면 될지도?

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 정보 그림 드림부스 임베딩 하이퍼

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28499406

공지 파딱 마음대로 작성한 AI그림 학습 채널 규정 - [24-01-24]

포리X 2023.10.29 2109

공지 [리퀘스트] 탭이 추가되었습니다.

선한_하얀_사자 2023.02.10 3440

공지 신문고

Anon 2023.02.21 3216

공지 각종 학습파일 적용법

거만한_보라_달팽이 2023.01.24 39665

공지 그림 학습법 모음

거친_핑크_외계인 2022.10.30 72925

숨겨진 공지 펼치기(1개)

270 정보 webui 1.9.3 버전에서 wd14 태거 에러 나는경우 해결방법 [4]

유찌 2024.05.16 212 5

269 정보 smooth loss, loss 차이와 중요성 [13]

YUNIYNUI 2024.04.18 476 4

268 정보 아주 간단한 underfit, overfit 판단 방법 [5]

Dalcefo 2024.04.16 947 9

267 정보 뉴비가 쓰는 데이터셋 50장 미만으로 로라 만드는 법 [8]

ㅇㅇ 2024.04.12 2544 35

266 정보 없데이트 0.8.7 [2]

몬TDAI 2024.04.07 564 1

265 정보 LyCORIS 2.2.0/post1에 DoRA쪽 구현 오류 있었음 [5]

딸기맛봇치 2024.03.16 236 1

264 정보 코랩 Hollowstrawberry SDXL Lora 학습 [5]

블랍 2024.03.15 775 2

263 정보 챈이 반 죽어서 쓰는 학습률 설명 [3]

딸기맛봇치 2024.02.29 2002 9

262 정보 dataset_config 인자로 짬뽕 학습셋 사용하기 [1]

몬TDAI 2024.02.29 336 2

261 정보 교육 가이드 2개 올라옴 [1]

요어다둘 2024.02.28 844 3

260 정보 stable diffusion 3가 나온다고 합니다 [1]

그래요 2024.02.23 913 1

259 정보 Stable Cascade kohya_ss LoRA CUI 학습 사용법 [19]

포리X 2024.02.20 2215 6

258 정보 kohya-ss Stable Cascade LoRA 학습 초기 지원 시작 [9]

포리X 2024.02.20 647 4

257 정보 kohya-ss 멀티 GPU 학습 관련 정보 [12]

포리X 2024.02.18 572 4

256 정보 학습 프로그램 원트레이너 [6]

니라라 2024.02.13 890 2

255 정보 코햐스크립트에는 공유비램 끄고 SD webUI에는 공유비램 쓰기

몬TDAI 2024.02.11 228 0

254 정보 gradient accumulation으로 배치사이즈를 사기쳐보자 [2]

딸기맛봇치 2024.02.03 339 2

253 정보 인텔 Arc A770 16GB SDXL 학습 간단 후기 [14]

포리X 2024.01.30 1405 5

252 정보 kohya_ss GUI fp8 학습 후기 [22]

포리X 2024.01.28 1575 3

251 정보 webui 1.7.0 버전 wd tagger 속도 빠르게 하는방법 [4]

유찌 2024.01.17 1385 6

250 정보 지포스 54X 드라이버 공유비램 설정 [1]

몬TDAI 2024.01.12 301 1

249 정보 로라 기술로 딥러닝 데이타 오그먼테이션 하기. [7]

뿌리골무 2024.01.09 486 4

248 정보 Text Encoder 학습도 고려해볼만 한 것 같음 [8]

Rainfrog 2024.01.06 1195 5

247 정보 오늘의 호작질 - Gradient checkpointing 비램절감 [3]

몬TDAI 2024.01.03 382 1

246 정보 kohya 버전 업+bf16으로 변경 이후 No module named 'bitsandbytes.cuda_setup.paths' 오류에 관하여 [2]

Durume 2023.12.28 865 4

245 정보 AI 출력물로 학습데이터 재활용 4 [2]

몬TDAI 2023.12.20 1922 5

244 정보 options.md 파일 (LoRA)

몬TDAI 2023.12.20 697 1

243 정보 공지에 있는 로라 학습법에 오류가 있고, 공지대로 했으면 저사양로라를 쓰고 있는거임. [12]

바이오틴 2023.12.13 2117 10

242 정보 Cache latents to disk

몬TDAI 2023.12.02 340 1

241 정보 웨이트 캡션 이야기 3 [1]

몬TDAI 2023.11.29 454 4

240 정보 웨이트 캡션 이야기 2 [2]

몬TDAI 2023.11.24 421 3

239 정보 웨이트 캡션 이야기 1 [16]

몬TDAI 2023.11.21 640 1

238 정보 ai그림으로 lora 학습시 노이즈 제거방법 [2]

척사박척 2023.11.20 767 0

237 정보 자료가적은 학습 방법 (1장+) [5]

ai 2023.11.08 3858 11

236 정보 아래 의상 학습한사람이 쓴 의상학습법 [6]

ai 2023.11.07 1808 6

235 정보 슬라이더 로라를 만드는 또다른 방법 - LECO [2]

이하비스 2023.11.03 533 3

234 정보 슬라이드 LoRA (복사기 LoRA)를 만드는 방법 [11]

포리X 2023.10.17 2570 11

233 정보 정규화이미지의 문제점 [3]

버카 2023.10.17 820 0

232 정보 빙 =달리3 디테일 쓰레기네 [4]

ghost 2023.10.12 495 0

231 정보 휴먼태거 with 자동번역 [2]

버카 2023.10.08 556 2

230 정보 로라 퀄리티 그지같이 나오는 경우 해결방법 [7]

폐급던전탐험가1 2023.09.29 1728 1

229 정보 알파 x LR x 스텝

몬TDAI 2023.09.24 631 0

228 정보 (추정임)학습 스탭 팁 [1]

furry 2023.09.15 1050 2

227 정보 kohya_ss gui 구버전 설치 후 버튼 먹통일 때 [2]

h_madoka 2023.09.16 522 1

226 정보 배치 올렸으면 LR도 올려라 [16]

몬TDAI 2023.09.09 1158 3

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.