수천장급 데이터셋을 사용하여 여러 캐릭터 수록 LoRA 제작 후기

AI그림 학습 채널

알림 알림 중 알림 취소

구독자 8769명 알림수신 123명 @Anon

그림 AI 학습 정보를 공유하는 채널

Lora 수천장급 데이터셋을 사용하여 여러 캐릭터 수록 LoRA 제작 후기

포리X

추천 5 비추천 0 댓글 15 조회수 1082 작성일 2024-02-22 10:21:27 수정일 2024-02-23 00:30:51

https://arca.live/b/hypernetworks/99616396

Stable Cascade을 위한 아니메 스타일 학습용 데이터셋을 찾아보다가, 용량이 1/5로 줄어든 danbooru2023 데이터셋 (https://huggingface.co/datasets/KBlueLeaf/danbooru2023-webp-2Mpixel)이 있다고 하길레 다운받아봄.

1/5로 작아지긴 하지만 7백만장의 사진이 들어있는 데이터셋답게 1.4 TB라는 용량을 자랑하니 다운로드 하는 경우 저장공간과 네트워크 부하를 대비하는 것이 좋음. 또한 해당 데이터셋은 0번부터 1177번까지만 들어 있어서 1178번 부터 1999번 까지는 원본 danbooru2023 데이터셋(https://huggingface.co/datasets/nyanko7/danbooru2023/tree/main/recent)에서 다운받아야함. 다행인건 1000번부터 1999번은 추가 데이터라서 용량이 크지 않음.

그런데 이런것을 2000개 다운로드 해야하는데, 여러가지 방법이 있지만 나는 파이썬 huggingface_hub 라이브러리를 사용하여 다운로드 받았음. 해당 데이터셋의 설명에서는 Webdataset로 로드하면 된다고 하지만 이건 대규모 파인튜닝 데이터셋 규격이라서 사용 용도에 맞지 않는 경우 알아서 알맞은 가공이 필요함.

https://huggingface.co/datasets/KBlueLeaf/danbooru2023-sqlite

그리고 해당 데이터셋에는 캡션 파일이 없고 메타데이터가 담긴 데이터베이스 데이터셋이 따로 제공됨. 데이터베이스 데이터셋에서 제공되는 https://huggingface.co/datasets/KBlueLeaf/danbooru2023-sqlite/blob/main/db.py 같은거 참고해서 데이터베이스에서 알아서 꺼내 쓰라는 이야기임.

그래서 대충 날림으로 danbooru2023 로컬 데이터셋 시스템 구축을 성공함. 7백만장을 그대로 넣어 파인튜닝하는 목적은 아니고 조잡하긴 하지만 특정 조건을 지정해두면 거기에 맞는 데이터를 찾아주고 지정된 조건에 맞춰 캡션을 작성하고 데이터셋으로 만들어주는 정도임. 그렇게 2500장 유루캠 데이터셋 하고 5000장 뱅드림 데이터셋을 만들어서 다중 캐릭터 LoRA 학습을 시도해봄.

퀄리티 관련 메타데이터를 활용하지 않아 저품질 이미지를 거르지 않았으니 품질은 개판이고 캡션은 ichigaya arisa, bang dream!, sensitive 처럼 아주 간단하게 되어 있음. 텍스트 인코더 학습을 하는 대신 fp8_base 세팅을 사용함. 학습은 포니에서 했고 생성은 포니 기반 모델에서 진행.

대형 데이터셋으로 학습된 유루캠 LoRA를 사용하는 경우 카가미하라 나데시코

LoRA가 없는 경우 같은 세팅

대형 데이터셋으로 학습된 유루캠 LoRA를 사용하는 경우 시마 린

LoRA가 없는 경우 같은 세팅

대형 데이터셋으로 학습된 뱅드림 LoRA를 사용하는 경우 아오바 모카

LoRA가 없는 경우 같은 세팅

대형 데이터셋으로 학습된 뱅드림 LoRA를 사용하는 경우 하자와 츠구미

LoRA가 없는 경우 같은 세팅

데이터셋의 품질을 생각하면 의외의 결과였음. 1개의 LoRA에 여러명이 잘 들어가서 작동하고 품질도 그럭저럭 나쁘지 않음. 물론 데이터셋에서 차지하는 비중이 적은 캐릭터는 안되지만 그래도 데이터셋 품질에 신경쓰면 꽤 괜찮은 품질이 나올것으로 생각해봄.

끝

ㅇㅇ

2024-02-22 10:25:43

포리X

2024-02-23 00:31:35

딸기맛봇치

2024-02-22 13:04:33

나도 하드 하나 사야되는데... 저거 담을 생각하니 가슴이 답답함ㅋㅋㅋㅋ
그리고 데이터셋 메이커는 이미 코하쿠가 구축해놨더라... https://github.com/KohakuBlueleaf/HakuBooru

GitHub

GitHub - KohakuBlueleaf/HakuBooru: text-image dataset maker for anime-style images

text-image dataset maker for anime-style images. Contribute to KohakuBlueleaf/HakuBooru development by creating an account on GitHub.

나도 하드 하나 사야되는데... 저거 담을 생각하니 가슴이 답답함ㅋㅋㅋㅋ
그리고 데이터셋 메이커는 이미 코하쿠가 구축해놨더라... https://github.com/KohakuBlueleaf/HakuBooru

펼쳐보기▼

포리X

2024-02-22 13:14:36

오 나중에 여유가 생기면 2TB SSD 구입해서 저걸로 구축해봐야겠네.

펼쳐보기▼

딸기맛봇치

2024-02-22 13:17:14

2테라 ssd 25만 넘겼지 않음? 하드로는 접근속도때문에 잘 안 되려나

펼쳐보기▼

포리X

2024-02-22 13:34:56

*수정됨

얼마나 좋은 제품인가에 따라 다르겠지만 저렴한 기종은 20만원도 안함. 물론 저렴한건 품질이 좋지 않겠지만 그래도 HDD 보다는 빠르겠지. HDD가 보통 150MB/s 이지만 SSD는 SATA 모델이 500MB/s 이고 다른건 그 이상임.

현생 시스템은 1TB HDD 2개로 사용하고 있는데 파이썬 기본 tarfile 라이브러리에서 tar 리스트를 호출하고자 하면 개당 1GB가 넘는 tar를 전체 로드하려고 해서 결국 tar 뜯어서 쓰고 있음. HakuBooru는 소스코드를 보아 tarfile 쓰네... HakuBooru도 tar 전체 로드를 한다면 SSD로 구축해야함.

펼쳐보기▼

요어다둘

2024-02-22 14:10:47

포리X

2024-02-23 00:06:22

ㅇㅇ

2024-02-22 14:39:55

포리X

2024-02-23 00:06:31

그래요

2024-02-23 00:14:07

실사도 로라 만들어 보니 sdxl보다 학습이 더 잘되는 기분인데 플라시보인지 아닌지 모르겠어요 단점은 실사는 전신샷처럼 얼굴크기가 작아지면 얼굴 디테일이 뭉개져 버리는데 restore face나 detailer가 없어서

펼쳐보기▼

포리X

2024-02-23 00:21:45

아마도 SC 베이스 모델 퍼포먼스 때문일지도?

펼쳐보기▼

어느날갑자기

2024-02-26 12:02:06

*수정됨

혹시 수천장급이면 에포치, 리피트은 어떻게 설정함?
데이터 셋이 적을 땐 다 곱해서 3000~5000 정도 맞추는 걸로 아는데
수천장이면 리피트 1에 에포치 적당히 주나?

펼쳐보기▼

포리X

2024-02-26 12:49:03

ㅇㅇ 추천 에포크는 2~4 정도. 너무 성급하게 학습이 된다고 생각하면 LR을 낮춰볼것.

펼쳐보기▼

어느날갑자기

2024-02-27 13:04:21

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 정보 그림 드림부스 임베딩 하이퍼

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 27819024

공지 파딱 마음대로 작성한 AI그림 학습 채널 규정 - [24-01-24]

포리X 2023.10.29 1883

공지 [리퀘스트] 탭이 추가되었습니다.

선한_하얀_사자 2023.02.10 3338

공지 신문고

Anon 2023.02.21 3134

공지 각종 학습파일 적용법

거만한_보라_달팽이 2023.01.24 39028

공지 그림 학습법 모음

거친_핑크_외계인 2022.10.30 71775

숨겨진 공지 펼치기(1개)

488 이미지 한장으로 학습 & 영상뽑기 (roop-unleashed) [13]

ㅇㅇ 2024.04.19 888 11

487 정보 아주 간단한 underfit, overfit 판단 방법 [4]

Dalcefo 2024.04.16 544 9

486 정보 뉴비가 쓰는 데이터셋 50장 미만으로 로라 만드는 법 [6]

ㅇㅇ 2024.04.12 1536 35

485 정보 챈이 반 죽어서 쓰는 학습률 설명 [3]

딸기맛봇치 2024.02.29 1716 9

484 정보 Stable Cascade kohya_ss LoRA CUI 학습 사용법 [19]

포리X 2024.02.20 1912 6

483 나도 AI출력물로 AI학습해봤는데 [6]

비비빛 2024.02.14 1942 12

482 정보 인텔 Arc A770 16GB SDXL 학습 간단 후기 [14]

포리X 2024.01.30 1275 5

481 Animagine XL V3와 Pony Diffusion V6 XL의 캐릭터 학습 간단 후기 [15]

포리X 2024.01.21 1740 5

480 정보 webui 1.7.0 버전 wd tagger 속도 빠르게 하는방법 [4]

유찌 2024.01.17 1286 6

479 정보 Text Encoder 학습도 고려해볼만 한 것 같음 [8]

Rainfrog 2024.01.06 1124 5

478 그림 sakifox 작가 Gosuzun 로라 만들어 봄 [1]

ㅇㅇ 2024.01.09 1229 5

477 정보 AI 출력물로 학습데이터 재활용 4 [2]

몬TDAI 2023.12.20 1831 5

476 정보 공지에 있는 로라 학습법에 오류가 있고, 공지대로 했으면 저사양로라를 쓰고 있는거임. [12]

바이오틴 2023.12.13 2002 10

475 정보 아래 의상 학습한사람이 쓴 의상학습법 [6]

ai 2023.11.07 1737 6

474 정보 자료가적은 학습 방법 (1장+) [5]

ai 2023.11.08 3678 11

473 정보 슬라이드 LoRA (복사기 LoRA)를 만드는 방법 [11]

포리X 2023.10.17 2466 11

472 SDXL 로라 성능 걍 미쳤음 [23]

Rainfrog 2023.08.16 4961 6

471 정보 로라 학습법의 모든 것. [8]

serina 2023.08.19 13288 13

470 정보 KOHYA_SS 에서 triton 에러 메세지 제거 방법 [11]

엑시옴 2023.08.15 1794 11

469 정보 SDXL 1.0 kohya_ss LoRA GUI 학습 사용법 (12GB VRAM 기준) [37]

포리X 2023.07.29 10962 7

468 정보 로라 학습 코랩 사용법 (초보 대상) (+ 학습 코랩 한글화 공유) [11]

해머임팩트 2023.07.17 3340 12

467 정보 [실사로라6|심화학습5] weighted caption은 진짜 효과가 있나? [8]

엑시옴 2023.07.10 2748 5

466 정보 SDXL 0.9/1.0 kohya_ss LoRA CUI 학습 사용법 (12GB VRAM 기준) [5]

포리X 2023.07.11 2997 5

465 [실사로라7|응용학습1] 그림 한 장으로 로라 만드는 과정 [11]

엑시옴 2023.07.07 4551 10

464 하이퍼 요즘 뜬금없이 하이퍼네트워크 질문이 늘어나고 있네 [1]

포리X 2023.06.13 1535 9

463 [실사로라5|심화학습4] clip skip은 얼마로 로라를 만들어야 할까? [13]

엑시옴 2023.06.06 2416 9

462 [실사로라2|심화학습1] Train batch size - 배치를 올리면 Learning rate를 같이 올려야 한다고?응 맞아. [19]

엑시옴 2023.05.31 2223 6

461 정보 [실사로라3|심화학습2] 데이터 가공과 퀄 [19]

엑시옴 2023.06.02 6550 13

460 정보 [실사로라1|모든 과정] 실사로라 만드는 과정 전부 - xRica 님의 실사로라 캠페인 참여 [26]

엑시옴 2023.05.28 13904 21

459 정보 BRA v5 모델이 실사로라의 베이스 모델로 아주 좋음 [17]

엑시옴 2023.05.19 4133 10

458 정보 코이카츠 그림체 lora를 통한 자캐 lora 학습 단순화 [4]

ㅇㅇ 2023.04.23 3754 11

457 정보 civitai에 올라온 로라 학습법 [11]

ai 2023.04.19 13533 16

456 로라 블록 (혹은 레이어) 학습 - 필요한 것만 중점적으로 학습시킬 수 있을 지 [15]

엑시옴 2023.04.15 2441 5

455 정보 학습 모델 5개 비교 [7]

머팔로 2023.04.05 5541 7

454 LORA 학습을 위한 KOHYA가 업데이트 되면서 특정 블록만을 지정해서 학습시킬 수 있다고 하는 데, HOXY 해보신 분? [23]

엑시옴 2023.04.05 4090 14

453 정보 학습 해상도 차이 및 태그 정제 유무 비교 [20]

머팔로 2023.04.01 5303 19

452 정보 누군가는 궁금할 수 있었던 그 그림체 로라 학습세팅 [16]

까나리아 2023.03.31 6557 13

451 정보 로라 학습 간단 팁 - 1 [10]

asde31c 2023.03.26 8392 10

450 장사꾼들은 좀 꺼져라 [4]

Anon 2023.03.22 2938 22

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.