Kohya_ss 얼굴 로라 만들기 -심화 과정-

AI 반실사 그림 채널

채널위키 알림 알림 중 알림 취소

구독자 45083명 알림수신 888명 @탐6생활

📷 실사체 AI그림. 이게 그림이라고?

🎓 정보 Kohya_ss 얼굴 로라 만들기 -심화 과정-

kakarot

추천 16 비추천 0 댓글 40 조회수 1723 작성일 2023-12-07 14:26:55 수정일 2023-12-07 15:45:22

https://arca.live/b/aiartreal/93474079

안녕하세요. kakarot 입니다.

이번에는 저의 Kohya_ss 얼굴 로라 만들기 마지막 단계인 -심화 과정- 을 진행 하겠습니다.

*본 글은 12.7일 Kohya_ss V22.0.1 기준으로 작성하였으며, 기술의 발전에 따라 결과는 달라질 수 있다.

*본 글은 본인의 개인적인 경험에 의한, 사견이 많이 들어가 있는 나의 테스트 과정을 적은 글이다.

*언제든지 이 글을 통하여, 잘못된 정보가 있거나 좀 더 좋은 방법이 있으면 피드백 해주길 바란다.

*지금까지의 과정 중에서 질문이나 문의사항은 본 글에서 하여도 괜찮다.

(본인이 아니여도 다른 분들께서 답변을 해주는 곳이 되었으면 한다.)

*이 글에서는 Text Encoder 학습률과와 Unet 학습률에 대해서는 다루지 않았다.

*참고된 자료의 모든 로라 가중치는 1이며, 네거티브 임베딩만 사용하였다.

그동안 즐거운 로라 만들기를 하였는가? 본 글은 나의 궁금증을 추상적인 개념과 나의 개인적인 사견으로 진행된다.

시작은 이렇다.

'로라 만들기는 너무 무겁다.'

왜?

하나의 로라를 만드는데 완성되는 시간이 너무 오래 걸리기 때문이다. 하나의 로라를 만들고 그에 따른 에포크(Epoch)를 진행 하면은

본인의 그래픽 카드(4070ti) 기준으로 많게는 1시간 40분 정도의 시간이 소요된다.(10~15 에포크)

(준비된 자료와 반복 학습이 많으면 시간은 더욱 늘어나게 된다.)

*파일 정제와 자료 수집까지하면 시간은 더욱 많이 늘어나게 된다. 이것은 모든 준비가 완료 되었을때의 기준이다.

1개의 이미지는 보통 100번의 반복 학습을 하면 충분히 완료가 된다고 한다. 그 이상의 반복 학습을 하게 되면, 너무 사소한 것까지 학습을 하기때문에

로라의 오염도가 늘어날 가능성이 높다.

그렇다면. 적은 반복 학습과 학습률, Network Rank&Alpha(성능을 높이는 기능) 그리고 다른 고급 설정들로 시간을 줄일 수는 없을까?

그렇게 시작하게 되었다.

*전문적인 용어보다는 우리가 아는 보다 친근한 것들로 설명을 진행한다.

네트워크 랭크와 알파 말고 또 다른 화질(또는 성능)을 높이는 설정 중에는 LR Scheduler와 Optimizer가 있다.

옵티마이저는 샘플러라고 생각하면 되고, 스케쥴러는 업스케일 종류라고 생각하면 편하다.

여러 옵티마이저가 있는데, 본인 그래픽 카드 기준으로는 작동되는 것이 없었다. DAdaptAdam이라고 좀 더 고품질로 만들 수 있게 한다고 하는데

최소 사용이 VRAM 6g이지만 본인의 그래픽 카드로는 작동이 되질 않았다.(4070ti VRAM 12g)

그래서 옵티마이저는 제일 안정성이 높은 AdamW8bit(기본 옵션)로 진행하였다.

스케쥴러는 크게 네 개가 있는데 본인 기준으로는 cosine이 (기본 옵션) 제일 무난하였으며, 판단은 개인의 판단에 맡긴다.

cosine	constant	linear	poly

constant도 많이 사용한다. 특유의 색감이 좋다.

반복 학습은 5번, 10번, 25번, 50번, 100번으로 테스트 하였다.

학습률의 진행은 0.0001부터 0.001, 0.01, 0.1, 1, 10, 50, 100으로 테스트 하였다.

네트워크 랭크는 64, 128, 256, 512로 테스트 하였다. (64로 진행된 테스트는 유의미한 결과값이 나오지 않았기때문에 포함하지 않았다.)

에포크는 2번의 에포크 설정으로 테스트 하였다.

총 94번의 테스트를 진행 하였고, 두 종류의 정제된 파일 묶음으로 진행 하였다. (밑에 사진에 나오는 12.5_test1과 12.5_face2)

12.5_face2는 test1로 어느정도의 확신을 가진 상태에서 확인하는 과정으로 진행되어 적은 수의 테스트를 하였다.

*face2 정제된 파일 묶음

face2) 반복 학습 100번 Network Rank&Alpha 128 학습률 0.0001 결과물(목표하는 결과값)

face2) 반복 학습 25번 Network Rank&Alpha 256 학습률 100 결과물

face2) 반복 학습 50번 Network Rank&Alpha 128 학습률 100 결과물

face2) 반복 학습 50번 Network Rank&Alpha 256 학습률 100 결과물

Network Rank&Alpha 512는 오염도가 많이 진행 되었고, 로라의 용량 또한 576메가 정도가 나오기 때문에 256를 최대치로 잡았다.

원본과 제일 비슷하게 나왔던 결과물은

반복 학습 50번 Network Rank&Alpha 128 학습률 100

반복 학습 50번 Network Rank&Alpha 256 학습률 100

으로 진행 하였을 때 반복 학습 100번 Network Rank&Alpha 128 학습률 0.0001로 진행 하였을때의 결과물과 비슷하게 나왔다.

자료가 적고, 특색이 강하지가 않기 때문에 위에 설정으로 하였을때의 결과 값은 달라질 수 있다.

본인이 찾은 적은 반복 학습으로 원본(반복 학습 100번 Network Rank&Alpha 128 학습률 0.0001 결과물)과 비슷하게 만들 수 있는 최적의 세팅값이라고 생각한다.

물론 그 외 다른 설정 값으로도 유의미한 결과를 만들었지만, 특색이 강하지 않은 자료기 때문에 정보의 정확도는 떨어질 수 있어서 언급은 하지 않겠다.

이 글을 마지막으로 저의 Kohya_ss 얼굴 로라 만들기는 종료 하였습니다.

그동안 따라 오시느라 고생 많으셨습니다.

모두 즐거운 AI 생활 하시길 바랍니다.

번외

*최적화는 낮은 네트워크 랭크로 정제된 많은 자료로, 적은 용량으로 만드는게 목표이며, 내가 원하는 결과물에 따라 이 결과 값은 더 낮아 질수 있다.

(이론상 50번의 반복 학습으로 얻을 수 있는 결과 값은 더 낮은 반복 학습과 네트워크 알파, 학습률 변경으로 비슷한 결과 값을 얻을 수 있다는 뜻)

*위에 살짝 언급한 txt 학습률과 unet 학습률은 sdxl 로라를 만들때나(sdxl 로라는 추상적인 프롬프트 설정을 넣는 것이 매우 중요하다.)

좀 더 복잡한 설정의 효과들이나 의상 만들때 필요한 블록 웨이트를 쓸때 더 유의미한 결과를 나타낼 수 있다.

(아직은 관심이 없어서 공부를 하지 않았다.)

*한번 정제된 파일을 잘 만들어 놓으면, 정제된 파일들의 조합으로 무수히 다양한 로라를 만들 수 있으며, 기술의 발전으로 기존에 방식들이 변경이 되더라도 정제된 파일은 추후 많은 시간동안은 로라를 만들때 나의 귀중한 자료들로 활용 할 수 있을 것으로 판단된다.

(sdxl 로라 만들때도 물론 사용할 수 있다.)

*네트워크 랭크 256으로 로라를 만들 었을때 용량은 약 288메가로 만들어 진다.

*준비된 파일이 많을 수록 학습률을 낮추고, 준비된 파일이 적을 수록 학습률을 높인다.

(물론 전제 조건은 잘 정제된 파일이다.정제가 안된 파일로 학습률을 높이면 오염도가 높아진다.)

빠다파리

2023-12-07 14:30:49

북이

2023-12-07 14:33:54

Znsl

2023-12-07 14:34:30

하니타카

2023-12-07 14:45:28

kakarot님 수고하셨습니다. 1.2.3편 잘봤구요.  가챠돌리고  1000장을 뽑는중에 딱 한장 원하는 그림이 생성됐습니다. 이 한장의 데이터셋으로 로라제작이 가능할까요.

펼쳐보기▼

엑시옴

2023-12-07 14:49:12

살짝 껴들어서 답변해 드릴께요.
고화질 사진 한장이면 충분합니다.

펼쳐보기▼

하니타카

2023-12-07 14:50:21

샌님 sdxl 로라도 가능하겠네요

펼쳐보기▼

엑시옴

2023-12-07 14:51:59

넵

펼쳐보기▼

하니타카

2023-12-07 15:07:44

샌님 sdxl 체크포인트 만들고 있는데 얼굴과 몸은 거의 완성단계인데 배경이 문제라서요. Xl 모델중에 배경이  월등한거 추천 좀 부탁드립니다

펼쳐보기▼

엑시옴

2023-12-07 15:14:30

*수정됨

실사배경 지존: colossusProjectXLSFW_v53Trained.safetensors+ultriumV60SDXLVAE_ultriumV60SDXLVAEFLT.safetensors
애니배경 지존: sdxlNijiSpecial_sdxlNijiSE.safetensors+deepblueXL_v030.safetensors

펼쳐보기▼

하니타카

2023-12-07 15:21:56

제가 만들면서 테스트 부탁드려도 될까요. XL모델은 첨이라 시험판으로요. 허접해서 공개는 안할 예정이고  엑시옴님하고 둘만 쓸걸로 ㅋ

펼쳐보기▼

엑시옴

2023-12-07 15:22:20

*수정됨

당연히 가능합니다.
한가지 팀: 저는 요새 XL모델 만들 때 제일 마지막에 add-detail-XL.safetensors 이 로라를 0.1-0.3정도 넣습니다. 아주 매콤해요

펼쳐보기▼

하니타카

2023-12-07 15:23:32

감사합니다

펼쳐보기▼

하니타카

2023-12-07 15:41:29

add-detail-XL 벌써 섞었고 넘 좋더군요. 전 0.4로 병합했습니다.

펼쳐보기▼

엑시옴

2023-12-07 15:42:06

넵넵

펼쳐보기▼

kakarot

2023-12-07 14:53:46

네 가능은 합니다. 우선 파일 정제를 잘 하신다음에 반복 학습을 50번, 75번,100번으로 진행하시길 추천드리며, 학습률은 1정도를 추천 합니다. 원하는 결과값이 나오지 않았을때는 학습률 변경을 권장하는 바입니다. 네트워크 랭크는 복잡하지 않으면 8을 추천드리며 원하는 결과가 안나올시에는 8의 배수로 차근히 늘려보길 바랍니다. 테스트 에포크는 2정도로 추천 하고, 원하는 결과가 나왔을때 10~15 에포크 정도 돌려보시길 바랍니다. 적은 장 수 이기때문에 편향된 결과값이 나올 수 있으며, 어느정도 완벽하지 않아도 경험상 비슷한 분위기의 잘 정제된 파일 20장~25장 정도가 이상적인 내가 원하는 결과 값을 만들 수 있습니다.

펼쳐보기▼

하니타카

2023-12-07 14:57:17

8월말에 엑시옴님과 제가 합작해서 만들어 봤는데요.  저는 포토샾으로 작업해서 1장을 100장으로 복제하는방법을 썼는데 ㅋ 노가다 한것 같아서 여쭤봤습니다.

펼쳐보기▼

kakarot

2023-12-07 14:59:59

저는 보통 평균 값을 내보니 1500장 정도 뽑아서 60~100장 정도의 다양한 얼굴 각도와 비슷한 분위기의 정면(30장)과 측면의 얼굴(30장)을 선정한 뒤에 최종적으로 20~25장으로 추린 다음에 작업을 진행하고 있어요.

펼쳐보기▼

kakarot

2023-12-07 15:01:16

정제가 거의 필요없는 파일을 추려내서, 정제하는 데 시간은 보통 30분~1시간 정도면 끝났어요.

펼쳐보기▼

하니타카

2023-12-07 15:03:33

넵 답변 감사드립니다

펼쳐보기▼

kakarot

2023-12-07 14:57:19

여기서 편향된 결과 값은 다양한 얼굴 각도가 나오지 않을 수가 있습니다. 그리고 캡션(프롬프트)도 로라를 만들때 중요한 영향을 미칩니다. 제가 gpt 사용은 못하여서 좀 더 고급 프롬 설정은 추천을 못 드리겠네요..다른 분들이 도움을 주시면 감사하겠습니다.

펼쳐보기▼

행인

2023-12-07 14:46:14

엑시옴

2023-12-07 14:48:22

멍무이드아

2023-12-07 14:54:15

이노프리

2023-12-07 14:58:56

실사좋아

2023-12-07 15:08:51

hanuser

2023-12-07 15:17:56

엑시옴

2023-12-07 15:18:21

골뱅이 추가
실사캡션은 서술형이 애니캡션은 단어형이 좋다는 고인물이 있었습니다.
저는 두가지 캡션을 다 만들어서 합쳐서 씁니다. 퀄이 좋아지고 무엇보다 유연성이 엄청 좋아집니다.
예) a woman in a black top and jeans posing for a picture with her hands on her hips ,nsfw,long hair, shirt, black hair, navel, cleavage, bare shoulders, medium breasts, underwear, panties, white shirt, parted lips, open clothes, midriff, pants, grey background, off shoulder, bra, mole, black eyes, head tilt, looking to the side, black panties, mole under eye, tank top, undressing, denim, black bra, clothes writing, jeans, sports bra, unbuttoned, blue pants, unzipped, open fly, open pants

펼쳐보기▼

leezi

2023-12-07 15:28:44

엑시옴님 그래서 말인데 (shield hero)-Therese Alexanderite 요 녀석 로라 한번 제작해주실?..... 암만 눈 씻고 찾아봐도 없어서 드리는 말씀입니다

펼쳐보기▼

엑시옴

2023-12-07 15:33:19

인물이요 아니면 그림체요?
널린게 데이터라서 만드는 것 은 문제가 없죠.
혹시 진짜 마음에 드는 그림만 골라서 전달해 주셔도 되고요.
(제가 이 그림체에 익숙치가 않아서 뭐가 좋은 줄 몰라요 ㅠㅠ)

펼쳐보기▼

leezi

2023-12-07 15:33:53

*수정됨

테레사 알렉산더라는 케릭터인데 생업에 종사하다보니 ㅠㅠ 만들어 주시면 그림으로 보답을 해드릴께요 +_+ 츄릅...

펼쳐보기▼

엑시옴

2023-12-07 15:35:25

https://www.pinterest.co.uk/pin/577657089719794715/
이거요?
마빡에 보석 박힌?

𝑇ℎ𝑒𝑟𝑒𝑠𝑒 𝐴𝑙𝑒𝑥𝑎𝑛𝑑𝑟𝑖𝑡𝑒 | Anime, Anime life, Doujinshi

Jun 9, 2022 - This Pin was discovered by 𝕘𝕖𝕞𝕞. Discover (and save!) your own Pins on Pinterest

*수정됨

이거요?
마빡에 보석 박힌?

펼쳐보기▼

leezi

2023-12-07 15:35:39

네 맞아요

펼쳐보기▼

엑시옴

2023-12-07 15:37:15

주말에 만들어 볼께요.
클라식한 그림체라서 전혀 어렵지 않게 복사될 것 같아요

펼쳐보기▼

leezi

2023-12-07 15:37:49

사랑해요

펼쳐보기▼

엑시옴

2023-12-08 05:14:47

https://drive.google.com/file/d/1BSY7lBbSKtfTpKta3aP5H2nXZy_DERCH/view?usp=sharing
데이터를 모아서 적당히 자르고 토파즈로 키우고 1024로 조절한 데이터셋입니다.
데이터 갯수가 많은 것보다 진짜로 필요한 데이터를 고르는 것이 중요한데, 저는 이 주인공을 몰라서 고를 수 가 없습니다.

leezi님이 원하시는 데이터를 골라주세요
필요없는 데이터는 다 없애고, 더 넣고 싶으신 데이터를 추가해주시고, 특히 강조하고 싶은 데이터번호를 알려주세요.

Google Docs

Therese Alexandrite enhanced 1024.zip

데이터를 모아서 적당히 자르고 토파즈로 키우고 1024로 조절한 데이터셋입니다.
데이터 갯수가 많은 것보다 진짜로 필요한 데이터를 고르는 것이 중요한데, 저는 이 주인공을 몰라서 고를 수 가 없습니다.

leezi님이 원하시는 데이터를 골라주세요
필요없는 데이터는 다 없애고, 더 넣고 싶으신 데이터를 추가해주시고, 특히 강조하고 싶은 데이터번호를 알려주세요.

펼쳐보기▼

leezi

2023-12-08 05:30:16

와 엑시옴님 저 지금 집에 퇴근해서 이따가 출근하면 바로 확인하겠습니다 ♡♡♡

펼쳐보기▼

EY3

2023-12-07 15:29:23

네이티리

2023-12-07 15:49:19

대단하셔~!! 저는 엄두도 안나는데...
물론 리스트업에서...ㅋㅋㅋ

펼쳐보기▼

제로스

2023-12-09 10:50:13

카카로님 다른모델은 괜찮은데  kakarot28DCozy_cozy 이 계열 모델들만 SD재실행시 아래와 같이 에러나 가는데 혹시 원인을 아시나요? SD1.6 입니다.
-------------------------------------------------------------------------------------
AttributeError: 'NoneType' object has no attribute 'cond_stage_model'
Creating model from config: C:\SD\stable-diffusion-webui\configs\v1-inference.yaml
Loading VAE weights specified in settings: C:\SD\stable-diffusion-webui\models\VAE\vae-ft-mse-840000-ema-pruned.safetensors
loading stable diffusion model: RuntimeError
Traceback (most recent call last):
  File "C:\Users\nette\AppData\Local\Programs\Python\Python310\lib\threading.py", line 973, in _bootstrap
    self._bootstrap_inner()
  File "C:\Users\nette\AppData\Local\Programs\Python\Python310\lib\threading.py", line 1016, in _bootstrap_inner
    self.run()
  File "C:\SD\stable-diffusion-webui\venv\lib\site-packages\anyio\_backends\_asyncio.py", line 807, in run
    result = context.run(func, *args)
  File "C:\SD\stable-diffusion-webui\venv\lib\site-packages\gradio\utils.py", line 707, in wrapper
    response = f(*args, **kwargs)
  File "C:\SD\stable-diffusion-webui\modules\ui.py", line 1298, in <lambda>
    update_image_cfg_scale_visibility = lambda: gr.update(visible=shared.sd_model and shared.sd_model.cond_stage_key == "edit")
  File "C:\SD\stable-diffusion-webui\modules\shared_items.py", line 110, in sd_model
    return modules.sd_models.model_data.get_sd_model()
  File "C:\SD\stable-diffusion-webui\modules\sd_models.py", line 499, in get_sd_model
    load_model()
  File "C:\SD\stable-diffusion-webui\modules\sd_models.py", line 626, in load_model
    load_model_weights(sd_model, checkpoint_info, state_dict, timer)
  File "C:\SD\stable-diffusion-webui\modules\sd_models.py", line 409, in load_model_weights
    sd_vae.load_vae(model, vae_file, vae_source)
  File "C:\SD\stable-diffusion-webui\modules\sd_vae.py", line 212, in load_vae
    _load_vae_dict(model, vae_dict_1)
  File "C:\SD\stable-diffusion-webui\modules\sd_vae.py", line 239, in _load_vae_dict
    model.first_stage_model.load_state_dict(vae_dict_1)
  File "C:\SD\stable-diffusion-webui\modules\sd_disable_initialization.py", line 223, in <lambda>
    module_load_state_dict = self.replace(torch.nn.Module, 'load_state_dict', lambda *args, **kwargs: load_state_dict(module_load_state_dict, *args, **kwargs))
  File "C:\SD\stable-diffusion-webui\modules\sd_disable_initialization.py", line 218, in load_state_dict
    if state_dict == sd:
RuntimeError: Boolean value of Tensor with more than one value is ambiguous


Stable diffusion model failed to load
-------------------------------------------------------------------------------------

Bitly

Custom Domain by Bitly

Harness the click

*수정됨

카카로님 다른모델은 괜찮은데  kakarot28DCozy_cozy 이 계열 모델들만 SD재실행시 아래와 같이 에러나 가는데 혹시 원인을 아시나요? SD1.6 입니다.
-------------------------------------------------------------------------------------
AttributeError: 'NoneType' object has no attribute 'cond_stage_model'
Creating model from config: C:\SD\stable-diffusion-webui\configs\v1-inference.yaml
Loading VAE weights specified in settings: C:\SD\stable-diffusion-webui\models\VAE\vae-ft-mse-840000-ema-pruned.safetensors
loading stable diffusion model: RuntimeError
Traceback (most recent call last):
  File "C:\Users\nette\AppData\Local\Programs\Python\Python310\lib\threading.py", line 973, in _bootstrap
    self._bootstrap_inner()
  File "C:\Users\nette\AppData\Local\Programs\Python\Python310\lib\threading.py", line 1016, in _bootstrap_inner
    self.run()
  File "C:\SD\stable-diffusion-webui\venv\lib\site-packages\anyio\_backends\_asyncio.py", line 807, in run
    result = context.run(func, *args)
  File "C:\SD\stable-diffusion-webui\venv\lib\site-packages\gradio\utils.py", line 707, in wrapper
    response = f(*args, **kwargs)
  File "C:\SD\stable-diffusion-webui\modules\ui.py", line 1298, in <lambda>
    update_image_cfg_scale_visibility = lambda: gr.update(visible=shared.sd_model and shared.sd_model.cond_stage_key == "edit")
  File "C:\SD\stable-diffusion-webui\modules\shared_items.py", line 110, in sd_model
    return modules.sd_models.model_data.get_sd_model()
  File "C:\SD\stable-diffusion-webui\modules\sd_models.py", line 499, in get_sd_model
    load_model()
  File "C:\SD\stable-diffusion-webui\modules\sd_models.py", line 626, in load_model
    load_model_weights(sd_model, checkpoint_info, state_dict, timer)
  File "C:\SD\stable-diffusion-webui\modules\sd_models.py", line 409, in load_model_weights
    sd_vae.load_vae(model, vae_file, vae_source)
  File "C:\SD\stable-diffusion-webui\modules\sd_vae.py", line 212, in load_vae
    _load_vae_dict(model, vae_dict_1)
  File "C:\SD\stable-diffusion-webui\modules\sd_vae.py", line 239, in _load_vae_dict
    model.first_stage_model.load_state_dict(vae_dict_1)
  File "C:\SD\stable-diffusion-webui\modules\sd_disable_initialization.py", line 223, in <lambda>
    module_load_state_dict = self.replace(torch.nn.Module, 'load_state_dict', lambda *args, **kwargs: load_state_dict(module_load_state_dict, *args, **kwargs))
  File "C:\SD\stable-diffusion-webui\modules\sd_disable_initialization.py", line 218, in load_state_dict
    if state_dict == sd:
RuntimeError: Boolean value of Tensor with more than one value is ambiguous


Stable diffusion model failed to load
-------------------------------------------------------------------------------------

펼쳐보기▼

아닥