(데이터) 드림부스 캐릭터 및 화풍 학습, 정규화 이미지 및 학습율에 대해서.

AI그림 학습 채널

알림 알림 중 알림 취소

구독자 8833명 알림수신 127명 @Anon

그림 AI 학습 정보를 공유하는 채널

정보 (데이터) 드림부스 캐릭터 및 화풍 학습, 정규화 이미지 및 학습율에 대해서.

선한_까만_오징어

추천 8 비추천 0 댓글 8 조회수 1987 작성일 2022-11-13 11:49:57 수정일 2022-11-13 11:51:26

https://arca.live/b/hypernetworks/62897037

드림 부스는 적은 수의 이미지로 스타일 및 캐릭터를 학습 시킬 수 있는 방법임.

정규화 이미지와 학습율에 대해서 간단히 설명하고 가자면,

정규화 이미지 : 모델의 특성을 잃지 않도록 유지시켜주는 기준점.

학습율 : 모델에 '학습'을 얼마나 강하게 시킬 것인가? 를 결정하는 요인.

1. 캐릭터 학습 및 화풍 학습에 있어서 정규화 이미지는 필요함.

그래야만 드림부스 학습 과정에서 발생하는 과적합을 방지할 수 있기 때문임.

과대학습 끝에 모델 자체가 망가지거나, 특정 구도, 특정 화풍밖에 뽑아내지 못하는 걸 방지하기 위해서임.

캐릭터 학습 및 화풍 학습에 있어서 정규화 이미지가 '모델의 특성'을 유지 시켜 주는 역할을 하기 때문임.

그리고 좀 더 세밀하게 모델에 학습을 시켜주는 역할을 해줌.

그래서 정규화 이미지란 건 '모델의 특성을 얼마나 길게 유지하면서, 더욱 얼마나 세밀하게 학습을 시킬 수 있는가?'를 위해서 사용하는 거임.

또한 캐릭터 학습 시에는 정규화 이미지는 모델의 특성을 유지하면서 '학습 시키는 캐릭터'가 일반적인 프롬프트까지 번지지 않도록 확실하게 기준을 잡아줌.

또한 이건 화풍 학습 때도 있어서 '학습 이미지'가 모델을 망쳐버리지 않도록 붙잡아주는 역할을 함.

2. 높은 학습율은 모델에 미치는 영향이 강하다.

당연하게도 낮은 학습율은 모델에 끼치는 영향이 낮다.

일단 예시 이미지를 뽑아왔는데....

best quality, high resolution, highres, hyper detailed, high detail, intricate details, photo of a yoshino girl, bishoujo, loli, small breasts, embroidered frilled dress, Cowboy shot, snowy field, ice field, Beautiful eyes, beautiful detailed glow, detailed ice, beautiful detailed water, Luminous particle, cinematic light, light particles

모두 동일 프롬프트, 동일 시드, 동일 샘플러로 출력함.

1. 학습에 사용된 모델 (WD 1.3)

원본 모델이니 설명할 필요는 없을 것.

2. 2000스탭 20장 5e-6 학습 모델

어느 정도 원본 모델의 특성을 유지하면서 요시노를 학습한 게 보일 것임.

3. 5000스탭 50장 5e-6 학습 모델

그런데 여기서는 모델의 특성이 유지되지 못하고, 그림이 무너지더라도 캐릭터를 몹시 강하게 출력시킴.

복장 또한 강하게 고정되어 있음.

4. 5000스탭 50장 3.5e-6 학습 모델

여기서도 여전히 원본 모델의 특성을 잘 찾아볼 수 없지만, 그래도 이전 모델과 같은 그림의 붕괴가 일어나지 않은 것을 볼 수 있음.

5. 5000스탭 50장 3e-6 학습 모델

원본 모델의 특성이 일부 살아있으며, 이전의 모델에 비해서 그림의 디테일과 의상 디테일이 올라간 것을 확인할 수 있을 것임.

6. 드림부스 모델 (WD) + 드림부스 모델 (애니띵) + 애니띵 모델 머지 모델

이 머지 모델에 대한 설명은 나중에 이야기하도록 하겠음.

드림부스 학습은 선택지가 두가지 있음.

1. 모델의 특성을 최대한 유지하면서 학습시킬 것이냐.

2. 모델의 특성을 어느 정도 상실하고 학습시킬 것이냐.

그리고 나는 모델의 특성을 유지하면서 학습시키는 데에 중점을 두고 있음.

이렇게 늘어놓고 보면 차이점이 보일 거임.

높은 학습율, 그리고 많은 스탭에 비례하여 모델의 특성이 지워진다.

그리고 이건 정규화 이미지가 없으면 더욱 빠르게 찾아오고.

혹은 너무 과하게 학습해서, 모델이 망가지지 않더라도 학습 이미지와 유사한 것만 내뱉는 경우도 있음.

이 예시 이미지는 '캐릭터 학습'을 위해서 여러 화풍을 뒤섞어서 화풍이 '여러 화풍의 그 중간점'으로 수렴하고 있음.

그리고 이건 내가 학습시킨 'photo of a yoshino girl '라는 프롬프트에 존재하는 화풍을 따라가고 있는 거고.

1. 그러면 내가 학습시킨 프롬프트를 지우면 원본 모델의 특성을 얼마나 재현할 수 있을까?

2. 그리고 아예 딴 캐릭터를 그리라고 했을 때 원본 모델의 특성을 얼마나 재현할 수 있을까?

1. 학습에 사용된 모델 (WD 1.3)

2. 2000스탭 20장 5e-6 학습 모델

학습 프롬프트를 입력하지 않았는데도, 강하게 학습이 되서 여전히 요시노를 그리고 있다.

그래도 스탭이 낮아서 요시노와는 닮지 않은 캐릭터를 한 장 그려줬다.

그리고 또한 원본 모델의 특성을 여전히 유지하고 있다.

3. 5000스탭 50장 5e-6 학습 모델

완전히 모델이 요시노, 그리고 이전 예시 이미지의 화풍을 어느 정도 따라가고 있다는 게 보일 것.

너무 강하게 요시노와 이리저리 뒤섞인 화풍을 학습해버렸다.

4. 5000스탭 50장 3.5e-6 학습 모델

여전히 요시노를 그리고 있다.

캐릭터를 강하게 학습했으나, WD 원본 모델의 특성을 따라가고 있는 게 보일 것.

3. 5000스탭 50장 3e-6 학습 모델

4장 중 2장 꼴이 요시노를 닮지 않은 캐릭터를 출력했다.

6. 드림부스 모델 (WD) + 드림부스 모델 (애니띵) + 애니띵 모델 머지 모델

이제 여기부터는 (학습 프롬프트 유무 + 머리 색 및 눈 색 변경)에 따른 예시 이미지임.

1. 학습 프롬프트 O + 머리 색 눈 색 변경

1. 학습에 사용된 모델 (WD 1.3)

2. 2000스탭 20장 5e-6 학습 모델

적발적안의 요시노를 충실히 재현하고 있음.

그리고 원본 모델의 특성도 유지중. 또한 다양한 복장을 출력한다.

3. 5000스탭 50장 5e-6 학습 모델

원본 모델의 특징을 유지하지 못하고, 그림이 무너지는 것이 보인다.

그리고 요시노가 강하게 학습되어 청발청안이 혼재되어 나타난다.

또한 복장 또한 고정되어 나타난다.

4. 5000스탭 50장 3.5e-6 학습 모델

원본 모델의 특성을 어느 정도 유지 중이나, 요시노가 강하게 학습되어 일부 이미지에서 청안이 드러난다.

그래도 5e-6로 학습된 모델보다는 낫다.

5. 5000스탭 50장 3e-6 학습 모델

3.5e 모델과 동일.

6. 드림부스 모델 (WD) + 드림부스 모델 (애니띵) + 애니띵 모델 머지 모델

요시노를 강하게 학습한 모델이 되어버렸는지, 청발을 출력시킨다.

2. 학습 프롬프트 X + 머리 색 눈 색 변경

1. 학습에 사용된 모델 (WD 1.3)

2. 2000스탭 20장 5e-6 학습 모델

학습 프롬프트를 사용하지 않았는데도, 요시노의 외형을 강하게 출력한다.

그러나 원본 모델의 특성이 망가지지 않았으며, 요시노의 특징적인 복장 및 요시농은 거의 출력하지 않고 있다.

3. 5000스탭 50장 5e-6 학습 모델

요시노의 외형, 복장을 출력시키는 중이다.

학습 프롬프트를 사용하지 않아서 그림은 안정되어 있으나, 여전히 요시노를 출력하고 있다.

이전 예시 이미지에서는 과하게 학습되어서 학습 프롬프트를 사용하고, 요시노의 특징을 강조하는 프롬프트이 역설적으로 화풍을 무너트린 것.

4. 5000스탭 50장 3.5e-6 학습 모델

마찬가지로 학습 프롬프트가 없음에도 여전히 요시노와 닮은 캐릭터를 출력중.

그러나 락습율이 낮아질 수록 요시노 같으면서도 아닌 캐릭터를 더욱 강하게 출력한다.

5. 5000스탭 50장 3e-6 학습 모델

3.5e 모델과 동일.

6. 드림부스 모델 (WD) + 드림부스 모델 (애니띵) + 애니띵 모델 머지 모델

이상의 예시 이미지로 여러 가지 사실을 알 수 있다.

1. 정규화 이미지는 모델의 특성을 유지하는 데에 큰 도움을 준다.

2. 높은 학습율은 학습 프롬프트를 빼도 모델의 특성을 손상시킨다.

3. 높은 학습율과 많은 스탭은 모델 손상도에 비례한다.

(지금 이 글을 작성하면서 깨달은 거지만, 높은 학습율보다 많은 스탭이 더욱 모델의 특성에 영향을 끼치는 게 아닐까 추정함.

이 부분에 대해서는 나중에 실험해봐야 할 듯.)

4. 출력되는 캐릭터 및 '화풍'은 학습 프롬프트이 없어도 영향을 받는다.

즉 학습 프롬프트를 빼도 특정 화풍으로 기울어졌다면 모델을 과도하게 학습시켰을 것이라 판단하는 게 맞을 것.

번외) 머지 모델에 대하여.

예시 이미지에서 머지 모델이 보였을텐데, 이 머지 모델을 굳이 보여준 이유는...

모델의 손상을 어느 정도 복구하거나, 손상을 대체할 수 있는 방법이 바로 '모델 병합'이기 때문임.

드림부스 모델을 타 모델과 병합하면 망가진 화풍이 완화되거나, 퀼리티 향상이 일어나는데...

예시 이미지에서는 드림부스 모델 + 드림부스 모델과 머지했기에 학습 시킨 캐릭터의 외형이 고정된 것처럼 보이나, 퀼리티나 의상의 다양함은 폭넓어진 것을 확인할 수 있을 것임.

다만 화풍을 학습시켰을 시에는, 모델 머지가 제대로 먹힐지는 알 수 없다.

댓글 [8]

훈훈한_파란_사자

2022-11-13 12:09:06

선한_까만_오징어

2022-11-13 12:11:29

https://huggingface.co/datasets/waifu-research-department/regularization

정규화 이미지는 여기에 있는 파일 받아서 썼음.
파일에 있는 'waifu-regularization-3.3k.zip'임.

정규화 이미지는 200장 사용함

https://postimg.cc/xXHd0CwH
학습 데이터 셋 미리보기 이미지

huggingface.co

waifu-research-department/regularization · Datasets at Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

*수정됨

정규화 이미지는 여기에 있는 파일 받아서 썼음.
파일에 있는 'waifu-regularization-3.3k.zip'임.

정규화 이미지는 200장 사용함

https://postimg.cc/xXHd0CwH
학습 데이터 셋 미리보기 이미지

펼쳐보기▼

흉악한_핑크_박쥐

2022-11-13 12:15:00

어떤 드림부스 사용함? 궁금

펼쳐보기▼

선한_까만_오징어

2022-11-13 12:21:44

https://github.com/ShivamShrirao/diffusers/tree/main/examples/dreambooth

GitHub

diffusers/examples/dreambooth at main · ShivamShrirao/diffusers

Diffusers: State-of-the-art diffusion models for image and audio generation in PyTorch - diffusers/examples/dreambooth at main · ShivamShrirao/diffusers

흉악한_핑크_박쥐

2022-11-13 12:21:59

소탈한_까만_너구리

2022-11-13 13:06:59

*수정됨

정규화 이미지의 종류도 학습에 영향을 끼치는 것 같습니다. prompt에 단순 'girl'을 사용할 때와 캐릭터의 특징을 적은 'girl with grey hair and animal ears' 를 사용한 경우를 비교해보니 'girl'을 사용했을 때가 더 학습 정도가 강한 모습을 보였습니다.

펼쳐보기▼

선한_까만_오징어

2022-11-13 15:16:47

그러면 정규화 이미지를 캐릭터 특징을 넣어서 하는 게 좋을지도 모르겠군요.
나중에 그런 쪽으로 한번 시험해보겠습니다.

펼쳐보기▼

굼뜬_초록_기린

2022-11-13 14:42:32

정말 요시노를 좋아하구나

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 정보 그림 드림부스 임베딩 하이퍼

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 31760089

공지 파딱 마음대로 작성한 AI그림 학습 채널 규정 - [24-01-24]

포리X 2023.10.29 2397

공지 [리퀘스트] 탭이 추가되었습니다.

선한_하얀_사자 2023.02.10 3564

공지 신문고

Anon 2023.02.21 3352

공지 각종 학습파일 적용법

거만한_보라_달팽이 2023.01.24 40452

공지 그림 학습법 모음

거친_핑크_외계인 2022.10.30 74202

숨겨진 공지 펼치기(1개)

저런 병신새끼 때문에 엄한 개발자들이 뺀찌맞음 [2]

기쁜_보라_코알라 2022.11.14 138 4

???: 학습은 안했다 [10]

호탕한_남색_뱀 2022.11.14 794 15

그림 메스가키 시온 [2]

기쁜_주황_고양이 2022.11.14 168 4

저거 찾게 된 경위 [16]

당당한_은색_뱀 2022.11.14 693 12

ㅋㅋㅋㅋㅋ [2]

훌륭한_핑크_토끼 2022.11.14 264 9

아직도 하이퍼 학습하는사람들에게 질문 [6]

흉악한_밤색_비둘기 2022.11.14 334 1

대단하네 ㅋㅋㅋ [19]

까칠한_노란_코끼리 2022.11.14 777 14

그림 드림 아티스트 1만 STEP(최종) 주관평 [2]

행복한_밤색_개구리 2022.11.14 298 3

그림 악!임베딩이너무즐거워해병님

까칠한_청록_코끼리 2022.11.14 165 1

webui 드림부스 질문 [7]

답답한_주황_캥거루 2022.11.13 317 1

정보 Joepenna버전으로 f222, 인스타 모델 학습 시 오류 해결 법 [2]

솔직한_주황_잠자리 2022.11.13 479 2

다른건 모르겠고 신세계 탐험하는거같아서 [1]

엉뚱한_주황_오리 2022.11.13 121 2

자식은 부모 따라간다도 아니고 [5]

겸손한_주황_악어 2022.11.13 220 1

채굴공장에서 실직당한 글카모아서 [4]

걸걸한_갈색_말 2022.11.13 228 1

webui하드에서 돌리면속도 얼마나 떨어질까 [4]

행복한_하얀_사슴 2022.11.13 200 0

싸울 시간에 PR이나 올려 [6]

흉악한_까만_비둘기 2022.11.13 327 9

오늘그래도 결과물 나쁘지않았다 [7]

분노한_보라_뻐꾸기 2022.11.13 359 6

정보 1114 artist별 hypernet 모음 업데이트 (+캐릭터 하이퍼네트워크 링크 정리) [10]

난처한_청록_코알라 2022.11.13 1499 12

돈도 기가막힌 방법으로 버나보네 [11]

야무진_밤색_개구리 2022.11.13 290 1

가끔 그런 사람들이 보이긴 해 [5]

화가난_핑크_캥거루 2022.11.13 168 3

질문) 이 오류는 무슨 오류에요? [6]

소심한_보라_곰 2022.11.13 149 1

여기 초창기랑 느낌 확 달라졌네 [22]

불행한_빨간_달팽이 2022.11.13 873 11

ai짤이랑 학습짤을 너무 많이 봤나 [4]

수수한_하얀_쭈꾸미 2022.11.13 412 3

보름정도 드림부스 굴려 본 후기 [4]

분노한_보라_닭 2022.11.13 390 3

정보 (데이터) 드림부스 캐릭터 및 화풍 학습, 정규화 이미지 및 학습율에 대해서. [8]

선한_까만_오징어 2022.11.13 1988 8

밑에 있는 드림아티스트 노빠꾸로 박고 해보는데 [17]

둔한_밤색_돼지 2022.11.13 395 2

webui확장써보는데 내가 세팅해서 학습시키는게 이상한가.... [8]

한심한_청록_앵무새 2022.11.13 240 0

학습율 조정하면서 모델 깎는 거 참 빡시네

시시한_하얀_사자 2022.11.13 126 1

정규화 이미지 넣고 안넣고 실험할때 변인 통제가 사실상 불가능임 [2]

소심한_분홍_돼지 2022.11.13 190 0

그만 싸워 병신들아 [2]

씩씩한_분홍_호랑이 2022.11.13 162 3

아 시발ㅋㅋ 뭐 함부러 손대면 클나네 [2]

슬픈_하얀_코뿔소 2022.11.13 128 -1

아 시팔 하이퍼네트워크 맛탱이 가버렸네 [1]

소심한_남색_거북이 2022.11.13 105 1

하이퍼네트워크 주저리 [5]

까칠한_보라_쭈꾸미 2022.11.13 348 3

WD 신버전 나올때까지 숨 참는다 [2]

의젓한_분홍_벌 2022.11.13 110 1

로컬 WEBUI 하이퍼 왜 적용이안되지 [5]

겸손한_남색_오리 2022.11.13 179 1

정보 드림 아티스트 확장 기능 공개 (이미지 한 장으로 학습하기) [5]

의젓한_금색_외계인 2022.11.13 1077 9

ㅋㅋ 하이퍼 linear에 드롭아웃제거했는데 [1]

시시한_까만_너구리 2022.11.13 172 0

(드림부스) 화풍을 학습할때는 정규화 이미지가 필요할까? [4]

소탈한_주황_너구리 2022.11.13 777 6

하이퍼 병합 정식으로빨리들어오길 [2]

흉악한_파란_멧돼지 2022.11.13 277 0

임베딩 하이퍼 드림부스로 탭 만들면 어때 [2]

한심한_갈색_문어 2022.11.13 109 1

딥단부루 태그 스코어 너무 낮춰도 별로지? [2]

행복한_파란_캥거루 2022.11.13 173 1

전체글 개념글