Custom Diffusion - 하이퍼 + 드림부스 = ??

AI그림 학습 채널

알림 알림 중 알림 취소

구독자 8785명 알림수신 124명 @Anon

그림 AI 학습 정보를 공유하는 채널

정보 Custom Diffusion - 하이퍼 + 드림부스 = ??

분노한_주황_뻐꾸기

추천 6 비추천 0 댓글 6 조회수 1737 작성일 2022-12-09 12:39:53

https://arca.live/b/hypernetworks/64894214

아침에 나온 LORA가 하이퍼 + 드림부스인줄 알았는데
진짜 후계자는 얘였음
확실히 제대로 된 논문 있는 것들이 이해하기도 쉽고 효과에 대한 믿음이 생김
논문 퀄도 솔직히 구글에서 낸것만큼 좋아서 놀랐음

Multi-Concept Customization of Text-to-Image Diffusion (cmu.edu)

예시가 엄청 많고, 여러가지 방향으로 실험을 많이 진행해서 후속 방향이 기대될 정도임

왼쪽으로부터 훈련이미지 / Custom Diffusion / 드림부스 / 임베딩훈련 순
뭐 드림부스가 살짝 나은 예시도 있긴한데 적어도 꿀리지 않는다는것 자체가 큰 장점이다

얘 원리도 하이퍼처럼 어텐션의 K, V 레이어만 튜닝하는 것이기 때문

그래서 용량도 약 70MB 정도 나온다고 한다.

참고로 훈련하고자 하는 대상에 대한 임베딩도 같이 훈련한다고 하는데

왜 임베딩 훈련 없이 드림부스처럼 이상한 토큰으로 훈련하는지는 잘 모르겠음

여기서는 파인튜닝된 모델에서 크로스어텐션 레이어가 가장 많이 변해서 이것만 튜닝하기로 했다고 한다

근데 이 논문의 핵심은 논문 제목처럼 여러가지 대상에 대해서 학습을 진행해도 각 대상의 퀄리티가 유지된다는 것이다

가장 오른쪽 열이 드림부스 결과물인데 V1이나 V2 하나만 구현하는걸 볼 수 있다

그에 비해 왼쪽의 두 열 (왼쪽: V1 & V2 동시훈련, 중간: V1 훈련 후 V2 훈련)은 V1과 V2를 모두 잘 구현하는걸 볼 수 있다

*이 모델은 드림부스보다 더 높은 lr로 훈련해도 안깨진다고 함. 그래서 배치사이즈 8에 lr 8*1e-5를 씀

그 외에도 훈련 방식에 대한 꿀팁?을 찾을 수 있었는데

훈련할때 훈련 이미지를 0.4~1.4배로 축소 및 확대한 다음

축소한 이미지에 대해서는 'very small', 'far away'

확대한 이미지에 대해서는 'zoomed in', 'close up' 프롬프트를 추가했다고 함

거기에 backpropagation을 할 때 축소된 이미지 부분에 대해서만 loss를 계산했다고 하는데 이건 코드를 봐야 알듯 (아직 코드는 안나옴)

정규화를 하느냐 마느냐 가지고 챈이 뒤집어질뻔했는데

여기서는 정규화 이미지를 안쓰거나 AI 생성 이미지를 정규화 이미지로 사용하면 더 안좋다고 함
이건 뭐... 그림체 훈련한게 아니니까 넘어가고

그림체 훈련

V1와 V2가 비슷하다면 같이 프롬프트에 넣을때 제대로 안나온다고 한다

근데 이건 원래 모델도 잘 안나오는데수

아 빨리 코드나왔으면

난처한_보라_너구리

2022-12-09 12:50:36

순박한_빨간_양

2022-12-09 12:55:18

정규화 안쓰는건 그럴수있어도 학습할 모델에서 만드는거 자체는 드림부스 논문에서 나온걸로 아는데 그걸 반박하는건가? 충격인데

펼쳐보기▼

분노한_주황_뻐꾸기

2022-12-09 12:55:59

뭐 반박이라기보다는 드림부스에서 더 발전한거라고 볼 수 있겠네

펼쳐보기▼

순박한_빨간_양

2022-12-09 13:00:02

아 얘네 방법에서구나ㅋㅋㅋㅋ

펼쳐보기▼

분노한_갈색_북극곰

2022-12-09 17:27:26

Implementation 나와야 진짠지 구란지 아는데

펼쳐보기▼

슬픈_파란_토끼

2022-12-10 05:31:21

개냥이 ㅋㅋㅋ

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 정보 그림 드림부스 임베딩 하이퍼

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 27959189

공지 파딱 마음대로 작성한 AI그림 학습 채널 규정 - [24-01-24]

포리X 2023.10.29 1940

공지 [리퀘스트] 탭이 추가되었습니다.

선한_하얀_사자 2023.02.10 3359

공지 신문고

Anon 2023.02.21 3155

공지 각종 학습파일 적용법

거만한_보라_달팽이 2023.01.24 39167

공지 그림 학습법 모음

거친_핑크_외계인 2022.10.30 72057

숨겨진 공지 펼치기(1개)

353 정보 WD 1.4 관련 이야기는 정확히 설명하자면

건방진_빨간_오징어 2022.12.14 1333 9

352 WD 1.4 프리뷰 공개 [7]

센치한_분홍_돼지 2022.12.13 1103 10

351 캐릭터 하나 학습 일지 [5]

싹싹한_갈색_치타 2022.12.13 1353 9

350 아 이거 볼때 반응 졸잼 이였는데

거친_빨간_돌고래 2022.12.12 519 5

349 나는 챈붕이들한테 항상 감사하고 있음 [3]

소심한_은색_사자 2022.12.12 692 11

348 하이퍼 요즘 하이퍼 돌리는 친구들중 스텝수 깔짝 돌리는사람 많길래 예시사진 들고옴 [9]

시크한_파란_외계인 2022.12.11 1815 14

347 정보 Monkeypatch extension 설명 [2]

센치한_보라_고양이 2022.12.09 1403 8

346 정보 Custom Diffusion - 하이퍼 + 드림부스 = ?? [6]

분노한_주황_뻐꾸기 2022.12.09 1738 6

345 정보 LORA - 6gb vram으로 드림부스를? [18]

소탈한_하얀_하마 2022.12.09 2096 10

344 정보 내가 원하는 색상을 뽑아 사용해보자 [6]

선한_파란_코알라 2022.12.07 1226 9

343 정보 null text inversion 공식 코드 떴다. [5]

거만한_노란_다람쥐 2022.12.06 822 7

342 하이퍼 하이퍼네트워크 가이드 (일반편은 일단완성 -) [26]

얌전한_초록_악어 2022.12.04 4574 20

341 정보 정규화 유무 차이 정리함 [1]

못된_초록_다람쥐 2022.12.02 2133 6

340 그림 Hypernetwork Monkeypatch Extension <- 이거 잘되네요!! [5]

기쁜_청록_너구리 2022.12.02 866 6

339 정보 지금까지 나온 드림부스 레포 전부써봤는데 kohya_ss가 제일 상위호환인듯 [10]

소심한_남색_돼지 2022.12.01 1927 6

338 정보 Gamma Train(Extension)으로 하이퍼 학습 따라하기 [8]

행복한_남색_수달 2022.12.01 1388 9

337 그림 차가 좋다 [1]

흉악한_파란_호랑이 2022.11.30 399 5

336 MonkeyPatch 학습률 문제 해결함 [1]

쌀쌀한_하얀_돌고래 2022.11.30 408 5

335 11/30 학습파일 공유 메가 업데이트 [6]

시크한_빨간_문어 2022.11.30 1032 17

334 슬프거나 기분 안좋은 일 있을때 보셈 [11]

센치한_핑크_하마 2022.11.30 779 10

333 그림 그림에서 중요한건 표현력이지 그림체가 아니다 [16]

겸손한_청록_나비 2022.11.29 1658 12

332 주딱아 하이퍼 드림부스 임베딩 탭 나누는게 좋지 않음? [5]

기쁜_은색_곰 2022.11.28 493 7

331 정보 폴더 내 이미지들 gif로 합치기 (파이썬 스크립트) [5]

즐거운_주황_호랑이 2022.11.27 887 6

330 Monkey patch Extension 또 업데이트 (스케쥴러 관련) [4]

엉뚱한_보라_코끼리 2022.11.27 401 5

329 정보 WD 1.4 소식 [6]

씩씩한_까만_원숭이 2022.11.26 923 7

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.