모델에 꼭 CLIP이 필요할까 - AI그림 학습 채널

AI그림 학습 채널

알림 알림 중 알림 취소

구독자 8831명 알림수신 126명 @Anon

그림 AI 학습 정보를 공유하는 채널

모델에 꼭 CLIP이 필요할까

까칠한_갈색_오리

추천 1 비추천 0 댓글 6 조회수 362 작성일 2022-12-01 22:05:44

https://arca.live/b/hypernetworks/64298335

모델을 처음부터 만들 때의 관점임

CLIP 모델은 프롬프트->토큰->임베딩 순으로 변환시켜주는 모델임

그리고 임베딩은 Unet에 들어가서 이미지에 프롬프트 요소를 생성해내는 역할임

문제는 CLIP 자체는 diffusion model의 필수조건이 아니며 원래는 자체적으로 이미지-텍스트 간 상호관계를 만드는 완전히 다른 모델이라는 것이다

그래서 토큰->임베딩 과정에서 GPT-2 트랜스포머 모델을 쓰는데, 이걸 쓰면 프롬프트의 문장 해석에 뛰어난 성능을 보이게 되지만, 많은 양의 태그 및 쉼표에 최적화되진 않았음. 예를 들면 프롬프트 앞의 태그가 프롬프트 뒤의 태그보다 더 잘 먹히는 문제라거나...

NAI 모델은 이 CLIP을 하나도 바꾸지 않았고, WD 1.4는 그나마 태그에 대한 CLIP 파인튜닝을 한다고 해서 그나마 기대하는중.

근데 그냥 CLIP처럼 트랜스포머같은 무거운 모델 없이 그냥 WD1.4 태거에 있는 태그들만 모아서 라벨링한 후 일반적으로 CNN 훈련하듯이 태그를 그대로 넣으면 안되나? 하는 생각을 해봤음

두서없이 썼는데 오늘 학회에서 Imagen 개발자랑 얘기하면서 든 생각임

한국오면 정리 좀 하겠음

댓글 [6]

예민한_분홍_북극곰

2022-12-01 22:50:50

태그 간 상호작용이 있어야 하는데 CLIP 없으면 힘들지 않으려나

펼쳐보기▼

까칠한_갈색_오리

2022-12-01 23:05:28

단부루 태그를 벗어나는 걸 입력하면 똥이 되는게 문제긴 하지
근데 색 말고 태그 간 상호작용이 필요함?

펼쳐보기▼

답답한_은색_수달

2022-12-02 03:18:01

*수정됨

당연히 필요한거 아님? 문맥을 파악하려면 단어의 관계가 중요하잖아, 그리고 태그라는거 자체가 너무 한정적이어서 표현 불가능 한게 많은듯

펼쳐보기▼

당당한_파란_코끼리

2022-12-02 01:00:54

확실히 문장을 입력으로 받는 sd같은경우에는 clip이 필요할것 같긴한데 wd같은 경우에는 모르겠네.

펼쳐보기▼

당당한_파란_코끼리

2022-12-02 01:05:04

*수정됨

sd같은 경우에는 이미지를 조건화 화는데 문장을 이해해야 하기 때문에 pretrain된 clip이 유용할것 같지만 wd같은경우에는 뭔가 pretrain된 tagger를 활용해서 조건화하면 더 좋을것같긴함. 
물론 tagger는 태그에 대해서 순열불변이게 좋을것 같음

펼쳐보기▼

둔한_빨간_까마귀

2022-12-02 03:47:36

문장형으로 대화할 수 있으면 태그?기반 대화도 되지만 그 역은 안되자너, 좀 더 일반적인 모델 구성을 위해선 CLIP모델이 필요할거같은데

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 정보 그림 드림부스 임베딩 하이퍼

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30710936

공지 파딱 마음대로 작성한 AI그림 학습 채널 규정 - [24-01-24]

포리X 2023.10.29 2248

공지 [리퀘스트] 탭이 추가되었습니다.

선한_하얀_사자 2023.02.10 3494

공지 신문고

Anon 2023.02.21 3281

공지 각종 학습파일 적용법

거만한_보라_달팽이 2023.01.24 40123

공지 그림 학습법 모음

거친_핑크_외계인 2022.10.30 73610

숨겨진 공지 펼치기(1개)

정보 MultiResolutional Textual Inversion

느긋한_주황_앵무새 2022.12.02 316 2

그림 1개 더 완성

행복한_까만_표범 2022.12.02 203 1

WD1.4 Tagger Extension 제작자 있음? [2]

까칠한_노란_코끼리 2022.12.02 322 1

webui 하이퍼네트워크 훈련하는데 0step 만에 끝나는 거 정상임? [6]

기쁜_노란_고양이 2022.12.02 234 0

하이퍼 캐릭 학습할때는 오히려 캐릭터 특징은 다 태그에서 빼는게 맞는건가 [3]

느긋한_핑크_강아지 2022.12.02 442 1

드림부스 한 데이터셋만 몇트째 학습중인거냐 ㅋㅋ [2]

흉악한_빨간_잠자리 2022.12.02 415 1

님들 혹시 드림부스 학습 시간 보통 얼마나 걸림? [5]

예민한_빨간_오리 2022.12.02 276 1

와 드림부스 배치사이즈 80정도로 올리면 learning rate [3]

나쁜_주황_치타 2022.12.02 303 1

드림부스 애니띵으로 학습시켜본 사람있음? [3]

씩씩한_빨간_돌고래 2022.12.02 541 0

정규화이미지 잘 골라넣어라 ㄷㄷ; [3]

단호한_빨간_거북이 2022.12.02 520 1

런포드 쓰고있는사람만 [8]

답답한_파란_사슴 2022.12.02 275 0

그림 이건 무슨 요리임?? [4]

훈훈한_갈색_하마 2022.12.02 210 3

탭 나눴음 [7]

정중한_빨간_원숭이 2022.12.02 144 4

그림 waifu돌려도 화질구진데 어떡하냐..

난처한_청록_곰 2022.12.02 278 0

누끼 따고 안따고 차이 많이남? [2]

굳센_초록_캥거루 2022.12.02 457 1

monkey patch는 webui안에 있는 extensions 폴더안에 넣으면 됨? [2]

한심한_노란_원숭이 2022.12.02 102 -1

inpaint로 누끼 따는거 알고 싶다.

훈훈한_주황_까마귀 2022.12.02 243 1

하이퍼 학습에서 exponetial LR 이거 설정 어딨음? [1]

쓸쓸한_밤색_낙지 2022.12.02 68 0

[문의]webui 드림부스질문 [3]

느긋한_빨간_잠자리 2022.12.02 239 0

정보 정규화 유무 차이 정리함 [1]

못된_초록_다람쥐 2022.12.02 2144 6

그림 Hypernetwork Monkeypatch Extension <- 이거 잘되네요!! [5]

기쁜_청록_너구리 2022.12.02 871 6

모델에 꼭 CLIP이 필요할까 [6]

까칠한_갈색_오리 2022.12.01 363 1

질문)강의 보다가 궁금한게 있음, PR 적용이 뭔가요 [3]

느긋한_까만_멧돼지 2022.12.01 144 0

아직 모른는게 너무 많음

난처한_빨간_너구리 2022.12.01 89 -1

그림 드림부스 + 캐릭터 하이퍼 쓰기 [8]

상냥한_은색_부엉이 2022.12.01 550 3

코랩 드림부스 혹시 weight 폴더 안 지우면 이전 학습 데이터 농축됨? [1]

건방진_까만_고양이 2022.12.01 135 0

질문) 여기 AI 고수가 많다던데 [17]

불행한_남색_거미 2022.12.01 331 -2

그림 화질구지 데이터셋 살리기가능? [13]

시크한_주황_쥐 2022.12.01 368 2

드림부스 코랩 학습 데이터 다 지웠는데 저번 학습한 그림이 그대로 나오네 [1]

순박한_은색_치타 2022.12.01 110 0

정보 Gamma Train(Extension)으로 하이퍼 학습 따라하기 [8]

행복한_남색_수달 2022.12.01 1410 9

배경 지워주는 어플 [11]

솔직한_주황_외계인 2022.12.01 339 2

드림부스 ノーコピーライトガール(CP) 부스 공유. [2]

둔한_하얀_고양이 2022.12.01 736 4

캐릭학습 하이퍼랑 화풍학습 하이퍼 같이쓰고 싶은 하루입니다 [7]

쌀쌀한_남색_쥐 2022.12.01 130 1

하이퍼랑 드림부스 같이 쓰니까 씹창나네 [5]

건방진_노란_사자 2022.12.01 179 1

드림부스가 그림체 학습이던가 [22]

흉악한_하얀_문어 2022.12.01 719 1

정규화 파일

쌀쌀한_남색_멧돼지 2022.12.01 134 0

조페나 다들 코랩에서 돌림? [4]

섬세한_파란_닭 2022.12.01 189 0

joepenna 파인튜닝 어캐하냐..

시시한_남색_곰 2022.12.01 178 -1

Tagger 확장 기능 사용하는 챈붕이에게 질문 있음 [2]

순박한_은색_치타 2022.12.01 179 1

드림부스 코랩 쿠다 아웃 오브 메모리로 터져버리는데 뭐가 문제일까 [7]

대범한_노란_낙타 2022.12.01 306 -4

정보 지금까지 나온 드림부스 레포 전부써봤는데 kohya_ss가 제일 상위호환인듯 [10]

소심한_남색_돼지 2022.12.01 1944 6

드림 알몸짤 안넣으니까 벗은 몸을 못그리더라 [7]

소심한_초록_참새 2022.12.01 354 1

WEBUIO 업데이트 이후 하이퍼 학습 오류 질문글. [2]

느긋한_밤색_멧돼지 2022.12.01 200 1

전체글 개념글