학습 해상도 차이 및 태그 정제 유무 비교

AI그림 학습 채널

알림 알림 중 알림 취소

구독자 8787명 알림수신 124명 @Anon

그림 AI 학습 정보를 공유하는 채널

정보 학습 해상도 차이 및 태그 정제 유무 비교

머팔로

추천 19 비추천 0 댓글 20 조회수 5329 작성일 2023-04-01 14:33:10 수정일 2023-04-01 14:34:39

https://arca.live/b/hypernetworks/73134669

3줄요약

1. 학습 해상도는 높을수록 좋다

2. 512 -> 768은 체감 크지만 768 -> 1024는 학습시간 2배 증가하는거에 비해 딱히?

3. 태그 정제 굳이 할 필요없음

1. 학습 해상도

학습한 캐릭터 (홀로라이브 하쿠이 코요리)

해상도 구분 : 512, 512 / 768, 768 / 1024, 1024

해상도 이외 모든 세팅 동일 : rank = alpha = 8 / Unet = 0.00015 / Text = 0.00003 / cosine with restarts / 학습 이미지 180장 repeat 5 epoch 20 = 총 18000스탭 / batch size = 1 / 이미지가 학습 해상도보다 작을 시 bucket 해상도로 업스케일하는 기능 on

9000 스탭 학습시간(512 = 1시간 / 768 = 2시간 / 1024 = 4시간). 한번 더 돌려서 18000스탭 학습했으니까 총 소요시간은 이의 2배 (2, 4, 8시간)

이미지 픽셀 수에 따라 정말 정직하게 비례함...

특이사항) 같은 셋팅인데도 해상도가 높을수록 로스가 작다

512는 확실히 머리장식 구현도가 떨어짐. 768하고 1024는 큰 차이는 없지만 1024가 조금 더 안정적인 모습

해상도가 높아질수록 넥타이랑 가슴 주머니의 시계 표현이 개선되는 모습

full body 구도에선 큰 차이 없다

2. 태그 정제

로라 캐릭 학습 과정.process - AI 그림 채널 (arca.live)

이 글 쓴 본인인데 여기선 여러 의상 구현하려면 최대한 태그 정제하는게 좋다고 설명했는데 (이론상으론 문제없긴함) 오히려 정제 안한게 좋다는 사람도 있고 나도 직접 비교해보진 않아서 실험해봄

학습한 캐릭터 (홀로라이브 히메모리 루나)

데이터셋 : 의상 1(기본) / 의상 2(캐주얼) 각각 56장

WD 1.4 Tagger (0.35) 돌린 후 태그 정제.

정제 기준 : 의상에 상관없이 공통적으로 들어갈 수 있는 태그 대부분 / 캐릭 이름(himemori luna), 1girl, solo, 머리색, 눈색, 배경(white background, simple background), 표정, 그 외 기타(virtual youtuber, twitter username, breasts 등)

정제유무 외 모든 세팅 동일 : 해상도 = 768, 768 / rank = alpha = 8 / Unet = 0.00015 / Text = 0.00003 / cosine with restarts / repeat 7 epoch 20 = 총 17920스탭 / batch size = 1

정제한 로라와 안한 로라 2개로 정제된 태그와 정제안한 태그를 각각 뽑는것으로 비교

*Tagging = 정제 O, Untagging = 정제 X

의상 1 정제된 태그 : long hair, crown, princess, pink dress, hair rings, earrings, bracelet earrings, one side up, short sleeves, wavy hair, detached collar, bare shoulders, cowboy shot, thighhighs, frilled skirt

정제한 로라는 태그에서 heterochromia 와 눈색을 빼버리고 로라 자체에 흡수시켜 프롬을 안써도 오드아이로 나오지만 정제안한 로라는 그렇지 않은 모습. 스커트 부분도 약간 어설픈 느낌.

의상 1 정제안한 태그 : cowboy shot, thighhighs, 1girl, himemori luna, virtual youtuber, solo, heterochromia, candy hair ornament, long hair, crown, dress, jewelry, pink hair, food-themed hair ornament, green eyes, open mouth, hair ornament, purple eyes, single hair ring, princess, looking at viewer, pink dress, smile, white background, hair rings, earrings, simple background, bracelet, crescent, crescent earrings, gradient hair, multicolored hair, mini crown, breasts, one side up, bangs, :d, short sleeves, wavy hair, detached collar, purple hair, medium breasts, twitter username, blush

물론 정제안한 로라도 태그를 다 써주면 제대로 나오긴함.

의상 2 정제된 태그 : cowboy shot, crown, ahoge, necklace earrings, blue dress, earrings, bracelet, starry sky print, off shoulder, off-shoulder dress, hairclip, parted lips, star \(symbol\), bare shoulders, collarbone, short hair, star print, sleeveless, sleeveless dress print, blue hair

눈색 문제는 여전하지만 정제안한 로라도 의상은 거의 동일한 구현도를 보여줌

의상 2 정제안한 태그 : cowboy shot, himemori luna, 1girl, virtual youtuber, dress, heterochromia, crown, solo, ahoge, jewelry, hair ornament, purple eyes, crescent, green eyes, candy hair ornament, mini crown, necklace, multicolored hair, crescent earrings, blue dress, blush, food-themed hair ornament, purple hair, earrings, looking at viewer, bracelet, pink hair, white background, bangs, starry sky print, off shoulder, gradient hair, simple background, off-shoulder dress, hairclip, parted lips, star \(symbol\), bare shoulders, collarbone, short hair, star print, sleeveless, sleeveless dress, crescent print, blue hair

오히려 정제한 로라에 정제 안한 고봉밥 프롬을 쓰니까 구현도가 떨어지는 모습?

결론만 말하면 2개 의상 구현하려는 정도에선 정제 하나 안하나 큰 차이는 없는듯. 일부러 어렵게하려고 둘다 dress 계열로 준비했는데도 체인지 잘되니 뭔..

짧은 프롬으로도 구현도 높게 뽑고싶으면 정제하고, 프롬 길게써도 상관없으면 안해도 될듯.

구현하려는 의상이 3개 4개 넘어가면 다를수도 있겠지만 이건 나중에 실험해봄

포리X

2023-04-01 14:57:10

유찌

2023-04-01 15:12:16

선생님 구드에 학습데이터 올려주신거 다시 올려주시면 안되나요??
레이블 개념이 이해가 안되서 다시 한번 보고싶은데 내려가서요 ㅠ.ㅠ

펼쳐보기▼

유찌

2023-04-01 15:44:42

감사합니다 센세

펼쳐보기▼

온천프롬외길인생

2023-04-01 15:19:37

추천주고 댓글다는데 512x512 사진도 더 높은 해상도로 훈련시키면 더 좋음? 어떤 글에서 512x512사진은 512x512만 좋다그래서 그렇게만 해봄

펼쳐보기▼

머팔로

2023-04-01 15:39:14

bucket_no_upscale 옵션을 키면 학습 해상도를 높게 설정해도 데이터셋 이미지의 해상도로 학습해서 상관없음(즉 학습 해상도를 올려도 효과 X). 문제는 이 옵션을 꺼서 저해상도 이미지를 학습 해상도까지 업스케일해서 학습하는 경우인데, 이건 나도 잘 모르겠음. 굳이 모험하고 싶지 않으면 데이터셋 이미지에 맞는 해상도로 학습하길 추천

펼쳐보기▼

ㅇㅇ

2023-04-01 15:25:08

ㅇㅇ

2023-04-01 15:31:05

태깅 그냥 머리모양 머리색 눈색 이런거만 정제하면 되는거같음 너무 이거저거 다 빼면 과적합될 가능성 올라가는거같기도 하고

펼쳐보기▼

머팔로

2023-04-01 16:01:00

1토큰 태깅은 확실히 효과가 있었으니까 태그도 최대한 의상간 겹치는거 없게 정제하는게 좋다고 생각했는데... 좀 더 연구해봐야겠음

펼쳐보기▼

까나리아

2023-04-01 17:46:12

768->1024는 진짜 뭔가 막눈이라
그런가 별 체감 안 되드라

펼쳐보기▼

유찌

2023-04-01 18:09:55

근데 나 이미지 100장 기준 6000스텝 정로도 마무리하는데 그래도 강도 1에서 깨짐 심하던데 16000스텝? ㄷㄷ 원래 이렇게 높게 해야되는건가

펼쳐보기▼

머팔로

2023-04-01 18:20:30

약간 과적합된 정도에서 실험하는게 좋을거같아서 많이 돌렸음. 원래는 9000스탭 정도에서 끝냄

펼쳐보기▼

2023-04-01 20:26:03

768이 되긴하는구나 개추

펼쳐보기▼

OopoO

2023-04-02 03:17:29

ㅇㅇ

2023-04-02 14:35:27

ㅇㅇ

2023-04-09 07:26:59

다양한 의상을 뽑을 수 있게 해준다가 정제의 장점이라면서 왜 실험은 기존 의상 구현도로 했냐

펼쳐보기▼

머팔로

2023-04-09 08:18:43

뭔소리임 의상 2개 준비했잖아

펼쳐보기▼

ㅇㅇ

2023-04-09 10:38:04

내가 이해한 다양한 의상은 캐릭터의 특징인 핑크단발이면 핑크단발, 핑크 롱 펌이면 롱 펌 유지한채로 옷을 교복 정장 등등 태그로 다른 의상을 입혀줄 수 있다는 의미로 받아들인거야 학습할때 입힌 의상이 아니고

펼쳐보기▼

머팔로

2023-04-09 13:12:00

그건 설사 한 의상만 학습했다고 해도 가중치 내리고 프롬프트 잘 조정하면 다 된다고 생각하는데. 데이터셋에 여러 의상 입은 캐릭터 그림이 조금씩 섞여있으면 더 좋고. 어쨌든 태깅이랑은 상관없다고 생각함.

펼쳐보기▼

초식짱

2023-04-09 14:37:36

와 그림 딱 2장으로 이런 학습이 가능한건가요??? 진짜 대단하다....

펼쳐보기▼

가모라여동생

2023-04-12 04:58:56

각각 56장

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 정보 그림 드림부스 임베딩 하이퍼

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28022648

공지 파딱 마음대로 작성한 AI그림 학습 채널 규정 - [24-01-24]

포리X 2023.10.29 1953

공지 [리퀘스트] 탭이 추가되었습니다.

선한_하얀_사자 2023.02.10 3365

공지 신문고

Anon 2023.02.21 3160

공지 각종 학습파일 적용법

거만한_보라_달팽이 2023.01.24 39226

공지 그림 학습법 모음

거친_핑크_외계인 2022.10.30 72189

숨겨진 공지 펼치기(1개)

2122 정보 뉴비가 쓰는 데이터셋 50장 미만으로 로라 만드는 법 [6]

ㅇㅇ 2024.04.12 1884 35

2121 진짜 인공지능의 기본도 모르는 그림쟁이들 지긋지긋하다 [25]

분노한_남색_개복치 2022.10.23 1992 28

2120 장사꾼들은 좀 꺼져라 [4]

Anon 2023.03.22 2947 22

2119 정보 [실사로라1|모든 과정] 실사로라 만드는 과정 전부 - xRica 님의 실사로라 캠페인 참여 [26]

엑시옴 2023.05.28 14025 21

2118 그림체학습 씨발 정답을 드디어찾았다.. [6]

쌀쌀한_파란_멧돼지 2023.02.13 5142 21

2117 요 몇주간 서로 정보공유하고 가이드 써서 일러주고 [6]

굳센_분홍_기린 2022.10.31 563 21

2116 정보 로라 학습 간편설치기 [14]

예리한_파란_올빼미 2023.01.31 6208 20

2115 각종 학습파일 적용법 [21]

거만한_보라_달팽이 2023.01.24 39226 20

2114 하이퍼 하이퍼네트워크 가이드 (일반편은 일단완성 -) [26]

얌전한_초록_악어 2022.12.04 4580 20

2113 정보 이미지 사이의 유사도를 어떻게 구하는 것일까? [14]

훌륭한_청록_낙타 2022.11.19 1266 20

2112 정보 드림부스의 이론 및 주저리 [10]

즐거운_초록_벌 2022.11.11 3966 20

2111 정보 ShivamSharo / TheLastBen 코랩 드림부스 초간단사용법 [35]

센치한_노란_까마귀 2022.11.10 15426 20

2110 hypernetworks, embeddings 적용법 [17]

주딱 2022.10.19 17604 20

2109 정보 학습 해상도 차이 및 태그 정제 유무 비교 [20]

머팔로 2023.04.01 5330 19

2108 정보 그대로 따라하는 webui 드림부스 가이드 [27]

훈훈한_노란_익룡 2022.11.24 8939 19

2107 정보 또또또 신기술 떴다 ㅋㅋㅋ [14]

의젓한_갈색_멧돼지 2022.11.09 1956 19

2106 영구차단은 좀 너무하네 ㅋㅋㅋㅋ [27]

의젓한_까만_돌고래 2022.10.22 1086 19

2105 학습챈 망령들 특 : [8]

호탕한_노란_나비 2023.02.08 1795 17

2104 11/30 학습파일 공유 메가 업데이트 [6]

시크한_빨간_문어 2022.11.30 1033 17

2103 원효대사 해골물 메타였던적 있냐 [6]

호탕한_밤색_코끼리 2022.11.21 848 17

2102 뭐야 그림체 학습 뉴스탔다 ㅋㅋㅋㅋ [22]

슬픈_초록_치타 2022.11.03 3050 17

2101 정보 런포드에서 드림부스 구동법 정리 [20]

엉뚱한_노란_여우 2022.10.27 20161 17

2100 정보 civitai에 올라온 로라 학습법 [11]

ai 2023.04.19 13659 16

2099 일본에 그림체 학습용 서비스 보니까 진짜 개웃기네ㅋㅋㅋㅋㅋ [7]

굳센_하얀_캥거루 2022.10.23 1107 16

2098 1022 artist별 hypernet 모음 업데이트 [6]

ㅇㅇ 2022.10.22 810 16

2097 학습챈 업데이트했습니다 [4]

시크한_금색_멧돼지 2023.01.24 793 15

2096 정보 날림으로 소개하는 날림 하이퍼 학습 방법 [24]

겸손한_초록_거위 2023.01.17 8385 15

2095 ???: 학습은 안했다 [10]

호탕한_남색_뱀 2022.11.14 790 15

전체글 개념글