[실사로라2|심화학습1] Train batch size - 배치를 올리면 Learning rate를 같이 올려야 한다고?응 맞아. - AI그림 학습 채널

AI그림 학습 채널

알림 알림 중 알림 취소

구독자 8788명 알림수신 125명 @Anon

그림 AI 학습 정보를 공유하는 채널

[실사로라2|심화학습1] Train batch size - 배치를 올리면 Learning rate를 같이 올려야 한다고?응 맞아.

추천 6 비추천 0 댓글 19 조회수 2257 작성일 2023-05-31 10:03:05 수정일 2023-06-05 06:25:44

https://arca.live/b/hypernetworks/77610764

결론부터 말하면 YES! 올려야 한다.

로라를 만들 때 Train batch size를 올리면 Learning rate를 같이 올려야 한다는 이야기가 그냥 받아지고 있다. 나도 그렇게 쓰고 있었다.
예를 들어, Train batch size 1일 때 Learning rate를 1E-4를 썼으면 Train batch size를 2로 올리면 Learning rate를 2E-4로 해야 한다는 거지. 무슨 근거로 이런 띠어리가 나왔는 지 모르겠지만, 그냥 받아들여서 사용하다가 찜찜하더라.
그래서 확인해 보았다.

아래에 내가 올린 "실사로라 만드는 과정 전부 - xRica 님의 실사로라 캠페인 참여" (https://arca.live/b/hypernetworks/77378256?mode=best)에 나와있는 Learning rate의 최적값을 찾는 방법으로 Train batch size를 올려서 테스트 해보았다.
(가정은 이 방법이 Learning rate의 최적값을 찾아준다는 거지. 이 가정이 틀리면 이 정보는 그냥 쓰레기야. 아님 말구)Train batch size 1 보라색 / 2 초록색 / 3 주황색 / 4 군청색 이다.
Learning rate의 최적값: Train batch size 1: 1.04E-4 / 2: 2.99E-4 / 3: 4.12E-4 / 4: 3.95E-4 이다.
Train batch size를 키우면 Learning rate의 최적값이 커진다.

(3에서 4로 배치를 바꾸면 Learning rate의 최적값이 줄어든다, 이건 뭐지? 몰라)

참고로, 로라는 스탠다드, Network Rank (Dimension) 128, Network Alpha 128, Learning rate, Text Encoder learning rate, Unet learning rate 모두 1, 데이터 실사 사진 512, 512)

결론: Train batch size를 올리면 Learning rate를 키워야 한다는 이야기는 해골물이 아니다. 옳다!! Train batch size를 올리면 Learning rate도 키우자.

혹시 Train batch size를 올리면 Learning rate를 올려야 하는 다른 이유가 있을 수도 있지. 꼭 알려주라.

(근거 1도 없는 생각: 각잡고 로라를 만들 때, 배치를 1을 써야 한다고 생각하고 있어.
실제로 로라가 배치를 1로 했을 때가 배치를 키울 때보다 좋더라.
HOXY, 최적 Learning rate가 커지는 것과 관계있지 않을까?
Learning rate라는 것이 결국 조각을 할 때 떼어내는 정도라고 이해하면, 작게 살살 떼어내는 결과물이 더 좋으니까 (과적합 빼고))

댓글

2023-05-31 12:54:47

2023-05-31 13:08:45

실사는 모르겠지만 캐릭터 로라 200개 가까이 찍어내면서 배치1~16 다 해봤는데 그렇게 차이가 느껴지진 않았었음

펼쳐보기▼

2023-05-31 13:14:25

보다 빨리 좋은 결과를 만들기 위한 발악이라고 봐주세요

펼쳐보기▼

2023-06-05 02:59:44

이것은 개추받아 마땅하다

펼쳐보기▼

2023-06-05 02:59:51

2023-06-05 09:25:36

배치 사이즈 누가 2의 배수로 올려야한다고 했는데 상관없나요?

펼쳐보기▼

2023-06-05 09:58:59

에포크는 짝수로 사용하는 것이 좋은데, 배치 사이즈도 짝수여야 하는 지 모르겠습니다. 테스트 안해봐서요.
상식적으로는 모든 Ai를 이용하는 것이 행렬의 계산이라고 가정해보면, 배치 사이즈도 홀수보다 짝수가 안정적일 것 같습니다.

펼쳐보기▼

2023-06-05 10:04:48

아 2의 배수가 짝수라는 소리구나..
2 4 8 16 인줄알고 계속 16으로 썼는데
32로 쓰니까 VRAM 24 다쓰고 퀄이 낮아져서..
감사합니다 20몇 해봐야겠네요 ㅋㅋ

펼쳐보기▼

2023-06-07 07:51:19

모델 해상도와 lr는 별 연관이 없나요?

펼쳐보기▼

2023-06-07 08:04:31

베이스 모델을 말씀하시는 거죠? 엄청 관계있죠.

펼쳐보기▼

2023-06-07 10:08:49

아 드림부스나 로라를 학습할때 학습 해상도를 의미한거 였습니다.
학습해상도를 올리면 lr도 함께 올라가줘야 하는건가요?

펼쳐보기▼

2023-06-07 10:16:27

데이터의 해상도가 커지면 lr을 무조건 올려야하는 것은 아닙니다.
위에 말씀드린 방법으로 최적 lr을 찾아보시죠.

펼쳐보기▼

2023-06-07 10:41:28

로라 학습은 위 방식으로 최적값이 찾아지는걸 확인 했는데
이상하게 드림부스로는 lr값이 안바뀌더라구요??

펼쳐보기▼

2023-06-07 10:46:22

드림부스에서는 Optimizer를 DAaptAdam을 써보세요

펼쳐보기▼

2023-06-07 15:19:18

아 다른게 있나보군요? 업데이트를 안해서 안보였나봐요 감사합니다

펼쳐보기▼

2023-06-08 12:57:33

2트 잘먹겠습니다~ 잘먹겠습니다~ 잘먹겠습니다~ 잘먹겠습니다~ 잘먹겠습니다~ 잘먹겠습니다~ 잘먹겠습니다~

펼쳐보기▼

2023-07-09 03:05:39

배치 6으로 하고있었는디 헉

펼쳐보기▼

2024-01-25 02:08:01

저 그래프의 X축의 값이 의미하는건 뭐에요?
Y축은 LR이라는게 나오는는데요

펼쳐보기▼

2024-01-25 03:55:25

스텝이요

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 정보 그림 드림부스 임베딩 하이퍼

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28097105

공지 파딱 마음대로 작성한 AI그림 학습 채널 규정 - [24-01-24]

포리X 2023.10.29 1976

공지 [리퀘스트] 탭이 추가되었습니다.

선한_하얀_사자 2023.02.10 3375

공지 신문고

Anon 2023.02.21 3167

공지 각종 학습파일 적용법

거만한_보라_달팽이 2023.01.24 39285

공지 그림 학습법 모음

거친_핑크_외계인 2022.10.30 72282

숨겨진 공지 펼치기(1개)

488 이미지 한장으로 학습 & 영상뽑기 (roop-unleashed) [13]

ㅇㅇ 2024.04.19 1298 11

487 정보 아주 간단한 underfit, overfit 판단 방법 [5]

Dalcefo 2024.04.16 741 9

486 정보 뉴비가 쓰는 데이터셋 50장 미만으로 로라 만드는 법 [6]

ㅇㅇ 2024.04.12 1959 35

485 정보 챈이 반 죽어서 쓰는 학습률 설명 [3]

딸기맛봇치 2024.02.29 1841 9

484 정보 Stable Cascade kohya_ss LoRA CUI 학습 사용법 [19]

포리X 2024.02.20 2035 6

483 나도 AI출력물로 AI학습해봤는데 [6]

비비빛 2024.02.14 2047 12

482 정보 인텔 Arc A770 16GB SDXL 학습 간단 후기 [14]

포리X 2024.01.30 1318 5

481 Animagine XL V3와 Pony Diffusion V6 XL의 캐릭터 학습 간단 후기 [15]

포리X 2024.01.21 1911 5

480 정보 webui 1.7.0 버전 wd tagger 속도 빠르게 하는방법 [4]

유찌 2024.01.17 1326 6

479 정보 Text Encoder 학습도 고려해볼만 한 것 같음 [8]

Rainfrog 2024.01.06 1152 5

478 그림 sakifox 작가 Gosuzun 로라 만들어 봄 [1]

ㅇㅇ 2024.01.09 1262 5

477 정보 AI 출력물로 학습데이터 재활용 4 [2]

몬TDAI 2023.12.20 1862 5

476 정보 공지에 있는 로라 학습법에 오류가 있고, 공지대로 했으면 저사양로라를 쓰고 있는거임. [12]

바이오틴 2023.12.13 2040 10

475 정보 아래 의상 학습한사람이 쓴 의상학습법 [6]

ai 2023.11.07 1763 6

474 정보 자료가적은 학습 방법 (1장+) [5]

ai 2023.11.08 3740 11

473 정보 슬라이드 LoRA (복사기 LoRA)를 만드는 방법 [11]

포리X 2023.10.17 2521 11

472 SDXL 로라 성능 걍 미쳤음 [23]

Rainfrog 2023.08.16 5011 6

471 정보 로라 학습법의 모든 것. [8]

serina 2023.08.19 13536 13

470 정보 KOHYA_SS 에서 triton 에러 메세지 제거 방법 [11]

엑시옴 2023.08.15 1803 11

469 정보 SDXL 1.0 kohya_ss LoRA GUI 학습 사용법 (12GB VRAM 기준) [37]

포리X 2023.07.29 11344 7

468 정보 로라 학습 코랩 사용법 (초보 대상) (+ 학습 코랩 한글화 공유) [11]

해머임팩트 2023.07.17 3400 12

467 정보 [실사로라6|심화학습5] weighted caption은 진짜 효과가 있나? [8]

엑시옴 2023.07.10 2769 5

466 정보 SDXL 0.9/1.0 kohya_ss LoRA CUI 학습 사용법 (12GB VRAM 기준) [5]

포리X 2023.07.11 3027 5

465 [실사로라7|응용학습1] 그림 한 장으로 로라 만드는 과정 [11]

엑시옴 2023.07.07 4611 10

464 하이퍼 요즘 뜬금없이 하이퍼네트워크 질문이 늘어나고 있네 [1]

포리X 2023.06.13 1541 9

463 [실사로라5|심화학습4] clip skip은 얼마로 로라를 만들어야 할까? [13]

엑시옴 2023.06.06 2433 9

462 [실사로라2|심화학습1] Train batch size - 배치를 올리면 Learning rate를 같이 올려야 한다고?응 맞아. [19]

엑시옴 2023.05.31 2258 6

461 정보 [실사로라3|심화학습2] 데이터 가공과 퀄 [19]

엑시옴 2023.06.02 6609 13

460 정보 [실사로라1|모든 과정] 실사로라 만드는 과정 전부 - xRica 님의 실사로라 캠페인 참여 [26]

엑시옴 2023.05.28 14051 21

459 정보 BRA v5 모델이 실사로라의 베이스 모델로 아주 좋음 [17]

엑시옴 2023.05.19 4175 10

458 정보 코이카츠 그림체 lora를 통한 자캐 lora 학습 단순화 [4]

ㅇㅇ 2023.04.23 3766 11

457 정보 civitai에 올라온 로라 학습법 [11]

ai 2023.04.19 13681 16

456 로라 블록 (혹은 레이어) 학습 - 필요한 것만 중점적으로 학습시킬 수 있을 지 [15]

엑시옴 2023.04.15 2459 5

455 정보 학습 모델 5개 비교 [7]

머팔로 2023.04.05 5572 7

454 LORA 학습을 위한 KOHYA가 업데이트 되면서 특정 블록만을 지정해서 학습시킬 수 있다고 하는 데, HOXY 해보신 분? [23]

엑시옴 2023.04.05 4117 14

453 정보 학습 해상도 차이 및 태그 정제 유무 비교 [20]

머팔로 2023.04.01 5341 19

452 정보 누군가는 궁금할 수 있었던 그 그림체 로라 학습세팅 [16]

까나리아 2023.03.31 6590 13

451 정보 로라 학습 간단 팁 - 1 [10]

asde31c 2023.03.26 8448 10

450 장사꾼들은 좀 꺼져라 [4]

Anon 2023.03.22 2949 22

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.