VRAM이 엄청 클 경우 배치사이즈 늘리지 말고 차라리 gradient checkpoint를 끄는게 더 나은듯 - AI그림 학습 채널

AI그림 학습 채널

알림 알림 중 알림 취소

구독자 8830명 알림수신 126명 @Anon

그림 AI 학습 정보를 공유하는 채널

정보 VRAM이 엄청 클 경우 배치사이즈 늘리지 말고 차라리 gradient checkpoint를 끄는게 더 나은듯

의젓한_보라_외계인

추천 8 비추천 0 댓글 3 조회수 2290 작성일 2022-12-16 16:26:28 수정일 2022-12-16 16:36:16

https://arca.live/b/hypernetworks/65422980

보통 빠른 학습을 위해서 배치사이즈를 늘린다면 VRAM를 N배로 쳐먹기 때문에 약 20%의 성능저하를 대가로 이를 루트 N 만큼으로 줄일 수 있는 gradient checkpoint 를 켜놓을 것임. (Joepenna repo의 경우 코드 뜯어본 사람은 알겠지만 기본으로 적용되어 있음) 나도 그래서 그걸 켜고 배치사이즈를 최대한 늘려봄.

그래서 batchsize 80으로 해봤더니 학습률 조절도 힘들고 데이터셋에 비해서 배치사이즈가 너무 커져서인지 특징 추출을 제대로 못함
그렇게 되면 batchsize를 크게 했을때 장점이 학습 속도가 빠르다는거 하나인데

차라리 gradient checkpoint를 끄고 batchsize 16으로 하면 batchsize 80으로 gradient checkpoint 켰을 때랑 같은 속도로 학습가능해짐

댓글 [3]

시크한_초록_외계인

2022-12-16 19:53:12

유용한 정보네.. ㄱㅅㄱㅅ

펼쳐보기▼

거만한_파란_양

2023-01-04 15:16:57

https://only-wanna.tistory.com/entry/Gradient-checkpointing%EC%9D%B4%EB%9E%80
이글 맞음? 체크포인트 키고 배치사이즈 어디까지 키울지 계산해보다가 찾았는데 이미지가 같네

Gradient checkpointing이란

GitHub - cybertronai/gradient-checkpointing: Make huge neural nets fit in memory Make huge neural nets fit in memory. Contribute to cybertronai/gradient-checkpointing development by creating an account on GitHub. github.com 모든 사진과, 글은 위의 링크를 참조했습니다. Graident checkpointing? GPU 사용 시 사용 가능한 메모리를 늘리기 위…

이글 맞음? 체크포인트 키고 배치사이즈 어디까지 키울지 계산해보다가 찾았는데 이미지가 같네

펼쳐보기▼

의젓한_보라_외계인

2023-01-04 16:43:28

난 깃헙 원본글만 봤음

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 정보 그림 드림부스 임베딩 하이퍼

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30801509

공지 파딱 마음대로 작성한 AI그림 학습 채널 규정 - [24-01-24]

포리X 2023.10.29 2260

공지 [리퀘스트] 탭이 추가되었습니다.

선한_하얀_사자 2023.02.10 3500

공지 신문고

Anon 2023.02.21 3289

공지 각종 학습파일 적용법

거만한_보라_달팽이 2023.01.24 40162

공지 그림 학습법 모음

거친_핑크_외계인 2022.10.30 73658

숨겨진 공지 펼치기(1개)

5600 으앜시발 업데이트해라 [1]

몬TDAI 2024.03.21 413 3

5599 로라 학습할 때마다 딜레마임 [3]

ㅇㅇ 2024.03.21 365 0

5598 19000스텝 학습중인데여 [5]

Hakdld 2024.03.18 314 0

5597 배치사이즈를 늘렸는데 왜 gpu를 덜 쓰는거지...? [2]

초고추장커피국밥 2024.03.18 227 0

5596 머야 신버전 좀 느려진건가 [2]

몬TDAI 2024.03.18 249 0

5595 kohya 코랩 오류가 많이 보이네 [1]

로베론 2024.03.17 376 3

5594 정보 LyCORIS 2.2.0/post1에 DoRA쪽 구현 오류 있었음 [5]

딸기맛봇치 2024.03.16 250 1

5593 코랩 xl 로라는 학습 정상적으로 되는데 일반 로라만 안되네요.. 희안하네 [2]

ㅇㅇ 2024.03.16 277 0

5592 Lora 학습 오류 질문드립니다 [2]

김치참치부대찌개 2024.03.16 264 0

5591 kohya_ss 로라 학습 오류 도움 부탁드립니다...

ㅇㅇ 2024.03.16 259 0

5590 XL 학습 & 사용 모델로 뭐할지 고민된다 [7]

블랍 2024.03.16 364 1

5589 정보 코랩 Hollowstrawberry SDXL Lora 학습 [5]

블랍 2024.03.15 863 2

5588 코햐스크립트 원클릭 설치 최신버전 문제 [3]

몬TDAI 2024.03.14 390 1

전체글 개념글