dim/alpha 궁금해서 찾아봤던것들 - AI 그림 채널

AI 그림 채널

채널위키 알림 알림 중 알림 취소

구독자 75740명 알림수신 1666명 @NO_NSFW

인공지능으로 제작한 그림을 자랑하고 정보를 공유하는 채널

일반 dim/alpha 궁금해서 찾아봤던것들

추천 2 비추천 0 댓글 11 조회수 410 작성일 2023-04-17 04:29:11 수정일 2023-04-17 04:29:37

https://arca.live/b/aiart/74232877

최종학습률 공식

chatgpt한테 물어본건데

얘는 자기가 모르는거 나오면 말 지어내는 얘라서

alpha값 64올랐다고 64배를 나누는게 맞나...?

https://rentry.org/lora_train

여기에는 alpha를 dim 절반값 주는게 좋다고하는데

LR값을 모두 같은값을 준거면 학습률 변동돼서 적절한 학습률로 학습된 결과보고 느껴진거 같기도해서 잘 몰르겠음

https://rentry.org/59xed3#20230406

https://rentry.org/59xed3#20230406

여기도 dim/alpha 정보는 나와있는데 저 빨간표가 무슨뜻인지 이해안감

댓글 [11]

2023-04-17 04:42:14

오...개추

펼쳐보기▼

2023-04-17 04:43:20

dimension은 학습률 결정보다 모델 복잡성을 정하는데 더 우선 순.위라서, 적합한 lr을 찾기 위해 dimension을 정한다는 것은 주객전도임

alpha는 모델 복잡성에 직접 영향을 주지 않고 학습 시, 모든 모듈에 적용되는 scale factor임. 따라서 lr을 고려할 때 alpha값을 생각해야 함이 맞음

근데, 상식적으로 두 값을 동시에 조정하면서 최적값을 찾을 바엔 둘 중 하나를 고정하고 나머지 하나를 찾는게 편하고, 조금 더 범용적으로 사용되는 learning rate값을 조정하는 것이 일반적이기 때문에 alpha는 그냥 하나로 정하고 학습 시작하는게 편함. 어차피 alpha값 조정도 학습률을 조정하려고 하는거니깐

마지막 밑에 빨간건 α/r의 값에 따라 학습률의 배율이 달라진다는 걸 설명한거

펼쳐보기▼

2023-04-17 04:56:30

dim / alpha를 낮게 고정하더라도 learning rate 값을 높이거나 조정하면 된다는 말인가

펼쳐보기▼

2023-04-17 05:04:25

어차피 두 개를 조정하든 하나를 고정하고 다른 걸 조정하든 똑같은 행위임

펼쳐보기▼

2023-04-17 04:58:08

원래 배치2 기준 dim128/alpha64 , unet lr 1.5e-4, 텍스트인코더 1.5e-5 이렇게 고정으로 쓰고 있었음
그런데 데이터셋때문인지 매번 다른 캐릭학습할때마다 결과가 마음에 들고 안들고 차이가 심하더라고 
두번째 링크때문에 dim128/alpha64 로 고정 해두고 적당 lr값 찾는중였는데 그게 그거같아가지고 한동안 그냥 쓰고있었음

맨마지막
dim128=alpha128 = 128/128=x1
이렇게 안써있고

Alpha 0 = Alpha 128 = 128/128 = x1
Alpha 1 = 1/128 = x0.0078125
Alpha 64 = 64/128 = x0.5
둘다 alpha로 써있어서 이해가 안가는데
그럼 마지막은 dim32,alpha32이면 학습배율이 32배, 128/128이면 128배
32/16이면 16배? 아 어렵네

펼쳐보기▼

2023-04-17 05:03:37

dim32 alpha32이랑 128 128은 최종 학습률에 변동없이 들어가고 dim32 alpha16은 0.5배율로 들어감

ΔW에 곱해지는게 α/dim 이거든

펼쳐보기▼

2023-04-17 05:07:27

https://arca.live/b/aiart/68914565

보고 오셈

펼쳐보기▼

2023-04-17 05:29:09

읽어봤는데 내 머리로 이해하긴 어렵네
rank를 굳이 높게 잡을 필요가 없다는거 같은데 요즘 시비티에 dim32짜리가 많긴한듯
rank128이 해골물이여도 디테일 더 사는기분이라 사용했는데 함 줄여도 봐야겠네
덕분에 궁금한거 많이풀림 ㄳㄳ

펼쳐보기▼

2023-04-17 05:13:32

*수정됨

https://arca.live/b/aiart/74043296/346720598#c_346720598 이 글 보면 https://arca.live/b/aiart/71341748 이 글보고 설정 똑같이해서 작업했다는데... alpha값도 1이고... lr 설정이 저게 맞아...????

펼쳐보기▼

2023-04-17 05:47:33

alpha에 대해선 쟤가 적절한 lr값을 넣어서 한 거고, 더 중요한건 데이터셋을 얼마나 어떻게 구성했는지가 더 중요함

펼쳐보기▼

2023-04-17 05:57:30

오키...

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 그림 공지 운영

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 31275730

공지 AI 그림 채널 통합 공지 (2024-06-08)

NO_NSFW 2022.10.23 614585

공지 ( 진행중 ) 대회 관련 공지 / 현재 진행중인 대회

NO_NSFW 2023.02.01 71298

공지 AI그림 채널 신문고

NO_NSFW 2022.12.10 78001

공지 본 채널은 AI 그림의 수익화를 반대합니다.

NO_NSFW 2023.05.11 60079

공지 공지 정보글에 여러분들의 기여가 필요합니다

DeepCreamPy 2023.02.21 86091

숨겨진 공지 펼치기(1개)

일반 "맥주 캔 사진으로 AI 해보려다가 포기" 를 보고 나도 한번 [3]

Jason 2023.04.17 416 5

그림 urban samurai 재탕 [3]

Hedera 2023.04.17 493 2

그림 니지) 모델별 검은 드레스를 입은 귀부인 [7]

cosin 2023.04.17 734 2

그림 ai놈들 가슴크기에 왜케 관대함 [7]

Irys 2023.04.17 943 1

그림 니지 신규 모델 돌리는 중인데 [5]

무명 2023.04.17 439 6

일반 하.. 가슴사이에 손 집어넣게 하는거 개힘들당.. [1]

sultna123 2023.04.17 544 0

일반 dim/alpha 궁금해서 찾아봤던것들 [11]

ㅇㅇ 2023.04.17 411 2

그림 이런것도 되기는 하네요 [3]

ilillliiil 2023.04.17 411 3

그림 터틀넥스웨터로 열심히뽑아봄 [2]

3864밈 2023.04.17 445 2

일반 ai가 그림쟁이를 망하게 한다는 이야기를 나는 믿지 않는다 [21]

CYYKA 2023.04.17 2623 30

일반 ai 짤뽑기는 하면 할수록 어렵네 [2]

TNTER 2023.04.17 361 0

일반 막상 실사풍으로 짜다보면, 애니풍과 다르게 불투명 스타킹&오페라 글러브 같은거 고증 못하더라

글레이셔_자벨린 2023.04.17 655 0

일반 아니 SD가 유료가 됨? [3]

린델하이거 2023.04.17 607 -5

그림 불금 강남역 풍경 [3]

린델하이거 2023.04.17 789 5

일반 로라 뭐 만들지 추천좀 [3]

dd 2023.04.17 244 1

그림 beenyou의 다음 정거장은 [3]

AARRI 2023.04.17 507 3

그림 TemporalNet 을 사용해 이미지 일관성 증가 시키기 [2]

아문 2023.04.17 1264 2

일반 다음달부터는 런포드를 써볼까 [2]

애옹 2023.04.17 172 0

그림 생각보다 잘 나온다 [1]

하야카 2023.04.17 360 0

그림 4컷 만화) 초완벽 미소녀 [7]

지나가는듀얼리스트 2023.04.17 2075 29

일반 하 언어모델쪽 파보려고 좀 해보니까 [4]

Purple_Spice 2023.04.17 330 0

일반 존댓말 질문글 특 [10]

아주보통 2023.04.17 1870 37

전체글 개념글