활성화 함수 간략테스트 결과 - AI그림 학습 채널

AI그림 학습 채널

알림 알림 중 알림 취소

구독자 8808명 알림수신 126명 @Anon

그림 AI 학습 정보를 공유하는 채널

정보 활성화 함수 간략테스트 결과

상냥한_은색_부엉이

추천 11 비추천 0 댓글 2 조회수 658 작성일 2022-10-26 14:20:45 수정일 2022-10-26 14:21:01

https://arca.live/b/hypernetworks/61492265

이번에 활성화함수가 다양하게 업데이트 되었다.

이참에 하이퍼네트워크에 잘 먹히는 활성화함수를 한번 찾아보는것도 재밌을것 같아, 퇴근하고 잠깐 끄적여봤다.

시드값 원본 - 특별한 의미는 없고 아무거나 뽑았음.

학습대상의 화풍. 누구 그림인지는 언급 자제부탁.. 아무래도 당사자의 동의도 없는데다,

혼자 연구용으로 써먹는거라 알려져봐야 좋을 것도 없을테니. 연구 후 전체 학습데이터는 삭제 예정.

데이터 학습은 똑같은 프리셋으로 진행.

학습률 : 5e-5,

스탭은 작게 2000 steps로 진행. (수렴속도를 보기 위함도 있고, 학습률이 높아 스탭을 작게 진행함)

단, LeRU 모델은 학습률 : 2e-7, 스탭은 100000 steps로 진행.

활성화 함수 ReLU

일반적으로 많이 쓰는 함수지만, dying ReLU 문제가 있다.

ReLU의 가장 큰 약점이자 장점은 양수부에서 가중치가 무한정 증가한다는 점이 있다.

따라서 강렬한 특성은 잘 캐치해내지만, 세부특성은 상대적으로 약해지는 단점이 존재.

실제로 특징적인 화풍은 어느정도 캐치를 해냈으나, 세부적인 특성에 대해서는 약한것을 알 수 있다.

머리카락쪽의 펜선 쓰는 방식 같은거는 어느정도 특성을 잘 캐치해낸 것을 확인할 수 있음.

활성화함수 tanh

하이퍼볼릭 탄젠트는 함수의 평균출력이 1으로 수렴하므로, 학습이 굉장히 빠르다는 장점이 있다.

기존에 하이퍼네트워크 아키텍처를 건드려봤을 때, 심층네트워크 학습이 어렵다는 문제가 있다는 점,

어지간해서는 Loss가 크게 줄지 않는다는 점을 고려해보면 학습속도가 상당한 문제를 일으킨다는 점이 예상이 되는 상황.

그래서 학습이 빠르다는 tanh를 사용해보았다.

결과는 학습은 빨랐지만 특성캐치에는 확실히 약한 것이 느껴졌다.

그렇다면 이건 가중치가 굉장히 작은 경우가 아닐까 하고 가정을 했다.

활성화 함수 hardtanh

하드 탄젠트 하이퍼볼릭의 장점은 가중치가 작은 값 범위 안에 있을 때 아주 잘 작동한다는 점이다.

가만 생각해보면 화풍이란 무엇일까?

똑같은 물체를 그릴 때 세부적인 표현의 차이가 아닐까 싶다.

그렇다면 가중치 또한 마찬가지로 미세한 값에서 놀지 않을까? 하는 생각이 문득 들어서 테스트해본 활성화 함수다.

결과는 대만족.

생각보다 표현형을 학습하는데 굉장히 빠른 시간이 걸렸다.

ReLU가 학습에만 14시간을 소모한데 반해, 꼴랑 12분 학습한 hardtanh 도 상당히 우수한 표현형을 뽑아내고 있다.

실제로 화풍을 결정하는데는 가중치가 작은 값에서 노는게 아닌가 하는 의구심이 드는 영역.

그렇다면 추후 예상은,

GeLU

swish

이 둘의 성능도 상당히 우수할 것으로 추정되며,

hardshrink

logsigmoid

와 같은 sparse coding 과 같은데 사용되거나 손실함수 코딩에 사용되는 활성화 함수는

상대적으로 성능이 약하지 않을까? 하는 추측이 있다.

이상의 연구는 1시간 정도안에 깔짝 해본거니, 혹시 잘못된 부분이 있거나 다른 결과가 나오면 알려주십셔.

댓글 [2]

즐거운_금색_돌고래

2022-10-26 14:29:47

와... 수능 비문학 느낌이네... 하여튼 그림체의 차이는 생각보다 데이터값 상으론 큰게 아니라 그 미세한것을 잘잡아야 한다 이말인가? 실험 노고에 개추

펼쳐보기▼

선한_금색_참새

2022-10-27 00:42:20

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 정보 그림 드림부스 임베딩 하이퍼

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 29165667

공지 파딱 마음대로 작성한 AI그림 학습 채널 규정 - [24-01-24]

포리X 2023.10.29 2167

공지 [리퀘스트] 탭이 추가되었습니다.

선한_하얀_사자 2023.02.10 3462

공지 신문고

Anon 2023.02.21 3245

공지 각종 학습파일 적용법

거만한_보라_달팽이 2023.01.24 39837

공지 그림 학습법 모음

거친_핑크_외계인 2022.10.30 73164

숨겨진 공지 펼치기(1개)

드림부스 코랩버전있댔지않나 [2]

솔직한_밤색_돌고래 2022.10.27 208 1

캐릭터 학습은 어떻게 하는거?? [1]

거친_갈색_벌 2022.10.27 350 0

하이퍼나 임베딩 신규 키워드 질문

당당한_초록_코끼리 2022.10.27 113 0

슬슬 hypernet -> 드림부스 넘어가는 흐름이 보인다 [1]

겸손한_초록_나비 2022.10.27 223 0

드림부스 로컬 트레이닝 에러 아는사람 도움좀 [2]

건방진_밤색_고양이 2022.10.27 248 1

그래서 드림부스가 뭔데 [4]

겸손한_주황_여우 2022.10.27 201 1

슬슬 드림부스로 갈아타? [5]

선한_금색_너구리 2022.10.27 174 1

그림 드림부스가 물건이긴하네 [11]

호탕한_갈색_쭈꾸미 2022.10.27 515 5

정보 드림부스 학습 후 CLIP SKIP 설정에 따른 차이 [2]

걸걸한_은색_치타 2022.10.27 566 1

정보 엄청난 날림으로 소개하는 RTX3060 12GB으로 유출 드림부스 돌리는 방법 [19]

순박한_남색_상어 2022.10.27 1879 8

정보 학습할때 clip skip 설정 주의해라 [9]

호탕한_빨간_뱀 2022.10.27 720 4

런포드에서 드림부스 구동법 정리글 작성중이긴 한데 [8]

섬세한_보라_나비 (24.84) 2022.10.27 203 2

레이어 방식이 어떤느낌으로 돌아가는지 그림으로되있는거없나...? [6]

둔한_까만_하마 2022.10.27 126 0

드림부스 시작하려고 하는데 강의글 어디서 보면 되나요? [1]

불행한_초록_말 2022.10.27 136 1

드림부스 써보고싶지만

시시한_갈색_하마 2022.10.27 102 0

단순 스크립트키즈에서 코드분석 수정하는 능력까지 있어야 할만하겠다. [1]

굳센_핑크_도마뱀 2022.10.27 92 0

정보 이거 webui에서 데이터셋태그편집 확장같은데 맞나? [4]

훌륭한_파란_토끼 2022.10.27 613 4

정보 현재 드림부스 2가지 버전으로 나뉜거 정리해줌

수수한_하얀_쭈꾸미 2022.10.27 777 1

새로 등록된 포커싱 크롭 엔트로피가 이상한데

선한_은색_너구리 2022.10.27 81 0

여기 챈은 제목만 보면 [2]

싹싹한_초록_치타 2022.10.26 176 2

그림 드림부스 학습 중간 경과 3 [2]

훈훈한_빨간_고양이 2022.10.26 921 6

1,2.5,1 MISH 돌리고자야지 [1]

까칠한_초록_코끼리 2022.10.26 115 0

WSL 로 NAI쓰는사람 [3]

시시한_하얀_돼지 (125.191) 2022.10.26 195 0

그림 드림부스 캐릭터 학습 시킨 결과 (2000스텝) [5]

싹싹한_주황_다람쥐 2022.10.26 342 2

여기 기본 정보는 없음? [7]

씩씩한_노란_원숭이 2022.10.26 168 1

와 이제 얼굴 위주로 크롭해주네 [2]

섬세한_남색_코끼리 2022.10.26 329 2

그림체 가져올때 드림부스에 nai모델넣는게 지금은 젤 넘사인가 [11]

시시한_갈색_코알라 2022.10.26 238 3

네트워크 구조 변경하고 재학습 해보니깐 훨씬 다르다

씩씩한_밤색_원숭이 2022.10.26 177 2

드림부스 모델 nai유출본으로 교체 및 재학습중 [6]

당당한_갈색_나비 2022.10.26 373 1

함수같은거 뭔가 많이 생겼네 [1]

행복한_파란_사슴 2022.10.26 96 1

정보 에포크마다 데이터셋 섞으니까 확실히 다르네 [12]

걸걸한_파란_토끼 2022.10.26 1069 5

정보 보통 학습할려면 그림 몇개 정도 필요해? [4]

예리한_갈색_독수리 (112.140) 2022.10.26 506 0

nai 드림부스 관련 질문 가능할까요 [7]

답답한_하얀_표범 2022.10.26 251 0

정보 활성화 함수 간략테스트 결과 [2]

상냥한_은색_부엉이 2022.10.26 659 11

지금까지 해골물 들이키고 있었노 ㅅㅂ [13]

착한_노란_낙지 2022.10.26 686 5

진짜 화도 안난다 [5]

즐거운_주황_호랑이 2022.10.26 304 3

I'd like to ask foreign users (向中文用户提问) [6]

호탕한_남색_뱀 2022.10.26 1074 10

단보루 골드 계정있는사람 [9]

수수한_갈색_여우 (125.191) 2022.10.26 778 0

1,2,1 Linear는 의미가 없고

훈훈한_핑크_하마 2022.10.26 151 1

새로나온 함수 제세한설명은 안바래도 [5]

순박한_분홍_다람쥐 2022.10.26 173 5

전체글 개념글