smooth loss, loss 차이와 중요성 - AI그림 학습 채널

AI그림 학습 채널

알림 알림 중 알림 취소

구독자 8780명 알림수신 124명 @Anon

그림 AI 학습 정보를 공유하는 채널

정보 smooth loss, loss 차이와 중요성

YUNIYNUI

추천 4 비추천 0 댓글 13 조회수 355 작성일 2024-04-18 12:19:41 수정일 2024-04-18 12:22:15

https://arca.live/b/hypernetworks/103964884

주의)설명을 쉽게 하기 위해 일부 내용의 변형이 들어있습니다

학습을 자주 하다 보면 텐서보드를 참고하는 일이 많습니다.

텐서보드에는 주로 loss와 smooth loss 두가지를 상단에 띄워줘서 일단 보긴 보는데

그래프가 너무 복잡해서 이게 대체 무슨 내용인가 싶은 분들도 많으셨을 것 같습니다.

그래서 무슨 용도로 쓰이는지, 왜 보여주는지, 등등 여러가지 짧은 정보들을 설명 해 드리려고 합니다.

1. Loss가 뭐야?

loss는 말 그대로 손실을 의미합니다.

예측한 결과(출력한 이미지)와 실제 정답(학습 이미지)와의 차이를 주로 나타낸다고 생각하시면 됩니다.

학습을 진행 할 때에는 loss값의 차이를 측정하여 loss값을 줄여가는 방향으로 사용됩니다.

2. Smooth Loss는 뭐야?

smooth loss는 loss에 평활화(smoothing) 작업을 한 것입니다.

쉽게 말해서 수 많은 loss 값들의 추세를 나타낸다고 보시면 편할거에요.

smooth loss는 보통 로그스케일 같은 변환을 적용해서 그래프의 차이를 줄이고 추세를 표현하도록 하는데

이 부분은 이미지 학습을 하는데 있어서 그리 중요하지 않습니다.

중요한 것은 smooth loss는 학습 과정을 모니터링 하고 훈련 과정을 조절하기 위한 주 지표로써 사용된다는 점 입니다.

대부분의 학습을 진행하시는 분들이 loss와 smooth loss값을 무시하시는 경향이 있으신것 같은데

loss값은 무시해도 되는게 맞습니다.

하지만 중요한 것은 smooth loss입니다.

예를 들어 학습 초기부터 꾸준히 smooth loss값이 증가하는 추세를 보인다고 가정 해 보겠습니다.

smooth loss는 loss값의 추세이고, loss는 예측한 결과(출력한 이미지)와 실제 정답(학습 이미지)와의 차이기 때문에

학습 결과(학습 이미지)와 현재 모델의 차이가 점점 커지고 있다는 것을 의미합니다.

이런 상태로 학습을 끝까지 완료 했을 경우 원치 않는 결과가 나올 확률이 대단히 높습니다.

물론 무조건 정반대의 결과를 뽑는다는 말은 아닙니다.

예를 들어서 학습 데이터가 다양한 경우, smooth loss 값이 높더라도 모델이 데이터의 다양한 패턴을 잘 학습할 수 있습니다.

이유는 smooth loss가 주로 학습 데이터의 분포를 고려하여 모델의 학습을 안정화시키는 데 사용되기 때문입니다.

또한 쉽지 않지만 학습률, 정규화 강도, 모델의 복잡도 등이 매우 적절하게 일치되는 경우에도 smooth loss값을 무시하고 제대로 된 결과물이 출력 되기도 합니다.

하지만 style 로라를 만들거나 캐릭터 로라를 만드는 등의 규칙적인 데이터를 학습 시키는데에 있어 smooth loss값을 감소하도록 세팅 하는 것은 실제로 도움이 됩니다.

아래는 상황 예시 및 해결법 혹은 원인입니다.

1. 초반(1 ~ 2 에포크) 학습 할 때 smooth loss가 줄어들지 않고 꾸준히 상승하는 추세를 보임.

이 경우에는 가지 정도의 해결 방법이 있습니다.

첫번째는 학습률을 조정하는 것입니다.

스케쥴러를 사용해 점진적으로 줄여 나가는 상황이라면 상관 없지만 그렇지 않을 경우에는 학습률을 조절 할 필요가 있습니다.

한 가지 팁을 드리자면 전이 학습에서는 학습률을 높게 줄 필요가 없습니다.

두번째 방법은 모델의 복잡도를 줄이는 것입니다.

쉽게 말해서 다른 베이스 모델을 사용하면 나아질 여지가 있다는 의미입니다.

세번째 방법은 데이터를 전처리 해 두는 것입니다.

스케일을 조절하거나 노이즈를 제거하는 등의 전처리 작업이 smooth loss를 줄이는데 도움을 줄 수 있습니다.

네번째 방법은 더 많은 데이터를 사용하는 것입니다.

더 많은 학습 데이터를 수집하여 데이터의 다양성을 늘리면

smooth loss가 직접적으로 개선되진 않으나 최종 결과물은 개선될 수 있습니다.

이외에도 다양한 개선 방법이 존재 할 수 있으나 개인적인 해결 방법은 이렇게 네가지가 전부였습니다.

2. smooth loss값이 잘 내려가다가 갑자기 다시 올라가기 시작함.

이 경우엔 원인을 찾아야 합니다.

첫번째 원인은 학습률이 너무 큰 경우입니다.

이럴 때에는 일단 학습을 종료한 후 더 낮은 학습률(lr)으로 추가 학습을 진행하시면 됩니다.

두번째 원인은 이미 과적합이 생긴 경우입니다.

모델이 학습 데이터에 지나치게 의존하게 된 것을 의미합니다.

이런 상황에서는 정규화 기법을 사용하거나 모델의 복잡도를 줄이고

처음부터 다시 학습을 돌리거나 첫번째 방법을 시행하시면 됩니다.

세번째 원인은 데이터가 불균형 한 경우입니다.

데이터의 직접적인 불균형(여러 스타일이 섞임)이나 데이터의 불균형한 분포(균형이 맞지 않음)는 학습 과정을 방해할 수 있습니다.

학습 데이터를 나누거나 일부 제거하여 해결 할 수 있습니다.

3. smooth loss값이 가파르게 증가하다가 증가 추세가 약간 꺾임.

이러한 상황은 주로 모델의 학습 과정에서 변화가 일어났을 때 나타납니다.

첫번째 이유는 스케쥴러를 사용하거나 혹은 그 외에 이유로 학습률이 변경된 경우입니다.

이 경우엔 자연스러운 현상이므로 문제가 되지 않습니다.

두번째 이유는 학습 데이터에 새로운 패턴이나 특징이 나타나는 경우입니다.

새로운 정보를 학습하면 위와 같은 현상이 나타나는 경우가 있는데, 자연스러운 현상입니다.

세번째 이유는 모델이 학습 데이터에 너무 맞춰져서 과적합되고 있을 수 있습니다.

물론 다른 예시들에 비하면 확률이 낮긴 하지만 증가 추세가 꺾이는 지점에서 모델이 일반화된 패턴을 학습하고 있을 수 있습니다.

이 경우엔 학습률을 유동적으로 변경해야 합니다. (스케쥴러 권장)

4. smooth loss 값이 잘 내려가다가 갑자기 다시 올라가기 시작함.

이 케이스는 잘 구분하셔야 합니다.

등락을 반복하는게 아닌 시작점과 비슷한 수준까지 smooth loss값이 상승하는 것을 의미합니다.

첫번째 원인은 너무 큰 학습률을 사용한 경우입니다.

이것도 (학습률을)점차적으로 줄여 나가는 과정이라면 크게 문제 될 것은 없으나,

일반적으로 학습 하는 경우에서는 이런 경우 더 낮은 학습률을 사용하는 것이 도움이 됩니다.

두번째 원인은 학습 데이터에 노이즈가 많거나 태깅작업이 잘못 진행된 경우입니다.

이 경우엔 수작업으로 태그 확인하고 수정하면서 고치고, 일러스트 하나씩 검열하는거 외에는 방법이 없습니다.

이 문제 때문에 사진과 손으로 그린 일러스트를 학습하는데 어려움을 겪는 분들이 많습니다.

그러나 저는 개인적으로 저작권 혹은 초상권 있는 창작물은 되도록 안 건드리시는걸 추천드립니다.

사실 단순히 그저 샘플 출력해서 보면 되긴 하지만 때로는 그래프를 참고하는 것도 도움이 되지 않을까 하는 마음에 작성하게 되었습니다.

일반적인 딥러닝 학습이 아닌 AI그림을 파인튜닝 하는데 있어서 중요도가 비교적 덜 한 부분은 있지만 그렇다고 무시해도 될 지표는 아니라는걸 알아주셨으면 합니다.

경험과 지식 + 약간의 논문을 기반으로 작성된 글이라 혹시라도 잘못된 내용이 있다면 댓글 부탁드립니다!!

혹은 궁금한 점도 댓글 남기시면 답변 해 드리겠습니다!!

딸기맛봇치

2024-04-18 15:56:58

tensorboard에선 그런 거도 띄워줘요? wandb만 써서 몰랐네

펼쳐보기▼

kakarot

2024-05-01 02:31:26

아는만큼 보이네요. 감각적으로 느끼고 있던 것들이 글로써 쉽게 이해하기 좋게 적어주셨네요. 좋은 내용 감사합니다.

펼쳐보기▼

kakarot

2024-05-01 02:32:33

그리고 하나 질문이 있는데 ,학습 진행 할때  제일 우측 끝에 나오는 avr_loss=0.0346  <- 이 부분이 로스율을 나타내는게 맞나요?

펼쳐보기▼

YUNIYNUI

2024-05-01 03:49:29

아마 평균 로스율인것 같아요

펼쳐보기▼

kakarot

2024-05-01 04:02:28

아.. 로스율 나타내는게 맞았군요. 답변 감사합니다!

펼쳐보기▼

YUNIYNUI

2024-05-01 04:03:19

평균 로스율은 참고하기 애매한 지표라서 실시간 그래프 같은게 더 나을수도 있어요!

펼쳐보기▼

kakarot

2024-05-01 04:03:53

그래프 나오게 하는건 어떻게 하는지를 몰라서...ㅠㅠ

펼쳐보기▼

YUNIYNUI

2024-05-01 04:04:45

텐서보드를 띄우거나 아니면 그냥 지금 로스율 보고 대충 어떤 상태인지 파악하시는 정도로도 충분하긴 해요

펼쳐보기▼

kakarot

2024-05-01 04:05:53

텐서보드 어떻게 사용하는지도 모르는..하하..;; 그냥 kohya_ss 로만 돌리고 있어요. 그래서 학습될때 cmd창 띄어놓아서 중간중간 체크하는 식으로 하고 있어요.ㅎ

펼쳐보기▼

YUNIYNUI

2024-05-01 04:07:23

만약 그렇다면 Cmd 창에서 avr 붙은거 말구 그냥 loss위주로 보시는게 더 도움 될거에요

펼쳐보기▼

kakarot

2024-05-01 04:08:25

오.. 감사 합니다!

펼쳐보기▼

kakarot

2024-05-01 04:08:30

kakarot

2024-05-01 04:04:40

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 정보 그림 드림부스 임베딩 하이퍼

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 27900173

공지 파딱 마음대로 작성한 AI그림 학습 채널 규정 - [24-01-24]

포리X 2023.10.29 1917

공지 [리퀘스트] 탭이 추가되었습니다.

선한_하얀_사자 2023.02.10 3345

공지 신문고

Anon 2023.02.21 3143

공지 각종 학습파일 적용법

거만한_보라_달팽이 2023.01.24 39117

공지 그림 학습법 모음

거친_핑크_외계인 2022.10.30 71957

숨겨진 공지 펼치기(1개)

5733 kohya_ss 0.8.7 문제인가 싶어서 코랩버전 함 해보려고함 [1]

ㅇㅇ 2024.04.29 86 0

5732 코랩 vs 로컬 학습 2트했는데 또 졌음

ㅇㅇ 2024.04.28 97 0

5731 UI 업데이트 [3]

몬TDAI 2024.04.27 111 0

5730 똑같은 데이터셋인데 결과가 너무 다름 [9]

ㅇㅇ 2024.04.26 220 1

5729 스케줄러 이름 헷갈려서 여태 헛발질함

ㅇㅇ 2024.04.26 82 0

5728 XL로라의 블록 웨이트 [2]

몬TDAI 2024.04.26 136 1

5727 데이터셋 2배로 업스케일링해서 로라 만들면 정말 로라 퀄이랑 해상도 높아질까 [2]

AshimoriShion 2024.04.20 295 0

5726 이미지 한장으로 학습 & 영상뽑기 (roop-unleashed) [13]

ㅇㅇ 2024.04.19 1050 11

5725 정보 smooth loss, loss 차이와 중요성 [13]

YUNIYNUI 2024.04.18 356 4

5724 짤막 huber 스케쥴 옵션 [14]

몬TDAI 2024.04.16 219 2

5723 정보 아주 간단한 underfit, overfit 판단 방법 [4]

Dalcefo 2024.04.16 646 9

5722 중복 사진 지우는게 젤 귀찮다 [11]

딸기맛봇치 2024.04.13 330 0

5721 정보 뉴비가 쓰는 데이터셋 50장 미만으로 로라 만드는 법 [6]

ㅇㅇ 2024.04.12 1724 35

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.