Mistral-7B 파인 튜닝시 loss 발산의 이유는 ? - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3538명 알림수신 174명 @바바리맨

제한없는 언어모델을 위한 채널

질문 Mistral-7B 파인 튜닝시 loss 발산의 이유는 ?

밤하늘의츄르

추천 1 비추천 0 댓글 7 조회수 467 작성일 2024-04-12 08:39:32

⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다.

https://arca.live/b/alpaca/103472788

안녕하세요.

LLM에 관심을 가지고 공부중인 학생입니다.

다름이 아니라 Mistral-7B-inst 모델을 파인튜닝 해보고 있는데,

학습 과정에서 갑자기 train loss가 발산하는 현상이 생깁니다.

이건 어떤 이유 때문이라고 유추 해볼수 있을까요 ?ㅠㅠ

그리고 추가적으로 이런 경우는 그래프를 잘 보고 발산 이전 step 까지만 학습하는 것도 효과가 있다고 할수 있을까요 ?

댓글 [7] 글쓰기

밤하늘의츄르

2024-04-12 08:41:20 답글

학습 과정에서 loss가 천천히 감소하고 있다가 갑자기 발산해요..

펼쳐보기▼

ㅇㅇ (220.117)

2024-04-12 09:04:02 삭제 수정 답글

1. 데이터의 수가 너무 적어서
2. learning rate가 너무 커서
3. 잘못된 training code

펼쳐보기▼

밤하늘의츄르

2024-04-12 09:10:17 답글

혹시 데이터 수가 너무 적은 경우에는 왜 발산하는지 여쭤볼 수 있을까요 ?

펼쳐보기▼

2024-04-12 11:52:03 답글

라마의 경우는 학습이 fp16이라면 해당 증상이 나왔던걸로 기억하는데요(가물가물 하네요)
fp16을 사용하고 계신다면 bf16을 사용해 보심이 어떤가요

펼쳐보기▼

ㅇㅇ (121.135)

2024-04-15 02:27:29 삭제 수정 답글

확인해봤는데, bfloat16 이미 사용하고 있습니다 :)

펼쳐보기▼

2024-04-12 11:55:52 답글

또 FSDP 관련해 transformers 버전에 따라

https://github.com/huggingface/transformers/issues/26498

다음과 같은 문제가 있을 수 있습니다

Mistral loss instability · Issue #26498 · huggingface/transformers

System Info Hello, I’ve been working with dhokas who finetuned Mistral’s official instruct model. I have been trying to finetune mistral with several datasets over dozens of ablations. There is ver…

또 FSDP 관련해 transformers 버전에 따라

https://github.com/huggingface/transformers/issues/26498

다음과 같은 문제가 있을 수 있습니다

펼쳐보기▼

ㅇㅇ (61.33)

2024-04-15 04:46:20 삭제 수정 답글

lr 낮춰보세요

펼쳐보기▼

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 31483332

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6294

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 28627

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 9505

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

바바리맨 2023.08.01 5490

공지 신문고

바바리맨 2023.04.18 2367

숨겨진 공지 펼치기(1개)

4083 일반 llm 또는 RAG 논문 추천해주실수 있을까요?? [8]

ㅇㅇ (183.98) 2024.04.27 756 2

4082 일반 초딩도 할 수 있는 컨텍 확장 가이드 [24]

maywell 2024.04.27 2250 23

4081 질문 llm을 이용해서 돈벌고계신분들 계신가요?? [13]

돌돌돌돌 2024.04.26 1396 0

4080 질문 m2 mac studio ultra로 llama3 8b fine tuning 될까요? [7]

KevinRyu 2024.04.26 693 0

4079 정보 서울과기대, LLama3 8B 파인튜닝 영어-한국어 모델 'Bllossom' [10]

al06r 2024.04.26 1859 4

4078 일반 qwen1.5 110b출시

jackofmaster 2024.04.26 415 4

4077 일반 Llama-3-8B-Instruct 262k 컨텍스트 확장 출시 [16]

사과는맛있어맛있으면바나나 2024.04.26 1551 12

4076 질문 OpenAI Embeddings [5]

jarvis777 2024.04.26 752 0

4075 질문 chat model에 raw text 학습시키는 방법은 어떤게 있을까요? [1]

ㅇㅇ (203.226) 2024.04.26 474 0

4074 질문 4060ti로도 개인용으로 돌릴 수 있음? [5]

ㅇㅇ (211.234) 2024.04.26 727 0

4073 질문 70b 모델을 2.5~3T/s 정도 나오게 하려면 어느정도 사양이 필요할까요? [7]

ㅇㅇ (221.168) 2024.04.26 714 0

4072 질문 finetuning 도구 추천 부탁드릴수 있을까요? [7]

ㅇㅇ (61.74) 2024.04.26 723 -1

4071 일반 라마3 온디바이스 추론 [6]

ㅇㅇ (211.226) 2024.04.26 953 0

4070 일반 NurtureAI <- 여기 모델 사용하지 마시길 [7]

maywell 2024.04.25 1542 11

4069 일반 OAI Batch API 기능 번역

ㅇㅇ 2024.04.25 398 4

4068 질문 ai용 컴퓨터 장만하려고하는데요 [6]

RoT 2024.04.25 832 1

4067 질문 데이타셋중 Prompt, Chosen, Rejected로 되어 있는건 어떻게 사용해야 하나요? [4]

그래요 2024.04.25 357 0

4066 질문 파인튜닝과 관련하여 [2]

ㅇㅇ (218.156) 2024.04.25 667 0

4065 질문 ollama 로 llama3 구동하여 성향을 가진 챗봇처럼 대화할 수 있나요? [5]

사료 2024.04.25 983 0

4064 일반 라마3 시대를 맞이하여 새로 정보 공지글 정리하려고 합니다. [26]

hkhk 2024.04.25 2005 29

전체글 개념글