Polyglot 12.8B LoRA 말고 커스터마이징 방법으로 파인튜닝 한 실력자 - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3526명 알림수신 174명 @바바리맨

제한없는 언어모델을 위한 채널

정보 Polyglot 12.8B LoRA 말고 커스터마이징 방법으로 파인튜닝 한 실력자

추천 3 비추천 0 댓글 4 조회수 929 작성일 2023-05-07 11:06:41

https://arca.live/b/alpaca/75795378

https://medium.com/@changlee99/polyglot-12-8b-finetuning-98655198c654

polyglot을 파인튜닝해보고싶어서 구글링하다가 매우 좋은 글인거같아서 가져옴.

2주 내에 작성된 상당히 최신 글이고 코드도 9시간 전에 커밋되면서 계속 업데이트 되는중.

글보고 내가 새롭게 알게된 점

1. 자연어모델에는 LoRA의 성능이 좋지않은 경우도 있는듯함

2. GPU 메모리가 부족하면 CPU 메인 메모리를 이용해서 훈련이 가능하다. DeepSpeed Zero stage3를 이용하면 GPU 메모리의 한도를 정해주고 나머지 파라메터는 CPU 메모리로 offloading 하는 기법을 사용할 수 있다.

-> vram 높은 gpu 반드시 사야하나 걱정했는데 이런방법이 있었다

3. 커스터마이징 해서 훈련하는거 존멋이다.

글 안에 모델 weight 파일도 있고 코드도 있어. 아직 정리는 다 안되신거같은데

나는 가이드만 보고 따라할줄아는 초짜인데 이분 글보면서 이런 세계가 있구나 실력자는 이렇게다르구나 하고 감탄함.

혹시 파인튜닝에 관심있는 챈럼들은 배울만한점이 있을거같아서 공유할게

댓글 [4] 글쓰기

하늘의아리아

2023-05-07 11:10:15 답글

hkhk

2023-05-07 12:57:46 답글

로러가 자연어 모델에서는 잘 안돌아간다고 단정적으로 생각할 필요는 없음. 내 예상이지만 글 쓰신 분이 저정도 세팅할 노력으로 lora 튜닝 파라메터 다른 쪽을 만져봤어도 잘 됐을거라고 생각함.

펼쳐보기▼

ㅇㅇ (115.136)

2023-05-07 13:24:28 삭제 수정 답글

이 방법대로라면 4090급에서 30B이상도 파인튜닝 가능하겠는데.

펼쳐보기▼

2023-05-07 13:30:51 답글

DeepSpeed Zero stage3  배워갑니다... 개오래걸리겠죠?

펼쳐보기▼

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 31367784

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6279

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 28535

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 9479

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

바바리맨 2023.08.01 5475

공지 신문고

바바리맨 2023.04.18 2360

숨겨진 공지 펼치기(1개)

질문 KoAlpaca 실행 관련 질문입니다,, [15]

cmeig 2023.05.08 1388 0

정보 우바부가 ChromaDB 를 이용한 익스텐션 aka. superbooga 출시 [2]

BotttttleNeck 2023.05.08 620 0

일반 최근 딥러닝 공부 시작했는데 이 채널이 있었네요 [5]

지능순 2023.05.08 536 6

일반 리눅스 문외한이 WSL2 재도전해 봤습니다 [14]

산정 2023.05.08 488 1

정보 WizardVicuna 무검열판 조만간 나올듯 [10]

산정 2023.05.07 547 3

일반 챈럼들이 쓸수 있는 서버 하나 있음 좋겠다 [3]

KYUUBI 2023.05.07 249 0

일반 로컬 LLM 발전하는게 눈에 보여서 미칠것같다 ㄷㄷ [4]

KYUUBI 2023.05.07 3783 -1

질문 로컬 데이터셋 한정한 파인튜닝 에서 질문이 있어요 [2]

ㅇㅇ 2023.05.07 309 0

일반 이 정도면 되려나? [6]

꿈돌리 2023.05.07 283 0

일반 토큰 무제한 모델...? [2]

ㅎ헤ㅔ헤헤헤 2023.05.07 650 4

정보 Polyglot 12.8B LoRA 말고 커스터마이징 방법으로 파인튜닝 한 실력자 [4]

al06r 2023.05.07 930 3

질문 LLM 파인튜닝 방법에 대해서 설명되어 있는 컨텐츠 있을까요? [1]

기가매키네 2023.05.07 456 0

일반 3090으로 30/65b 파인튜닝 가능해졌다네ㄷㄷ [22]

하늘의아리아 2023.05.07 1020 11

일반 벡터 임베딩 성공 [11]

아쎄이원위치 2023.05.07 1053 6

질문 LLM 모델 파인튜닝 해보고 싶은데, 데이터셋을 어떻게 구성해야 하나요? [11]

기가매키네 2023.05.07 839 1

질문 궁금한 점 [1]

천무광 2023.05.07 189 0

일반 MPT-7B Chatbot 한글로 말걸면 폭주하네요 ㅋㅋㅋㅋㅋ [3]

그래요 2023.05.07 864 1

일반 GPT4에 좌절 [2]

천무광 2023.05.07 390 0

일반 리눅스랑 맥용 우가우가 원클릭 설치 추가됐네 [3]

시큼한파인애플 2023.05.07 383 4

질문 파이썬으로 모델 응답 출력할때 질문이 있어요 [2]

ㅇㅇ 2023.05.07 249 0

전체글 개념글