LLAMA-2-13B를 파인튜닝하여 LLAMA-2-Chat-70B를 이기는 법 orca2 - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3481명 알림수신 174명 @바바리맨

제한없는 언어모델을 위한 채널

정보 LLAMA-2-13B를 파인튜닝하여 LLAMA-2-Chat-70B를 이기는 법 orca2

ㅎ헤ㅔ헤헤헤

추천 20 비추천 0 댓글 1 조회수 1174 작성일 2023-11-21 04:06:29

https://arca.live/b/alpaca/92026607

Orca 2: Teaching Small Language ModelsHow to Reason

요약

현재 ChatGPT의 답변을 그대로 가져와 작은 모델에 사용하는 것이 오히려 소형 LM모델에 악영향을 줄수있다고 말함

소형 LM에게 다른 방법으로 데이터를 만드는 것이 좋다고 밝힘

이때 다양한 추론 기법(스텝바이스텝, 기억 후 생성, 기억-추론-생성, 직접 답변 등등)을 학습하였고 대략 100종류의 작업과 약 36,000개 이상의 고유 프롬포트를 통해 더 성능을 올릴수있다고 함

RLHF는 안 했다고 함

이때 중요한 점은 당연한 지시를 매우 상세하게 가르치는 게 핵심임

예를 들어

이제 슬슬 밤이 되니 창문 닫아

이런 말을 할려면

밤에 기온이 낮아진다는 정보

창문을 닫으면 체감온도가 증가한다는 정보

이런 상식적인 정보를 다 학습 데이터에 넣어야 한다는 점이 핵심이라고 생각함

환각 증상(숫자가 낮을수록 좋음)

응답 벤치마크(높을 수록 좋음)

여기에 아래 System 2 Attention까지 넣으면 완벽할듯?

다음글에서 설명해줄께

댓글 [1] 글쓰기

2023-11-21 04:55:52 답글

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30728555

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6193

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 28061

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 9257

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

바바리맨 2023.08.01 5345

공지 신문고

바바리맨 2023.04.18 2329

숨겨진 공지 펼치기(1개)

4214 질문 모델 받는중 오류 [2]

Thomas_Shelby 2024.05.21 339 0

4213 일반 트랜스포머를 rnn으로 업트레이닝 [2]

ㅎ헤ㅔ헤헤헤 2024.05.21 475 5

4212 일반 이번에 업데이트된 chatgpt 4o진짜 코딩할때 짱이네요. [6]

끼랑까랑 2024.05.21 1506 15

4211 질문 런팟 GPU 0개 질문 [7]

ㅇㅇ (116.124) 2024.05.21 409 1

4210 질문 정말 간단한 용어에 대한 질문인데 헷갈려서요.. [6]

초당옥수꾸 2024.05.21 508 0

4209 일반 gpt 최신 버전 무료로 이용할 수 있는 사이트 [4]

pussydestroyer 2024.05.20 974 8

4208 질문 파인튜닌 할때 어떤거 사용하시나요? [6]

ㅇㅇ 2024.05.20 598 2

4207 일반 아직 24gb로 돌릴만한 한국어 로컬 모델은 없을까요? [5]

ㅇㅇ 2024.05.20 872 0

4206 질문 파인튜닝한 모델을 기존 모델 참조 없이 독립적으로 저장하고싶을 때 [7]

ㅇㅇ (58.234) 2024.05.20 486 1

4205 질문 라마3 70B 구동 [6]

Thomas_Shelby 2024.05.19 945 0

4204 일반 LLM 출력 속도 비교 [3]

ET 2024.05.19 868 9

4203 일반 akallama exl2 모델 공개 [10]

ㅇㅇ (118.235) 2024.05.19 645 9

4202 질문 vllm의 AutoAWQ 관련해서 질문드립니다. (모델 양자화) [17]

Dikko 2024.05.17 537 2

4201 일반 메타에서 gpt-4v와 같은 Mixed-Modal 발표했네요 [10]

그래요 2024.05.17 1578 18

4200 일반 A,WS summit 참여했는데 RAG 내용 괜찮았네요 [10]

ㅇㅇ 2024.05.17 748 3

4199 일반 한국 유튜브 transcription 데이터셋 [11]

maywell 2024.05.17 1957 53

4198 일반 gpt-4o에서 음성 입력을 실시간으로 음성으로 반환해주던데 어떤 기술 일까요? [10]

ㅇㅇ (61.100) 2024.05.17 847 1

4197 정보 Augmentoolkit - 생 텍스트를 넣으면 instruct 데이터셋을 만들어주는 툴킷 [6]

hkhk 2024.05.16 973 14

4196 정보 LLaMA-3 8B, 70B 모델의 양자화 단계별 MMLU성능 비교표 [11]

hkhk 2024.05.16 1950 20

전체글 개념글