허깅페이스에 공개된 로컬모델들을 보니 LoRA가 대부분이고 이외에 Quantization인 GPTQ나 AWQ정도인데, 혹시 다른 기법들이 또 있을까요?
구독자 3412명
알림수신 168명
제한없는 언어모델을 위한 채널
질문
PEFT 중에서 주로쓰는 기법들이 무엇이 있을까요?
추천
0
비추천
1
댓글
9
조회수
593
작성일
⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다.
댓글
[9]
글쓰기
ㅇㅇ (119.200)
삭제
수정
Aimyon
ㅇㅇ (61.33)
삭제
수정
Aimyon
jackofmaster
jackofmaster
Answer.AI
Answer.AI - Efficient finetuning of Llama 3 with FSDP QDoRA
We’re releasing FSDP QDoRA, a scalable and memory-efficient method to close the gap between parameter efficient finetuning and full finetuning.
Aimyon
ㅎ헤ㅔ헤헤헤
Aimyon
최근
최근 방문 채널
최근 방문 채널
번호
제목
작성일
조회수
추천
공지
아카라이브 모바일 앱 이용 안내(iOS/Android)
28619173
공지
Ai 언어모델 로컬 채널 이용규정
6024
공지
뉴비에게 도움 되는 글 모음
27177
공지
언어모델 관련 정보취득 /무료체험 가능 사이트
8939
공지
여러분의 학습에 도움을 줄 수 있는 하드웨어 지원
5123
공지
신문고
2259
숨겨진 공지 펼치기(1개)
4227
일반
흥미로운 일/영 번역모델이 나왔네요
[6]
473
5
4226
질문
unsloth에서 device map 설정 방법 아시는 분 계실까요?
[2]
236
0
4225
질문
전력공학이나 전기공학 학습용 데이터같은것도있을까요?
[1]
231
0
4224
정보
mistral 7b 0.3출시
[5]
726
8
4223
일반
영향 있는 Lora 만드려면 몇번쯤 돌려야 하는거임?
[1]
338
1
4222
스터디
딥러닝모델의 망각증상 (Catastrophic Forgetting)에 대한 고찰
[12]
840
31
4221
질문
contex 개념 좀 한번 잡아주세요
[4]
270
0
4220
일반
Gemini 1.5 Flash 출시
330
2
4219
스터디
TinyStories-Korean 모델 학습 결과
[6]
687
20
4218
일반
클로드 앤스로픽 블로그 - 소넷의 내부 작동을 이해했다
[6]
435
8
4217
일반
님들 책 한권씩만 추천해줘요
[3]
319
1
4216
질문
aphrodite-engine 모델 서비스
[8]
348
0
4215
일반
phi-3 small/medium 나왔네요
[15]
1386
17
4214
질문
모델 받는중 오류
[2]
312
0
4213
일반
트랜스포머를 rnn으로 업트레이닝
[2]
420
5
4212
일반
이번에 업데이트된 chatgpt 4o진짜 코딩할때 짱이네요.
[6]
1129
15
4211
질문
런팟 GPU 0개 질문
[7]
361
1
4210
질문
정말 간단한 용어에 대한 질문인데 헷갈려서요..
[6]
443
0
4209
일반
gpt 최신 버전 무료로 이용할 수 있는 사이트
[3]
837
8
4208
질문
파인튜닌 할때 어떤거 사용하시나요?
[4]
518
2
사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.