한국어 모델 추천 - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3800명 알림수신 192명 @바바리맨

제한없는 언어모델을 위한 채널

질문 한국어 모델 추천

추천 3 비추천 0 댓글 12 조회수 1285 작성일 2024-05-06 12:22:43

⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다.

https://arca.live/b/alpaca/105536023

현재 한국어 18만줄 정도 데이터를 가지고 있어요

이 데이터 기반으로 llm이 이어 쓸 수 있도록 하고싶어요

모델과 파인튜닝이 필요할 것 같은데 추천할만한 솔루션이 있으신가요?

댓글 [12] 글쓰기

2024-05-06 12:46:44 답글

아무말이나 괞찮으니까 뉴비에게 도움을 주세요 ㅠㅠ 부탁드려요

펼쳐보기▼

ㅇㅇ (112.146)

2024-05-06 13:30:06 삭제 수정 답글

최신모델인 Llama3 8b에다가 해보시는건 어떤가요
뉴비면 axolotl이나 unsloth을 이용해서 학습시키는거 추천합니다

펼쳐보기▼

2024-05-06 13:43:44 답글

llama3 다국어버전 나올때까지 기다리시는건 어떨까요?

펼쳐보기▼

2024-05-06 14:12:30 답글

다들 감사합니다!

펼쳐보기▼

hkhk

2024-05-06 14:23:15 답글

eeve 쓰세요

펼쳐보기▼

2024-05-06 14:58:47 답글

한국어는 command-r-plus 가 갑입니다.

펼쳐보기▼

ㅇㅇ (210.91)

2024-05-07 00:36:21 삭제 수정 답글

데이터만 있다고 끝이 아니라 가지고 계신 그래픽카드 장비가 어떻게 되냐에따라 자기 장비로 돌릴지, 돈써서 다른 회사의 장비를 빌려쓸지가 달라집니다.
거기에 사용할 모델 크기들도 달라지고요.

펼쳐보기▼

2024-05-07 01:10:25 답글

그래픽카드는 rtx 2060입니다!
이걸로는 너무 부족한 것으로 알고 있어요

펼쳐보기▼

ㅇㅇ (210.91)

2024-05-07 02:09:03 삭제 수정 답글

2060이면 본인 장비로는 안되실테니 런팟 같은곳에서 GPU 대여를 추천드립니다.
돈이 좀 있다 싶으시면 a100 같은걸 대여해서 큰 모델인 라마 70b나 커맨드 같은 큰 모델을 돌리실 수 있겠지만
그게 아니시라면 작은 모델인 솔라나 라마 7~8b를 돌리시는게 좋을거에요

본인 데이터로 RAG가 아니라 학습까지하고싶으신거면 LoRa 파인튜닝을 추천드립니다.
근데 어떤 방식으로 학습시키냐에 따라 데이터 가공이 다 되있으셔야해요.
예를 들어 지도방식인 sft 학습을 시키실거면 데이터가 질문, 대답으로 되있으셔야하고 DPO로 하신다하면 질문, 틀린대답, 맞는대답 이런식으로 이루어져 있어야합니다.

펼쳐보기▼

2024-05-07 02:34:23 답글

감사합니다! 채팅 형식도 좋지만 로우데이터를 학습시켜서 자동완성을 하게 하려면 어떤 방식으로 준비해야할까요?

펼쳐보기▼

ㅇㅇ (210.91)

2024-05-07 03:11:46 삭제 수정 답글

자동 완성이라는게 문장에서 특정 칸이 비어져 있다면 그 문장을 추측해서 맞추는걸 말씀하시는거져?
거기에만 딱 맞추고 싶다면 데이터를 가공해서 빈칸을 만든뒤 거기에 알맞는걸 고르라하고 보기를 준 뒤
정답도 뒤에 써놓으신걸 학습시키시면 됩니다.
하지만 이 방법은 데이터 가공에 인력과 시간이 많이 들기때문에 보통 비슷한 오픈데이터 중 추려오거나
밴치마크 항목 중 문장 완성과 관련된게 높은 모델에 학습시키는걸 추천드립니다

펼쳐보기▼

2024-05-07 03:15:05 답글

감사합니다!

펼쳐보기▼

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 36321036

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 7373

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 33585

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 11274

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

바바리맨 2023.08.01 7022

공지 신문고

바바리맨 2023.04.18 3181

숨겨진 공지 펼치기(1개)

4723 자작모델 초보자의 파인튜닝 후기 [3]

초보자 (211.179) 2024.09.09 468 9

4722 질문 현재 한국어 기준 speech to text 모델의 SOTA가 무엇인가요? [5]

minimac 2024.09.07 973 0

4721 자료 한국어 문체 데이터셋 [1]

boredone 2024.09.07 804 17

4720 일반 mattshumer/Reflection-Llama-3.1-70B 후기 [2]

ㅇㅇ 2024.09.07 1028 2

4719 질문 안녕하세요 첫글이 질문이라 죄송합니다 [3]

ㅇㅇ (220.65) 2024.09.07 638 -10

4718 질문 Quantize Aware Training(QAT) 잘 해보신 분 계시나요?

lIlBrother 2024.09.06 316 0

4717 정보 DeepSeek V2.5 공개 (236B MoE)

ET 2024.09.06 850 5

4716 질문 영어 모델에 한국어를 학습할때 팁이 있나요 ? [6]

밤하늘의츄르 2024.09.06 597 1

4715 질문 rag와 대화내용 기억에 관한 질문 [8]

ㅇㅇ (210.218) 2024.09.06 541 0

4714 일반 클로드 3.5 소넷 이기는 오픈소스 모델 Reflection 70B 공개 [5]

Qsign 2024.09.06 991 1

4713 일반 Gemini API 는 왜 사람 이름을 검열하는 것일까? 에 대한 토론 [1]

감별사 2024.09.06 488 3

4712 정보 LLM Ready 도커이미지 및 런팟 템플릿 (CUDA 12.4, pytorch 2.4.0, vLLM, SGLang, unsloth 등) [6]

maywell 2024.09.06 1024 18

4711 질문 gemma2 9b dp2 vs 27b fp8 tp2 뭐가 좋을까요? [6]

ㅇㅇ (210.218) 2024.09.06 482 0

4710 일반 이 문제를 제대로 해결한 모델을 아직까지 못봤음 [9]

사과는맛있어맛있으면바나나 2024.09.06 788 0

4709 질문 wsl 2 에서 아나콘다 가상환경 GPU 연동 질문입니다. [21]

ㅇㅇ (61.33) 2024.09.05 394 0

4708 일반 Llama 3.1 70B FP32 와 405B INT4 는 뭐가 더 좋을까요? [3]

ㅇㅇ (211.252) 2024.09.05 561 2

4707 질문 컴퓨터 잘 아시는 분들의 도움이 필요합니다....!!! [8]

ㅇㅇ (115.22) 2024.09.05 571 0

4706 질문 모델 포맷에 있어서 safetensors 파일과 pytorch_model-xxxxx-of-xxxxxbin 파일간에 큰 차이가 있나요? [7]

초보자 (211.179) 2024.09.05 409 0

4705 일반 Gemma 2가 그렇게 한국어를 잘한다면서요? [7]

모맵 2024.09.04 1157 1

4704 정보 윈도우11에 RWKV가 기본 탑재됨 [6]

12시5분 2024.09.04 1069 6

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.