Chat vector에서 cp transfer - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3447명 알림수신 170명 @바바리맨

제한없는 언어모델을 위한 채널

일반 Chat vector에서 cp transfer

오래된정원

추천 5 비추천 0 댓글 6 조회수 474 작성일 2024-05-15 06:47:59 수정일 2024-05-15 10:19:10

https://arca.live/b/alpaca/106235734

llama3는 모델의 토크나이저가 이미 한국어가 포함된 토크나이저였군요.

llama2로 실험해서 돌아오겠습니다.

~~안녕하세요.~~

~~먼저 흥미로운 논문이 있었습니다. chat vector(https://arxiv.org/abs/2310.04799v2)라고~~

~~훈련한 모델의 매개변수를 더하면 그 훈련량 만큼 전달 할 수 있다는 논문입니다.~~

~~이 게시판에서도 한 유저분이 이걸 바탕으로 흥미로운 실험을 하셨었죠.~~

~~https://arca.live/b/alpaca/104827551~~

~~어쨌든 논문은 모델의 구조가 같음을 전제로~~

~~영어로 제작된 모델의 기본모델과 인스트럭션 모델의 parameter diff를 다른언어로 CP(Contunal Pre-train)된의 모델에 더하면~~

~~간단히 인스트럭션모델을 만들수 있다라는 가정입니다.~~

~~-------------------------------------------------------------~~

~~그렇다면 영어 인스트럭션 모델에~~

~~같은 구조의 모델의 plm과 cp모델의 매개변수 차이를 더하면 한국어 능력을 입힐 수 있지 않을까 생각했습니다.~~

~~결과는 됩니다.~~

~~성능이 막 뛰어나다 할 수 없지만 저 위의 chat vector만큼 정도는 됩니다. 대신 토크나이저는 cp모델의 토크나이저를 불러와서 적용해야 합니다.~~

~~모델 주소는 아래와 같습니다.~~

~~https://huggingface.co/aeolian83/Llama-3-8B-Instruct-cp-transfer_1.0~~

댓글 [6] 글쓰기

2024-05-15 07:26:50 답글

https://huggingface.co/beomi/Llama-3-Open-Ko-8B-Instruct-preview

이거랑 다른게 있나요...?

CP + (FT - PT) == (CP - PT) + FT 아닌가요

beomi/Llama-3-Open-Ko-8B-Instruct-preview · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

이거랑 다른게 있나요...?

CP + (FT - PT) == (CP - PT) + FT 아닌가요

펼쳐보기▼

2024-05-15 07:27:03 답글

수식적으로 동일한거같아요

펼쳐보기▼

오래된정원

2024-05-15 09:40:44 답글

네 수식적으로 사실 동일한거라고 보면 될것 같습니다.

펼쳐보기▼

ㅇㅇ (211.109)

2024-05-15 08:59:33 삭제 수정 답글

근데 cp 모델 토크나이저가 원본 모델 토크나이저랑 같은데, 굳이 cp 모델 토크나이저 써야 할 이유가 있나요?

펼쳐보기▼

오래된정원

2024-05-15 09:42:17 답글

beomi님이 만드는 모델은 토크나이저 확장형 모델인데, llama2에서는 그런데 llama3에서는 아닐 수도 있겠네요. 확인해봐야 할듯 합니다. 감사합니다.

펼쳐보기▼

오래된정원

2024-05-15 10:07:38 답글

llama2-ko는 토크나이저가 확장되어 있어서 토크나이저 크기가 다른데, llama3는 토크나이저가 한국어모델이나 영어모델이나 같네요. 나름 멀티링구얼 모델이라 그런가보군요.

펼쳐보기▼

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 29868697

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6116

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 27627

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 9117

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

바바리맨 2023.08.01 5249

공지 신문고

바바리맨 2023.04.18 2298

숨겨진 공지 펼치기(1개)

4274 일반 LLMOps로 살아남을 수 있을까? [10]

maywell 2024.06.02 394 9

4273 일반 라마3-v 8b모델 공개했네요 [2]

ㅇㅇ 2024.06.01 339 2

4272 질문 LoRA 제작 두번 실패하면서 모은 질문들 [3]

세법상법 2024.06.01 218 2

4271 일반 command r plus 4bit + 3090 4way 후기 [6]

감별사 2024.06.01 382 5

4270 일반 특징 조작 관련 라마 모델 몇 가지 및 기술(Orthogonalization, ReFT, 우울한 라마, 금문교 라마) [3]

ㅇㅇ 2024.06.01 410 14

4269 일반 일지

세법상법 2024.05.31 185 0

4268 일반 vast.ai + command r plus 4bit + a4000 * 8 [8]

감별사 2024.05.31 272 5

4267 일반 오늘은 다른 방식으로 굽는 중

세법상법 2024.05.31 202 0

4266 질문 데이터 형식 질문

ㅇㅇ 2024.05.31 169 0

4265 일반 rtx5090 vram 28기가 루머 [18]

whs 2024.05.31 679 2

4264 일반 4060ti 16g 4way 로는 command r plus 는 좀 힘드네요 [12]

감별사 2024.05.30 430 3

4263 일반 runpod tinyllama 야인시대 LoRA 시도(실패) [2]

세법상법 2024.05.30 317 4

4262 일반 gpu 안좋은 분들 뭐 씀? [9]

세법상법 2024.05.30 674 0

4261 일반 aya-23-35B 6.0bpw + 아프로디테로 "소설가가 되자" 일한 번역 [17]

bedovyy 2024.05.30 917 16

4260 일반 하 이직하고 오랜만에 접속하니 세계가 바뀌어 있네요... [10]

lIlBrother 2024.05.30 856 5

4259 정보 Mistral의 첫 코딩 AI, Codestral 발표 [3]

Thomas_Shelby 2024.05.29 657 5

4258 정보 MS, 미세조정 기술 '로라' 개선한 '모라' 공개 [3]

ㅇㅇ (211.214) 2024.05.29 1029 17

4257 일반 역시 Kiqu 70B는 맛있네요 [2]

용바오 2024.05.29 648 0

4256 일반 (리눅스) 수정된 nvidia 드라이버로 3090/4090 에서 P2P를 활성화해보자.

bedovyy 2024.05.29 432 5

4255 일반 혹시 채널발 '한국어' 정보글 집대성 해볼 생각 없음? [26]

세법상법 2024.05.29 1062 13

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.