수학 특화 모델 제작 프로젝트: EEVE-Math-10.8B - 개념글 모음

개념글 모음

알림 알림 중 알림 취소

구독자 2908명 알림수신 88명

각 채널의 개념글을 모은 게시판입니다.

Ai 언어모델 로컬 일반 수학 특화 모델 제작 프로젝트: EEVE-Math-10.8B

kuo

추천 26 비추천 0 댓글 8 조회수 1792 작성일 2024-03-29 04:43:20 수정일 2024-03-29 04:44:39

https://arca.live/b/alpaca/102333238

개념글 모음

얼마전에 마이크로소프트에서 Orca-math 논문을 발표하면서 데이터셋도 같이 올렸는데, 준비된 데이터셋과 논문 내용이 맘에 들어서 한국어로 프로젝트를 진행했습니다. 결과가 아직까지 꽤 만족스러운 편이라 공유해보려고 합니다.

추가로 EEVE-Math 모델과 야놀자의 Instruct 모델을 dare-ties를 이용해 두 성능 다 챙기는 테스트도 진행했는데요. 이 결과도 만족스럽네요.

EEVE-Math-10.8B: https://huggingface.co/kuotient/EEVE-Math-10.8B

EEVE-Instruct-Math-10.8B: https://huggingface.co/kuotient/EEVE-Instruct-Math-10.8B

모델 카드(EEVE-Math만)

EEVE-Math-10.8B

EEVE-Math 프로젝트는

- Orca-Math-200k 번역

- gsm8k 번역, lm_eval 활용

- Mergekit을 이용한 dare-ties 사용

에 대한 내용을 포괄하고 있습니다.

> 이 모델은 orca-math-word-problems-193k-korean 데이터셋을 이용하여 학습되었습니다. 응답 중 일부는 LaTeX 형식을 이용하여 결과를 반환하지만, 완성된 형식이 아닐 수 있습니다. 현재 M1 stage까지 진행되었습니다.

모델	gsm8k-ko(pass@1)
Base	0.4049
SFT(M1)	0.508
SFT(M1) -> SFT	0.539
SFT(M1) -> KTO(M2)
예산이 너무 많이 들어 못할듯...

## Specifications

- SFT(M1) -> SFT 단계

## Base Model

yanolja/EEVE-Korean-10.8B-v1.0

## Dataset

orca-math-word-problems-193k-korean

## Evaluation

gsm8k-ko, kobest

| Model | gsm8k(pass@1) | boolq(acc) | copa(acc) | hellaswag(acc) | Overall |

|---|---|---|---|---|---|

| yanolja/EEVE-Korean-10.8B-v1.0 | 0.4049 | - | - | - | - | - |

| yanolja/EEVE-Korean-Instruct-10.8B-v1.0 | 0.4511 | **0.8668** | **0.7450** | 0.4940 | 0.6392 |

| **EEVE-Math-10.8B** | **0.5390** | 0.8027 | 0.7260 | 0.4760 | 0.6359 |

| **EEVE-Instruct-Math-10.8B** | 0.4845 | 0.8519 | 0.7410 | **0.4980** | **0.6439** |

모델 출력 결과물은 https://huggingface.co/datasets/kuotient/orca-math-korean-preference 여기서 확인할 수 있습니다. KTO를 위한 사전 데이터셋인데 같이 공유할테니 자유롭게 봐주세요

댓글 [8] 글쓰기

2024-03-29 04:51:41 답글

개추

펼쳐보기▼

2024-03-29 04:51:46 답글

2024-03-29 05:56:33 답글

ㅇㅇ (125.133)

2024-03-29 16:28:27 삭제 수정 답글

와~ 짱짱짱!!

펼쳐보기▼

ㅇㅇ (118.235)

2024-03-31 03:12:53 삭제 수정 답글

대단하십니다. 돌려보니 이 모델이 기존 모델보다 한글로 답변하는 수준까지 같이 올라갔네요. 감사합니다.

펼쳐보기▼

2024-03-31 11:47:57 답글

감사합니다   써보겠습니다

펼쳐보기▼

2024-04-03 17:03:18 답글

ㅊㅊㅊ

펼쳐보기▼

2024-04-09 06:31:50 답글

*수정됨

사용해봤습니다.
모델의 한국어 성능만 봐도 기존 베이스 모델보다 월등하다고 느꼈습니다.
좋은 모델 공헌해주셔서 감사합니다 ㅎㅎ

펼쳐보기▼

전체글 Ai 언어모델 로컬 채널

최근 최근 방문 채널

최근 방문 채널

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 36369983

장르소설 홍보 플러스 된 기념으로 홍보하러 왔습니다 [5]

오지라per 03-29 750 11

붕괴3rd 정보 7.4 버전 개편 요약 [50]

고시아스 03-29 4482 71

순애 건전 최고의 순애 명장면 [25]

초심자모드 03-29 9642 77

랑그릿사 랑린이의 칭구 보젤득 기념. pve 잡기술 소개 [13]

도둑왕자 03-29 634 11

TS물 육구질싸 소설이 필력도 좋고 재밌다는 건 알겠어 [12]

농빵 03-29 809 18

카운터사이드 카붕이들아 축하해주셈 [19]

다크소울템플러 03-29 733 36

블루 아카이브 🔔공지 픽업 모집 예고 - 카스미 [21]

나만고양이없어 03-29 3239 44

메이플랜드 채널 시즌1호 시동 득템떳냐 [15]

ㅅㅂㅁㅎ 03-29 572 14

벽람항로 여러분, 이걸 좀 보세요! 젖탱이에요! → (. Y .) [17]

설표 03-29 1733 29

붕괴3rd 오늘 하루만 축하해주라 [34]

다크소울템플러 03-29 1130 25

느금마엔터 탈퇴구론은 전후사정도 고려해야 함 [3]

ㅇㅇ (118.235) 03-29 406 16

에어소프트 🔫총짤 금타란 은타란 [18]

렁동이 03-29 543 11

브라운더스트 7주년 영상 정리 [5]

슬렌더 03-29 504 9

로보토미 코퍼레이션 그와중에 공지 소름돋는거 [33]

EMILSINCLAIR 03-29 4223 100

블루 아카이브 🎨창작 나츠 [26]

프링글스어니언맛 03-29 1372 57

라스트오리진 공지 [공식] 오늘의 오르카 582 ~ 584화 [44]

접음 03-29 4370 145

툴리우스 안녕하신가 툴리우스 채널 도바킨들 [23]

황무지의카짓 03-29 855 15

원신 유출 정보/후기/연구 v4찌라시 기반으로 v3과 비교하여 다수전,단일전의 차이를 간단하게 알아보자 [110]

era 03-29 6012 25

일본 생활 정보 응큼한 일붕이들을 위해 이벤트 정보 공유한다 [13]

에조국주일공사 03-29 923 6

일본 생활 잡담 이번에 AV배우랑 함께하는 캠프있던데 [7]

에조국주일공사 03-29 610 5

프로젝트 세카이 계란이 떨어지면? [22]

카나데 03-29 319 11

라스트오리진 대문+광고 멀린 음악회를 열다 대문 [19]

라비라비 03-29 1600 71

Ai 언어모델 로컬 일반 수학 특화 모델 제작 프로젝트: EEVE-Math-10.8B [8]

kuo 03-29 1793 26

핫딜 식품 1등급 한우 육사시미 200g + 200g 소스 2봉 (13,599원/무료) [25]

라리안 03-28 3999 9

쿄야마 카즈사 창작 카즈사 [2]

idolmictheif 03-25 377 6

동방프로젝트 창작 낙원의 멋진 무녀 [9]

Stussy 03-29 451 16

라스트오리진 암만 생각해도 납득이 안가는데 [22]

맘마너무조아맘마없이못살아 03-29 1687 14

우마무스메 프리티 더비 짤 하 나노 [7]

망조의짐승팔코 03-28 1011 34

유머 유머 어느 사황 간부진 클래스.JPG [68]

냥냥파라 03-29 12536 143

유희왕 뭣 [19]

Hailey 03-29 648 18

전체글 Ai 언어모델 로컬 채널