mistral 7b기반 OpenOrca 출시 - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3789명 알림수신 191명 @바바리맨

제한없는 언어모델을 위한 채널

정보 mistral 7b기반 OpenOrca 출시

사과는맛있어맛있으면바나나

추천 6 비추천 0 댓글 4 조회수 1265 작성일 2023-10-03 05:15:28 수정일 2023-10-03 05:29:43

https://arca.live/b/alpaca/87815165

레딧: https://reddit.com/r/LocalLLaMA/s/HcI0qhl7X5

허깅: https://huggingface.co/Open-Orca/Mistral-7B-OpenOrca

13b 모델 대부분을 누른다고 함

아래는 관련 게시글 번역

지금 라마 65b보다 7b가 더 좋아요??? 미스트랄 오르카는 아웃!

오늘 Mistral-7B-OpenOrca를 출시합니다. 7B 모델 중 최초로 30B 이하의 모든 모델보다 종합점수가 우수한 모델입니다. Lama2-70B챗 98%의 성능을 달성했습니다!

Mistral-7B의 놀라운 공개 출시를 보여준 Mistral AI에게 감사드립니다! 가정용 GPU를 위한 이 정도의 기능을 준비할 수 있어서 정말 좋습니다. 또한 @winglian @Tecknium1 @TheBloke AI 및 모든 Alignment Lab AI 친구들에게도 감사드립니다! 이제 10배 더 큰 모델을 이길 수 있습니다!

지금 바로 브라우저에서 빠른 GPU로 우리 모델을 라이브로 사용해 볼 수 있도록 우리의 허깅 페이스 공간을 확인해 보세요!

우리는 Mistral 7B 위에서 자체 OpenOrca 데이터 세트를 사용하여 미세 조정했습니다. 이 데이터 세트는 Microsoft Research의 Orca Paper용으로 생성된 데이터 세트를 재현하려는 시도입니다. 우리는 Axolotl로 훈련된 OpenChat 패킹을 사용합니다.

이 릴리스는 대부분의 GPT-4 증강 데이터의 큐레이팅된 필터링된 서브셋에 대해 학습되었습니다. OpenOrcax OpenChat-Preview2-13B 모델에 사용된 것과 동일한 데이터 서브셋입니다.

HF 리더보드는 출시 시점에 30B보다 작은 모든 모델의 경우 이 모델을 #2로 지정하여 13B 모델 1개를 제외한 모든 모델보다 성능이 뛰어납니다.

이 릴리스는 클래스를 획기적으로 향상시키는 성능을 갖춘 완전 개방형 모델로 보통 수준의 소비자용 GPU에서도 완전 가속 실행이 가능합니다. 여기까지 앞서주신 Mistral 팀에게 감사드립니다.

우리는 애정을 담아 이 모델의 코드명을 "미스트랄 오르카"로 정합니다

더 많은 모델을 교육하는 과정을 진행 중이므로 흥미로운 파트너와 함께 곧 출시될 예정인 제품에 대해 당사 기관을 주시해 주시기 바랍니다.

또한 저희 서버에서 몰래 피크를 알리는 안내문도 함께 제공합니다. 여기에서 확인하실 수 있습니다:

https://AlignmentLab.ai

또는 OpenAccess AI Collective 서버에서 Axolotl 트레이너에 대한 자세한 내용을 확인해 보십시오:

댓글 [4] 글쓰기

한푼만주세요

2023-10-03 06:42:01 답글

으잉..65B 넘는  7B라니...ㄷㄷ

펼쳐보기▼

파라노이아

2023-10-03 06:44:31 답글

흠.... 일단 실제 구동후기글을 안 보고선 못 믿겠다....

펼쳐보기▼

novelgif

2023-10-03 07:02:46 답글

이게 전부다 llama2(메타) 덕분이지! 덕분에 데이터셋을 이미 만들었고 빠르게 파인튜닝이 가능해서 성능도 빠르게 향상 되넹 
https://huggingface.co/spaces/Open-Orca/Mistral-7B-OpenOrca     여기서 테스트 해볼 수 있네.. 양자화 된 버전이 아닌거 같고.. 답변이 13B 수준이긴 하넹.

a Hugging Face Space by Open-Orca

Mistral-7B-OpenOrca - a Hugging Face Space by Open-Orca

Discover amazing ML apps made by the community

*수정됨

이게 전부다 llama2(메타) 덕분이지! 덕분에 데이터셋을 이미 만들었고 빠르게 파인튜닝이 가능해서 성능도 빠르게 향상 되넹 
https://huggingface.co/spaces/Open-Orca/Mistral-7B-OpenOrca     여기서 테스트 해볼 수 있네.. 양자화 된 버전이 아닌거 같고.. 답변이 13B 수준이긴 하넹.

펼쳐보기▼

그래요

2023-10-04 02:28:01 답글

일단 평가숫자보다 실사용기가 중요할듯요

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 36158428

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 7344

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 33365

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 11215

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

557 정보 System 2 Attention [1]

ㅎ헤ㅔ헤헤헤 2023.11.21 355 5

556 정보 LLAMA-2-13B를 파인튜닝하여 LLAMA-2-Chat-70B를 이기는 법 orca2 [1]

ㅎ헤ㅔ헤헤헤 2023.11.21 1217 20

555 정보 gpt-4,gpt-4-turbo 보다 sql쿼리문을 더 잘짜는 모델 [2]

ㅎ헤ㅔ헤헤헤 2023.11.20 559 5

554 정보 LLM 리더보드 및 벤치마크 용어 / leaderboard,benchmark [8]

novelgif 2023.11.19 1623 17

553 정보 openai CEO"였던" 샘 알트만이 다시 복귀한다고...? [9]

ㅎ헤ㅔ헤헤헤 2023.11.18 491 3

552 정보 '비상식적 상황에 대한 대처 추론 능력 강화' 에 대한 논문 [2]

hkhk 2023.11.17 336 8

551 정보 RWKV-6 실험결과 5.2버전보다 1.26배 성능향상?

ㅎ헤ㅔ헤헤헤 2023.11.16 333 2

550 정보 Microsoft 가 Phi-2 모델 발표 [5]

hkhk 2023.11.16 920 10

549 정보 rwkv-5 7B 49% 학습 벤치 결과 [5]

ㅎ헤ㅔ헤헤헤 2023.11.15 460 5

548 정보 [뉴뉴비] wsl설치 + 우바부가(text-generation-webui) 설치 + 모델 다운로드 및 사용 방법 [12]

joj 2023.11.15 2138 12

547 정보 엔비디아 데이터센터용 신규모델 [4]

헛소리전문 2023.11.10 493 1

546 정보 GPT Store

모찌파 2023.11.06 420 1

545 정보 프롬포트 망각 현상을 없애는 기법

ㅎ헤ㅔ헤헤헤 2023.11.06 513 4

544 정보 rwkv5 3B 학습이 71% 완료 되었습니다. [3]

ㅎ헤ㅔ헤헤헤 2023.11.04 428 6

543 정보 트위터(x)의 LLM "Grok" 스샷 공개 + 트위터 일부 유료 유저에게 공개 [3]

al06r 2023.11.04 472 1

542 정보 3단 콤보모델 등장 - HelixNet [1]

noopSD 2023.11.04 384 8

541 정보 일론머스크 : 오늘 x.ai 첫 LLM 출시한다 [3]

al06r 2023.11.04 556 3

540 정보 mistral 7b 컨텍스트 128k 출시(gpt4의 16배 길이) [4]

al06r 2023.11.04 616 7

539 정보 챈 제작 데이타셋 공동 작업에 참고할만한 도구

hkhk 2023.11.03 271 8

538 정보 gpt3.5가 20B가 아닐수도 있다는 레딧 글 [10]

사과는맛있어맛있으면바나나 2023.11.02 792 2

글쓰기

전체글 개념글