phi 3 mini출시 - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3806명 알림수신 194명 @바바리맨

제한없는 언어모델을 위한 채널

정보 phi 3 mini출시

jackofmaster

추천 3 비추천 0 댓글 6 조회수 624 작성일 2024-04-23 14:55:17

https://arca.live/b/alpaca/104393891

https://huggingface.co/microsoft/Phi-3-mini-128k-instruct

성능은 몰?루

댓글 [6] 글쓰기

도지도지

2024-04-23 15:40:26 답글

간단히 테스트해 봤습니다. 3.8B라는 사이즈를 감안하면 대단한 성능이라는 생각이 들지만
벤치마크 처럼 라마3 8B나 미스트랄 7B를 능가한다는 느낌은 전혀 들지 않습니다.

펼쳐보기▼

jackofmaster

2024-04-23 15:43:20 답글

역시 합성된 데이터는 벤치마크에 편향되 있는건가?

펼쳐보기▼

도지도지

2024-04-23 16:22:55 답글

이걸 뭐라 해야 하지.. 헛똑똑하다고 해야 하나.
제대로 아는 건 없는데 능지만 있는 느낌.

펼쳐보기▼

그래요

2024-04-24 06:10:44 답글

그보다는 똑똑은 한데 지식이 부족한 느낌? 뭐 그래요

펼쳐보기▼

모올루

2024-04-23 15:49:07 답글

근데 3.8은 어디다 쓰는 걸까요? function calling이나 라그 같은 특수 용도에 특화된 건지

펼쳐보기▼

모올루

2024-04-23 15:49:52 답글

*수정됨

7b 5비트 정도 양자화하면 3.8gb 가까이 나올 거 같은데

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 36373443

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 7384

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 33657

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 11280

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

4547 정보 sglang vs vllm 속도테스트 [3]

bedovyy 2024.07.28 875 9

4546 일반 라데온도 언어모델이 되긴 되네요. [6]

ㅇㅇ (124.53) 2024.07.28 759 8

4545 일반 4090 1개와 cpu 만으로 deepseek 236b 14t/s [5]

감별사 2024.07.28 829 5

4544 정보 AMD 5600G를 이용해 추론을 해보자 (Win11+llama.cpp Vulkan) [2]

bedovyy 2024.07.27 1078 17

4543 일반 세일즈포스가 멀티모달용 데이타셋을 오픈소스로 풀었습니다 [1]

ㅇㅇ 2024.07.27 857 18

4542 정보 양자화가 다국어 LLM에 어떤 영향을 미치는가? [9]

폰은정 2024.07.27 1556 21

4541 일반 첫 시도만 대형 모델로 3~5번 해준 뒤에 소형 모델로 작업을 이어나가게 시키면 [15]

폰은정 2024.07.26 891 4

4540 일반 한국어로는 mistral nemo가 최고인듯합니다. [3]

ㅇㅇ (61.97) 2024.07.26 1537 -1

4539 일반 민감한 정보를 다량 처리해야 할 때 로컬 모델이 신이야 [1]

폰은정 2024.07.26 801 7

4538 일반 미스트랄 라지2 4비트(4.27bpw)를 4090+CPU로 추론해봤습니다 [1]

ㅇㅇ 2024.07.26 629 4

4537 질문 Ollama에서 제공하는 llama3.1 8b 4GB 짜리랑 양자화한 8GB 랑 성능차이가 왜이리 심할까요? [8]

닉방구 2024.07.26 921 0

4536 일반 CPU 기반 LLM 인데 llama.cpp 보다 40배나 빠르다? [11]

ㅇㅇ (118.235) 2024.07.26 1139 3

4535 일반 삼성전자가 인수한 지식그래프 기반 AI 의 오픈소스 버전 [10]

ㅇㅇ (118.235) 2024.07.26 1934 27

4534 질문 Llama 3.1 8b 환각 매우 심하네요... ㅋㅋ [4]

닉방구 2024.07.26 1224 1

4533 질문 문장 교정을 해주는 LLM을 찾고 있습니다 [6]

호호우 2024.07.25 716 0

4532 정보 llama.cpp row split-mode를 써서 멀티 GPU 생성속도를 높여보자 [6]

bedovyy 2024.07.25 420 4

4531 질문 Gpu 딸리면 속도 말고 품질도 떨어지나요?? [7]

닉방구 2024.07.25 784 0

4530 일반 gradio 사용시 추론속도 느려지는 이유가 뭔가요?? [4]

ㅇㅇ (220.89) 2024.07.25 336 0

4529 질문 1회 출력당 최대 토큰까지 무조건 활용하게 하려면 어떻게 해야 하나요? [3]

폰은정 2024.07.25 415 0

글쓰기

전체글 개념글