뉴비 4060ti 16G 사서 llama3 돌려봄 - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3538명 알림수신 174명 @바바리맨

제한없는 언어모델을 위한 채널

일반 뉴비 4060ti 16G 사서 llama3 돌려봄

게지네

추천 7 비추천 0 댓글 2 조회수 973 작성일 2024-04-30 19:50:40

https://arca.live/b/alpaca/105041993

다른건 모르겠고 모델별로 VRAM 사용량만 체크해봄

뉴비라 아는게 없어서 ollama로 돌려봄

먼저 8B

ollama run llama3:8b-instruct-fp16

ollama run llama3:8b-instruct-q8_0

ollama run llama3:8b-instruct-q4_0

70B는 안될거 뻔해서 Q2만 돌려봄

ollama run llama3:70b-instruct-q2_K

VRAM 다쓰고도 추가로 26기가정도 땡기더라

댓글 [2] 글쓰기

ㅇㅇ

2024-05-01 02:00:54 답글

후기추

펼쳐보기▼

소믈리에

2024-05-08 17:39:03 답글

내가 이짓 해보려고 했는데...  그래서 아웃풋은 좋았음?

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 31487881

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6294

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 28628

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 9505

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

학습 몇가지 llama 2 7b instruction format 테스팅하면서 느낀점 [2]

ㅇㅇ (61.33) 2024.05.02 737 2

정보 모델은 얼마나 벤치마크에 과적합 되어 있은가?: GSM-1k [15]

jackofmaster 2024.05.02 1350 15

일반 라마3 8B모델 파인튜닝용 PC 견적 문의 [15]

ㅇㅇ (58.87) 2024.05.02 1251 -1

일반 llama3는 어떤 시스템 프롬프트를 사용해야 될까요? [3]

ㅇㅇ (112.146) 2024.05.02 774 0

일반 여기 국제인공지능대전 다녀오신 분 있나요? [5]

ㅇㅇ (58.232) 2024.05.01 896 3

일반 Llama-3-8B-Instruct & 한국어 모델들에 "DJ DJ pump this party"로 테스트를 해봤습니다 [4]

ㅇㅇ 2024.05.01 2255 19

일반 5090 5080 루머라는데 [18]

ㅇㅇ 2024.05.01 1139 0

정보 4060ti 16GB 메모리 오버클럭 비교 [6]

게지네 2024.05.01 737 7

일반 A6000x3 llama3 70B inference 가능한가요? [3]

ㅇㅇ (1.241) 2024.04.30 553 -1

일반 메모리 대역폭과 이론적 최대 토큰 수 (cpu 추론이 느린 이유) [9]

PRG 2024.04.30 665 6

일반 뉴비 4060ti 16G 사서 llama3 돌려봄 [2]

게지네 2024.04.30 974 7

일반 라마3 토크나이저 기반 소형 모델 l3-211m [2]

maywell 2024.04.30 1635 22

jack 2024.04.30 655 2

질문 PEFT 중에서 주로쓰는 기법들이 무엇이 있을까요? [9]

Aimyon 2024.04.30 630 -1

질문 RAG 관련해서 청크 질문드립니다. [12]

ㅇㅇ (61.33) 2024.04.30 876 2

일반 라마3 8b가 100만 컨텍스트까지 확장되었다고 합니다 [15]

그래요 2024.04.30 1223 6

일반 LLAMA3-70B 로컬 성능저하없이 구동 사양 질문드립니다 [4]

ㅇㅇ (59.31) 2024.04.29 1276 -1

질문 LLM 서버 병렬처리 [4]

ㅇㅇ (118.235) 2024.04.29 837 1

질문 RAG 를 어떻게 하면 최적화 할 수 있을까요? [4]

ㅇㅇ (14.45) 2024.04.29 845 1

일반 Llama-3-Open-Ko-8B-Instruct-preview-gguf 가 있어서 한 번 돌려봤음 [7]

noc 2024.04.29 1220 1

글쓰기

전체글 개념글