Ai 언어모델 로컬 채널 알림 알림 중 알림 취소 구독 구독 중 구독 취소 구독자 3440명 알림수신 169명 @바바리맨 제한없는 언어모델을 위한 채널 질문 3090×4에서 wizardlm 8x22b를 배포할 수 있을까요? 모맵 추천 0 비추천 1 댓글 6 조회수 657 작성일 2024-05-15 10:59:27 ⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다. https://arca.live/b/alpaca/106255214 대층 vllm 써보려 했는데 방법을 모르겠네요vllm은 잘 안써봐서 추천! 0 ( 0) 비추! 1 ( 0) 공유 댓글 [6] 글쓰기 namuduk 2024-05-15 11:02:05 답글 8x22x0.5 = 88GB 24x4= 96GB 길이 많이 줄이면 가능 할라나요? 펼쳐보기▼ ㅇㅇ (211.234) 2024-05-15 12:31:52 삭제 수정 답글 Moe모델이라 8x22b모델은 일반적인 176b 모델보다 작을껄요? 펼쳐보기▼ 그래요 2024-05-15 13:18:41 답글 4비트 정도면 되지 않으려나요 펼쳐보기▼ 모맵 2024-05-15 17:32:56 답글 아마 8비트로도 될 듯 한데... 구동 방법을 모르겠네요 펼쳐보기▼ 감별사 2024-05-16 06:05:41 답글 4비트로 됩니다 펼쳐보기▼ 모맵 2024-05-16 06:44:09 답글 혹시 실행 인자는 어떻게 주면 되려나요? 펼쳐보기▼ 새로운 댓글이 달렸습니다! 댓글 작성 음성댓글 아카콘 업로드 중 0초 해당 브라우저에서는 오디오 플레이어를 지원하지 않습니다. 녹음 중지 삭제 업로드 작성 글쓰기 전체글 개념글 등록순 추천순 (24시간) 추천순 (3일) 추천순 (전체) 댓글갯수순 (3일) 최근댓글순 추천컷 5 10 20 30 50 70 100 기타 최근 최근 방문 채널 최근 방문 채널 모두 삭제 전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모 번호 제목 작성자 작성일 조회수 추천 공지 아카라이브 모바일 앱 이용 안내(iOS/Android) *ㅎㅎ 2020.08.18 29823055 공지 Ai 언어모델 로컬 채널 이용규정 바바리맨 2023.04.18 6103 공지 뉴비에게 도움 되는 글 모음 바바리맨 2023.04.18 27553 공지 언어모델 관련 정보취득 /무료체험 가능 사이트 바바리맨 2023.04.18 9093 공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원 바바리맨 2023.08.01 5231 공지 신문고 바바리맨 2023.04.18 2297 숨겨진 공지 펼치기(1개) 4273 일반 메타, 라마3-v 8b모델 공개했네요 [1] ㅇㅇ 2024.06.01 60 1 4272 질문 LoRA 제작 두번 실패하면서 모은 질문들 세법상법 2024.06.01 108 0 4271 일반 command r plus 4bit + 3090 4way 후기 [6] 감별사 2024.06.01 313 5 4270 일반 특징 조작 관련 라마 모델 몇 가지 및 기술(Orthogonalization, ReFT, 우울한 라마, 금문교 라마) [3] ㅇㅇ 2024.06.01 283 13 4269 일반 일지 세법상법 2024.05.31 157 0 4268 일반 vast.ai + command r plus 4bit + a4000 * 8 [8] 감별사 2024.05.31 248 5 4267 일반 오늘은 다른 방식으로 굽는 중 세법상법 2024.05.31 184 0 4266 질문 데이터 형식 질문 ㅇㅇ 2024.05.31 160 0 4265 일반 rtx5090 vram 28기가 루머 [17] whs 2024.05.31 637 2 4264 일반 4060ti 16g 4way 로는 command r plus 는 좀 힘드네요 [12] 감별사 2024.05.30 418 3 4263 일반 runpod tinyllama 야인시대 LoRA 시도(실패) [2] 세법상법 2024.05.30 309 4 4262 일반 gpu 안좋은 분들 뭐 씀? [9] 세법상법 2024.05.30 640 0 4261 일반 aya-23-35B 6.0bpw + 아프로디테로 "소설가가 되자" 일한 번역 [16] bedovyy 2024.05.30 872 16 4260 일반 하 이직하고 오랜만에 접속하니 세계가 바뀌어 있네요... [10] lIlBrother 2024.05.30 814 5 4259 정보 Mistral의 첫 코딩 AI, Codestral 발표 [3] Thomas_Shelby 2024.05.29 639 5 4258 정보 MS, 미세조정 기술 '로라' 개선한 '모라' 공개 [3] ㅇㅇ (211.214) 2024.05.29 967 17 4257 일반 역시 Kiqu 70B는 맛있네요 [2] 용바오 2024.05.29 640 0 4256 일반 (리눅스) 수정된 nvidia 드라이버로 3090/4090 에서 P2P를 활성화해보자. bedovyy 2024.05.29 425 5 4255 일반 혹시 채널발 '한국어' 정보글 집대성 해볼 생각 없음? [26] 세법상법 2024.05.29 1000 13 4254 일반 (성공) Aphrodite + 160GB + 4060ti * 4 + llama 3 70b [23] 감별사 2024.05.29 1004 11 글쓰기 전체글 개념글 등록순 추천순 (24시간) 추천순 (3일) 추천순 (전체) 댓글갯수순 (3일) 최근댓글순 추천컷 5 10 20 30 50 70 100 기타 전체 제목/내용 제목 내용 글쓴이 댓글 Keyword search form input 검색 1 2 3 4 5 6 7 8 9 10 시간으로 바로가기 사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.