Ai 언어모델 로컬 채널 알림 알림 중 알림 취소 구독 구독 중 구독 취소 구독자 3488명 알림수신 173명 @바바리맨 제한없는 언어모델을 위한 채널 일반 grok-1 312B(8x39B)모델 출시 ㅇㅇ 추천 13 비추천 0 댓글 9 조회수 1374 작성일 2024-03-17 20:08:52 수정일 2024-03-17 20:15:57 https://arca.live/b/alpaca/101482532 https://github.com/xai-org/grok총 296.4gb아파치 2.0활성 파라미터 86B 미세조정되지 않은 base모델성능은 나쁘지 않으나 이크기는 실용적이지는 않은듯 커도 너무커 추천! 13 ( 2) 비추! 0 ( 0) 공유 댓글 [9] 글쓰기 salmanu 2024-03-17 23:18:58 답글 일론 이거 ㅋㅋ 써볼태면 써봐라 이거였네 ㅋㅋ 펼쳐보기▼ 그래요 2024-03-17 23:38:45 답글 성능은 안써봐서 논하기 힘들지만 이거 공개는 팰콘180b랑 비슷한 기분이 드네요 펼쳐보기▼ noopSD 2024-03-18 00:10:41 답글 이 순간 제가 할 말은 이것이군요. ggerganov, 어서 llama.cpp 에서 이걸 돌아가게 만들어 주세요. 펼쳐보기▼ 02836717 2024-03-18 01:16:36 답글 라마cpp에 올리면 레이어 할당 없이는 192GB램 꽉꽉 차겠는데요 ㅋㅋㅋㅋㅋ falcon-180B가 Q4_K_S에서 101.48GB먹는다고 하니까 펼쳐보기▼ noopSD 2024-03-18 01:37:39 답글 지금은 IQ1_S 같은 극단적인 양자화도 있으니 어떻게 될지는 실제 돌려봐야 알 수 있겠네요 펼쳐보기▼ ㅇㅇ (211.252) 2024-03-21 01:54:41 삭제 수정 답글 활성파라미터 86B면 4비트만 해도 80기가에서 돌아가는거 아님? 펼쳐보기▼ ㅇㅇ (210.183) 2024-03-18 04:40:00 삭제 수정 답글 대박 머스크 펼쳐보기▼ pussydestroyer 2024-03-18 07:29:45 답글 펼쳐보기▼ hkhk 2024-03-19 06:56:49 답글 Gpt4파라메터수 보고나니 이정도는 그냥 필요한거였음 펼쳐보기▼ 새로운 댓글이 달렸습니다! 댓글 작성 음성댓글 아카콘 업로드 중 0초 해당 브라우저에서는 오디오 플레이어를 지원하지 않습니다. 녹음 중지 삭제 업로드 작성 글쓰기 전체글 개념글 등록순 추천순 (24시간) 추천순 (3일) 추천순 (전체) 댓글갯수순 (3일) 최근댓글순 추천컷 5 10 20 30 50 70 100 기타 최근 최근 방문 채널 최근 방문 채널 모두 삭제 전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모 번호 제목 작성자 작성일 조회수 추천 공지 아카라이브 모바일 앱 이용 안내(iOS/Android) *ㅎㅎ 2020.08.18 30767498 공지 Ai 언어모델 로컬 채널 이용규정 바바리맨 2023.04.18 6198 공지 뉴비에게 도움 되는 글 모음 바바리맨 2023.04.18 28108 공지 언어모델 관련 정보취득 /무료체험 가능 사이트 바바리맨 2023.04.18 9275 공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원 바바리맨 2023.08.01 5359 공지 신문고 바바리맨 2023.04.18 2332 숨겨진 공지 펼치기(1개) 자료 한국어 인공 멀티턴 데이터셋 685k 업로드 [7] maywell 2024.03.19 705 29 일반 자연어 분석이 채팅/대화 형식으로 고착되지 않았으면 좋겠음 [3] pussydestroyer 2024.03.19 665 6 일반 kiqu는 miqu의 라이센스를 따라가나요? [4] 호옹이 2024.03.19 578 0 질문 안녕하십니까 gpt 파인튜닝 관련해서 질문드립니다. [4] ㅇㅇ (117.16) 2024.03.19 406 0 정보 Gpt4는 1800b 파라메터 moe 모델이었음 [15] hkhk 2024.03.19 1527 11 일반 GPT-2를 액셀 시트에 가둬버렸다는 충격적인 소식 [4] 12시5분 2024.03.19 1321 15 정보 RWKV-5가 1.7T 갯수의 토큰을 사용하여 llama2의 성능을 능가함 [1] ㅎ헤ㅔ헤헤헤 2024.03.18 620 8 일반 레딧) grok 1 벤치마크 [4] pussydestroyer 2024.03.18 721 3 질문 말뭉치 추가로 학습하신분들 (한글 토큰추가), 주로 몇 토큰 정도 추가하셨나요? [7] lIlBrother 2024.03.18 513 0 일반 grok-1 312B(8x39B)모델 출시 [9] ㅇㅇ 2024.03.17 1375 13 질문 선생님들!! 견적과 실현 가능성을 문의하고 싶습니다! [17] ㅇㅇ (222.237) 2024.03.17 852 2 정보 gpt 3.5 turbo의 hidden dim을 4096으로 추정한 논문이 나왔네요. [1] ㅇㅇ 2024.03.15 785 9 일반 bge-m3 모델을 openai compatible api 방식으로 사용할 방법이 있을까요? [1] 호옹이 2024.03.15 645 0 질문 궁금한 것이 있슴돠.. [9] 다람쥐다 2024.03.15 625 0 질문 langchain LlamaCpp 비동기화 어렵네요ㅜ [2] 메가트론커피 2024.03.15 407 1 일반 한국어 멀티턴 데이터셋 생성 모델, KoMultiGen-General [7] maywell 2024.03.14 1554 35 질문 우바부가 쳇 오류 bigton 2024.03.14 202 0 질문 Grok 써보신 분들 계신가요? [8] LCA 2024.03.14 745 0 글쓰기 전체글 개념글 등록순 추천순 (24시간) 추천순 (3일) 추천순 (전체) 댓글갯수순 (3일) 최근댓글순 추천컷 5 10 20 30 50 70 100 기타 전체 제목/내용 제목 내용 글쓴이 댓글 Keyword search form input 검색 -4 -3 -2 -1 24-03-19 13:34 +1 +2 +3 +4