Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3310명 알림수신 163명 @바바리맨

제한없는 언어모델을 위한 채널

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

2338 일반 vLLM 소형 모델 인퍼런스 느낀점 및 팁 [18]

maywell 2024.04.25 1033 20

2337 학습 3달 간 LLM qlora 7b ~ 13b 사이 모델 fine tuning 한 결과 [12]

ㅇㅇ (61.33) 2024.04.14 1421 20

2336 스터디 LoRA The Explorer - LoRA 만으로 Pretraining 을 시키는 기술 [7]

hkhk 2024.03.20 1274 20

2335 일반 EEVE-ALMA 영어-한국어 번역모델 [7]

ㅇㅇ (49.172) 2024.03.03 1618 20

2334 정보 LLM 작동 원리 시각적 제공 [3]

zzzzz5 2024.03.01 1374 20

2333 자작모델 한국어 소설 작성 모델 public 전환 [13]

maywell 2024.02.26 1171 20

2332 일반 Ko-Mixtral-v1.3-MoE-7Bx2 vs GPT4 답변 비교 공유드립니다. [14]

DopeorNope 2024.01.30 1716 20

2331 자작모델 현재 제작중인 소설용 AI [10]

maywell 2023.12.20 1516 20

2330 정보 LLAMA-2-13B를 파인튜닝하여 LLAMA-2-Chat-70B를 이기는 법 orca2 [1]

ㅎ헤ㅔ헤헤헤 2023.11.21 1139 20

2329 일반 arxiv 논문 번역할때 개꿀팁(ar5iv) [21]

nrr 2023.10.26 1145 20

2328 자작모델 Astral-7B-Instruct-v0.01 [10]

JINfe 2023.10.13 1893 20

2327 스터디 Mistral 7B 의 SWA (Sliding Window Attention) 에 대한 분석 [5]

hkhk 2023.09.28 3879 20

2326 스터디 GPT 구조 (디코더로만 구성된 트랜스포머) 에 대한 설명 + 하이퍼파라메터에 대한 설명 [7]

hkhk 2023.08.28 1623 20

2325 정보 AMD.. 무서운 놈이 온다. (Feat. 천재 해커 조지 호츠) [12]

hkhk 2023.05.25 1492 20

2324 스터디 딥러닝 논문 읽는 요령 [20]

hkhk 2023.05.09 1191 20

2323 스터디 엠베딩에 대해 알아보자 (Feat. Stable Diffusion) [36]

hkhk 2023.04.21 1517 20

2322 스터디 감쇠병합 - 모델의 레이어를 자기복제해서 추론능력을 향상시키는 방법 (feat. 3blue1brown) [5]

hkhk 2024.04.22 918 19

2321 스터디 언어모델 탈옥이 잘 안된다면 노오력이 부족했던 것은 아닌지 확인해봅시다 [many shot jailbreaking] [3]

hkhk 2024.04.03 1070 19

2320 정보 야놀자 한국어 10b 모델 [5]

hkhk 2024.02.26 2848 19

2319 일반 kiqu-70b-GGUF 입니다 [31]

noopSD 2024.02.24 1781 19

전체글 개념글