뉴스
구독자 3310명 알림수신 163명
제한없는 언어모델을 위한 채널
전체글 개념글
최근 최근 방문 채널
    최근 방문 채널
      번호 제목
      작성자 작성일 조회수 추천
      2338 일반 vLLM 소형 모델 인퍼런스 느낀점 및 팁 [18]
      1033 20
      2337 학습 3달 간 LLM qlora 7b ~ 13b 사이 모델 fine tuning 한 결과 [12]
      1421 20
      2336 스터디 LoRA The Explorer - LoRA 만으로 Pretraining 을 시키는 기술 [7]
      1274 20
      2335 일반 EEVE-ALMA 영어-한국어 번역모델 [7]
      1618 20
      2334 정보 LLM 작동 원리 시각적 제공 [3]
      1374 20
      2333 자작모델 한국어 소설 작성 모델 public 전환 [13]
      1171 20
      2332 일반 Ko-Mixtral-v1.3-MoE-7Bx2 vs GPT4 답변 비교 공유드립니다. [14]
      1716 20
      2331 자작모델 현재 제작중인 소설용 AI [10]
      1516 20
      2330 정보 LLAMA-2-13B를 파인튜닝하여 LLAMA-2-Chat-70B를 이기는 법 orca2 [1]
      1139 20
      2329 일반 arxiv 논문 번역할때 개꿀팁(ar5iv) [21]
      1145 20
      2328 자작모델 Astral-7B-Instruct-v0.01 [10]
      1893 20
      2327 스터디 Mistral 7B 의 SWA (Sliding Window Attention) 에 대한 분석 [5]
      3879 20
      2326 스터디 GPT 구조 (디코더로만 구성된 트랜스포머) 에 대한 설명 + 하이퍼파라메터에 대한 설명 [7]
      1623 20
      2325 정보 AMD.. 무서운 놈이 온다. (Feat. 천재 해커 조지 호츠) [12]
      1492 20
      2324 스터디 딥러닝 논문 읽는 요령 [20]
      1191 20
      2323 스터디 엠베딩에 대해 알아보자 (Feat. Stable Diffusion) [36]
      1517 20
      2322 스터디 감쇠병합 - 모델의 레이어를 자기복제해서 추론능력을 향상시키는 방법 (feat. 3blue1brown) [5]
      918 19
      2321 스터디 언어모델 탈옥이 잘 안된다면 노오력이 부족했던 것은 아닌지 확인해봅시다 [many shot jailbreaking] [3]
      1070 19
      2320 정보 야놀자 한국어 10b 모델 [5]
      2848 19
      2319 일반 kiqu-70b-GGUF 입니다 [31]
      1781 19
      전체글 개념글
      Keyword search form input