구독자 3310명
알림수신 163명
제한없는 언어모델을 위한 채널
최근
최근 방문 채널
최근 방문 채널
번호
제목
작성일
조회수
추천
2338
일반
vLLM 소형 모델 인퍼런스 느낀점 및 팁
[18]
1033
20
2337
학습
3달 간 LLM qlora 7b ~ 13b 사이 모델 fine tuning 한 결과
[12]
1421
20
2336
스터디
LoRA The Explorer - LoRA 만으로 Pretraining 을 시키는 기술
[7]
1274
20
2335
일반
EEVE-ALMA 영어-한국어 번역모델
[7]
1618
20
2334
정보
LLM 작동 원리 시각적 제공
[3]
1374
20
2333
자작모델
한국어 소설 작성 모델 public 전환
[13]
1171
20
2332
일반
Ko-Mixtral-v1.3-MoE-7Bx2 vs GPT4 답변 비교 공유드립니다.
[14]
1716
20
2331
자작모델
현재 제작중인 소설용 AI
[10]
1516
20
2330
정보
LLAMA-2-13B를 파인튜닝하여 LLAMA-2-Chat-70B를 이기는 법 orca2
[1]
1139
20
2329
일반
arxiv 논문 번역할때 개꿀팁(ar5iv)
[21]
1145
20
2328
자작모델
Astral-7B-Instruct-v0.01
[10]
1893
20
2327
스터디
Mistral 7B 의 SWA (Sliding Window Attention) 에 대한 분석
[5]
3879
20
2326
스터디
GPT 구조 (디코더로만 구성된 트랜스포머) 에 대한 설명 + 하이퍼파라메터에 대한 설명
[7]
1623
20
2325
정보
AMD.. 무서운 놈이 온다. (Feat. 천재 해커 조지 호츠)
[12]
1492
20
2324
스터디
딥러닝 논문 읽는 요령
[20]
1191
20
2323
스터디
엠베딩에 대해 알아보자 (Feat. Stable Diffusion)
[36]
1517
20
2322
스터디
감쇠병합 - 모델의 레이어를 자기복제해서 추론능력을 향상시키는 방법 (feat. 3blue1brown)
[5]
918
19
2321
스터디
언어모델 탈옥이 잘 안된다면 노오력이 부족했던 것은 아닌지 확인해봅시다 [many shot jailbreaking]
[3]
1070
19
2320
정보
야놀자 한국어 10b 모델
[5]
2848
19
2319
일반
kiqu-70b-GGUF 입니다
[31]
1781
19