구독자 3448명
알림수신 170명
제한없는 언어모델을 위한 채널
최근
최근 방문 채널
최근 방문 채널
번호
제목
작성일
조회수
추천
4154
일반
[lmsys] Llama-3-70B가 잘하는 것과 못하는 것
[4]
982
6
4153
일반
왜 임베딩 벡터는 이렇게 고차원이 되었을까
[6]
697
0
4152
질문
하루에 3000만토큰 쯤 쓰는데 로컬로 ..
[22]
935
1
4151
일반
exllamav2가 최고라고 생각했었는데 vllm은 어떤가요?
[7]
524
0
4150
질문
BERT에 관련하여
[3]
514
0
4149
일반
gemma를 ollama에서 서빙을 하려 합니다.
[3]
503
0
4148
질문
llama.cpp로 양자화할때 에러가 뜨는데 무슨 문제려나요
[2]
302
0
4147
질문
Deepspeed 사용하는 방법 아시나요?
[18]
628
0
4146
일반
코딩 llm 자주 사용함?
[23]
1088
2
4145
자료
IBM에서 아파치2 라이센스로 코딩모델 출시
[5]
331
2
4144
일반
호기심에 번역한거 비교해봄
[12]
778
1
4143
스터디
트랜스포머도 깊게 생각을 하려면 메모장이 필요해요 - Vision Transformers Need Registers
[21]
1308
42
4142
스터디
디퓨전 모델이 학습하는 원리 - 어디까지 암기이고 어디부터 학습일까? - 디퓨전 모델은 정말 이해를 하고서 이미지를 만드는걸까?
[12]
1329
40
4141
질문
업무 목적으로 한국어 튜닝해서 사용하시는 분 계신가요?
[7]
696
0
4140
일반
(구글x서울디지털재단)2024 서울 프롬프톤(AI 프롬프트엔지니어링 해커톤) 참가자 모집(기간 연장, ~5.15)
[9]
1045
11
4139
일반
A100 40GB로 llama3 70B 구동은 되는지?
[3]
775
2
4138
일반
ms가 500b 모델을 학습중이라고 합니다
[3]
500
3
4137
질문
베이스라인 모델 선정 방법
350
0
4136
일반
판매자 정보 실수 - 4060ti 16gb dual 또는 3way 를 위한 핫딜 정보
[11]
770
5
4135
질문
vllm 활용 추론 관련해서 질문드립니다.
[10]
564
0