![](http://ac.namu.la/20230322sac/2d1250c6486e5c57ccd90372bdb6987442593d422e690da413127ba59ca20aaa.jpg?expires=1719795600&key=13b9kVrsttUih1JXfGsJ3w)
구독자 3539명
알림수신 174명
제한없는 언어모델을 위한 채널
일반
무한 어텐션을 활용한 10M 컨텍스트 Gemma
추천
4
비추천
0
댓글
0
조회수
365
작성일
수정일
![](http://ac.namu.la/20230322sac/2d1250c6486e5c57ccd90372bdb6987442593d422e690da413127ba59ca20aaa.jpg?expires=1719795600&key=13b9kVrsttUih1JXfGsJ3w)
댓글
[0]
글쓰기
새로운 댓글이 달렸습니다!
최근
최근 방문 채널
최근 방문 채널
번호
제목
작성일
조회수
추천
공지
아카라이브 모바일 앱 이용 안내(iOS/Android)
31523223
공지
Ai 언어모델 로컬 채널 이용규정
6298
공지
뉴비에게 도움 되는 글 모음
28644
공지
언어모델 관련 정보취득 /무료체험 가능 사이트
9509
공지
여러분의 학습에 도움을 줄 수 있는 하드웨어 지원
5498
공지
신문고
2367
숨겨진 공지 펼치기(1개)
4305
일반
qwen int4 모델도 벤치마크가 굉장히 좋네요
335
4
4304
질문
RAFT 적용시켜보신 분 계신가요?
[2]
434
1
4303
정보
qwen2출시
[5]
770
8
4302
일반
와 너무 어렵네요..
[6]
872
3
4301
질문
라마3 학습 하실때, 데이터 포맷을 어떻게 하시나요?
[6]
553
0
4300
일반
LLM을 실무에 쓰시는 분들 계신가요?
[9]
917
2
4299
질문
허깅페이스에 올라온 수많은 라마3 모델들 어떤 차이가 있는지 궁금합니다.
[8]
706
0
4298
질문
혹시 vllm을 쓰지 않는 needle-in-a-haystack 코드가 있을까?
323
0
4297
일반
네이버는 내부적으로 vllm 쓰나보네요
[2]
870
1
4296
정보
THUDM/glm-4v-9b 출시
[4]
490
6
4295
질문
입력한 쿼리가 차지하는 token에 대한 질문
[4]
371
0
4294
질문
LLM context 관련 질문드립니다
[4]
482
0
4293
일반
맥스튜디오 M4 빨리 나왔으면 좋겠네요
[4]
590
2
4292
질문
아래꺼 코드 전문
[10]
491
1
4291
스터디
FineWeb - 오픈소스 언어모델 개발을 위한 큰 도약
[17]
1565
31
4290
일반
llm 관련 영문 위키 페이지 읽어보는데 이거 재밌네요
386
0
4289
질문
dpr에서 학습에 사용된 방법론과 raft간의 차이에서 생기는 의문
[4]
351
1
4288
질문
5시간동안 디버깅하다가 안돼서 질문
[8]
449
0
사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.