TinyStories-Korean - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3487명 알림수신 173명 @바바리맨

제한없는 언어모델을 위한 채널

자료 TinyStories-Korean

hkhk

추천 6 비추천 0 댓글 1 조회수 418 작성일 2024-05-15 06:19:50

https://arca.live/b/alpaca/106233716

초소형 언어모델 만드는 데이타셋 tinystories 를 한글로 번역한 데이타셋이 허깅페이스에 올라옴

https://huggingface.co/datasets/g0ster/TinyStories-Korean

이거에다 karpathy 의 llama2.c 이용해서 한국어 pretrained model 만들어볼 수 있을 듯?

https://github.com/karpathy/llama2.c

댓글 [1] 글쓰기

ㅇㅇ

2024-05-15 07:13:40 답글

오 바로 한번 구워봐야지

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30761093

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6198

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 28104

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 9272

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

4317 스터디 qwen2 소개 - Part II 강화학습 단계에서 머징기법의 활용 (Feat. deccp) [2]

hkhk 2024.06.09 77 5

4316 스터디 qwen2 소개 (Feat. 논문 3개 분석 - Part I) [7]

hkhk 2024.06.09 367 28

4315 일반 vllm, aphrodite 그리고 sglang (RadixAttention)

감별사 2024.06.09 171 7

4314 질문 질문 및 간단한 실험결과 - 라마3의 <|end_of_text|> 적용문제 관련한 질문입니다. [3]

Dikko 2024.06.09 222 1

4313 질문 WEB UI로 출력한 결과값을 HTML로 개인 사이트를 구현 가능할까요? [3]

아몰랑 2024.06.08 331 2

4312 일반 Qwen2-72B-Instruct-GPTQ-Int4 일한 번역 성능 [6]

bedovyy 2024.06.07 563 6

4311 일반 Qwen2 LogicKor 리더보드 추가 [2]

maywell 2024.06.07 498 10

4310 일반 Qwen 72b 시스템 프롬프트 고친 후기. [3]

감별사 2024.06.07 409 5

4309 일반 vllm + qwen 2 72B 4bit 후기 (4060ti 16GB 4way) [4]

감별사 2024.06.07 428 6

4308 일반 ollama qwen 2 업로드됐네요 [6]

ㅇㅇ (222.101) 2024.06.07 369 3

4307 일반 qwen int4 모델도 벤치마크가 굉장히 좋네요

ㅇㅇ (222.101) 2024.06.07 242 4

4306 질문 RAFT 적용시켜보신 분 계신가요? [2]

ㅇㅇ (222.101) 2024.06.07 263 1

4305 정보 qwen2출시 [5]

jackofmaster 2024.06.06 606 8

4304 일반 와 너무 어렵네요.. [6]

초보뉴비 (114.71) 2024.06.06 661 2

4303 질문 라마3 학습 하실때, 데이터 포맷을 어떻게 하시나요? [6]

ㅇㅇ (211.184) 2024.06.06 395 0

4302 일반 LLM을 실무에 쓰시는 분들 계신가요? [8]

ㅇㅇ (112.157) 2024.06.06 681 2

4301 질문 허깅페이스에 올라온 수많은 라마3 모델들 어떤 차이가 있는지 궁금합니다. [8]

rosewar 2024.06.06 581 0

4300 질문 혹시 vllm을 쓰지 않는 needle-in-a-haystack 코드가 있을까?

이하비스 2024.06.05 275 0

글쓰기

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.