https://huggingface.co/spaces/instructkr/LogicKor-leaderboard
안녕하세요. 며칠전 릴리즈했던 LogicKor의 리더보드 페이지가 만들어졌습니다.
LogicKor는 한국어 거대언어모델의 다분야 사고력을 측정하는 벤치마크입니다. 추론, 수학, 글쓰기, 코딩, 이해, 문법 등 다양한 분야의 사고력을 측정합니다.
이제 정적 이미지가 아니라 모바일 및 PC 웹을 통해서 리더보드를 확인 하실 수 있습니다.
평가를 희망하는 모델이 있으시면 웹 사이트에 <모델 추가 요청> 버튼을 이용해주세요.
돈 후달리지 않으니 막 요청 해주셔도 됩니다.
구독자 3538명
알림수신 174명
제한없는 언어모델을 위한 채널
일반
LogicKor 리더보드 오픈
추천
25
비추천
0
댓글
33
조회수
2001
작성일
수정일
댓글
[33]
글쓰기
쿠루가이
쿠루가이
호옹이
maywell
호옹이
ㅇㅇ
zzzzz5
ㅇㅇ
랜덤닉랜
ㅇㅇ (49.174)
삭제
수정
ㅇㅇ (49.172)
삭제
수정
maywell
ㅇㅇ (141.223)
삭제
수정
maywell
maywell
철권짱
하나악
ㅇㅇ (222.236)
삭제
수정
maywell
떡붕어망코
맥북에어좋아
포리X
ㅇㅇ (211.234)
삭제
수정
maywell
ㅇㅇ (223.38)
삭제
수정
wickout
maywell
ㅇㅇ (61.74)
삭제
수정
AI타임스
[4월 1주] 한국어 모델 성능 70점 돌파...”성능 향상 급속화”
한국어 언어모델의 성능이 비약적으로 향상하고 있다. 지난달 9일 60점을 처음 넘긴 데 이어, 한달도 안 돼 70점까지 넘어섰다.1일 현재 오픈 Ko-LLM 리더보드에서는 소속 미상 개발자의 모델(hwkwon/S-SOLAR-10.7B-v1.5, 70.35)이 평균 70.35점으로 1위에 오르며 신기록을 세웠다.이어 2위에는 3월 4주차에 1위를 차지했던 티쓰리큐(대표 박병훈)가 자리했다. 2위 모델(chihoonlee10/T3Q-ko-solar-dpo-v5.0, 70.3) 역시 70점을 넘었다. 1~2위 간 점수 차이는 0.05점에
maywell
ㅇㅇ (210.123)
삭제
수정
maywell
ㅇㅇ (210.123)
삭제
수정
maywell
최근
최근 방문 채널
최근 방문 채널
번호
제목
작성일
조회수
추천
공지
아카라이브 모바일 앱 이용 안내(iOS/Android)
31496536
공지
Ai 언어모델 로컬 채널 이용규정
6295
공지
뉴비에게 도움 되는 글 모음
28633
공지
언어모델 관련 정보취득 /무료체험 가능 사이트
9506
공지
여러분의 학습에 도움을 줄 수 있는 하드웨어 지원
5494
공지
신문고
2367
숨겨진 공지 펼치기(1개)
1602
일반
llama3 8b 아이폰에서 로컬로 돌리는거 신기하네요
[4]
942
4
1601
일반
허깅페이스 15T 데이터셋 공개ㄷㄷ
[20]
1505
12
1600
일반
님들 70B 정도 되는 모델 로컬에서 돌릴려면 4090 몇개 정도 있으면 될까요?
[7]
1000
0
1599
일반
llama-70B 이새끼 뭐임? ㄷㄷㄷ
[6]
1391
7
1598
일반
Oobabooga, 자신만의 벤치마크 발표
[4]
651
8
1597
일반
chat 모델에 completion(raw) 데이터를 어떻게 학습 할 수 있을까?
[16]
1503
28
1596
일반
llama3 70b instruct하고 claude3 opus 같은질문에 대한 답변 비교
[1]
613
5
1595
일반
llama3 학습을 위해 llama2를 이용해서 데이타셋 정제를 한거 같네요
[5]
742
6
1594
일반
효율적인 무한 컨텍스트 변환기(비공식)
[4]
979
12
1593
일반
개인적으로 생각하는 추가 학습 아이디어
[1]
467
0
1592
일반
chatbot arena에서 카타고리 english로 바꾸니 llama3 성능이 말이 안되는데요
[4]
484
7
1591
일반
llama-3 찍먹 가능한 곳 추천
[5]
904
5
1590
일반
트위터) chatbot-arena 근황
[3]
609
7
1589
일반
역댁꿉! 라마3 8B 의 무서움 (소오~름)
[5]
1129
-2
1588
일반
llama3 8b 모델이 llama2 70b 모델 성능에 근접하네요
[11]
813
2
1587
일반
Llama-3-Instruct exllamav2 EOS 미작동 문제 응급조치 방법?
[3]
320
5
1586
일반
Llama3 400b benchmark
[1]
446
2
1585
일반
예측 성공!
[1]
487
4
1584
일반
챈섭 오픈 Llama-3-70B-exl2_5.0bpw / Llama-3-8B-hf-exl2-6bpw (종료)
[23]
1272
12
1583
일반
llama3 에 대한 상상
[7]
867
7