llama-cpp-python /w cuda 윈도우로 안됨 - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3509명 알림수신 173명 @바바리맨

제한없는 언어모델을 위한 채널

일반 llama-cpp-python /w cuda 윈도우로 안됨

추천 0 비추천 0 댓글 9 조회수 463 작성일 2023-05-08 11:26:50

https://arca.live/b/alpaca/75867967

llama.cpp 을 아래쪽 스샷에 있는 dll을 통해서 사용하는데 직접 컴파일한 걸로 해보니까 cuda 넣고 컴파일 한 애들은 아예 에러 떠버리네

llama_orig.dll이 pip 설치할때 딸려오는 dll 인데 용량차이가 왜 생기는 건지 저것도 신기하네..

윈도우에서 쓰려면 llama_cpp.py 파일을 되게끔 수정하거나 wsl로 돌리는게 맞는 듯

댓글 [9] 글쓰기

2023-05-08 11:53:22 답글

저는 WSL에서도 안되고 있음; 그거 조금 빠르게 해 보겠다고 오만거 다 깔고 별짓을 다했는데 막상 시킨 거 다 따라했고 컴파일할 때 에러도 없었지만 여전히 llama-cpp-python은 cuBLAS를 지원해 주지 않네요. 뭔가 따로 파일을 옮기던가 해야 하는건가 싶기도 하고... 뭘 빼먹었는지 모르겠어요. 레포쪽 게시판에 됐다는 놈들은 파일 옮겨넣고, 열어서 수정하고, 별별 짓을 다 하던데 저는 무슨 소린지 알아듣지도 못하겠더라고요.ㅎㅎ

펼쳐보기▼

2023-05-08 12:08:46 답글

제 생각에는 llama.cpp 쪽 문제일거 같아 보여요. 저장소쪽 이슈에 됐다고 하는애들 링크 혹시 있나요?

펼쳐보기▼

2023-05-08 12:38:37 답글

https://github.com/abetlen/llama-cpp-python/issues/117
요 이슈에 Priestru라는 친구가 WSL에서는 성공했다고 하네요. 
윈도우에서는 아무리 지랄을 해도 아직 성과가 없는 것 같고...

cuBLAS with llama-cpp-python on Windows · Issue #117 · abetlen/llama-cpp-python

cuBLAS with llama-cpp-python on Windows. Well, it works on WSL for me as intended but no tricks of mine help me to make it work using llama.dll in Windows. I try it daily for the last week changing...

*수정됨

요 이슈에 Priestru라는 친구가 WSL에서는 성공했다고 하네요. 
윈도우에서는 아무리 지랄을 해도 아직 성과가 없는 것 같고...

펼쳐보기▼

2023-05-08 12:42:35 답글

근데 솔직히 저는 아직도 연결고리가 어떻게 되는지 모르겠어요. 
llama-cpp-python 이놈이 llama.cpp랑 파이썬 사이의 연결고리를 해주고, 
그 연결을 통해서 우바부가나 랭체인이나 이런 애들이 llama.cpp와 연계되는 것 같은데...
llama-cpp-python하고 llama.cpp 사이에 어떤 식으로 연계가 되는 건지...? 
지가 알아서 위치를 찾아내서 llama.cpp하고 연동하는 건지, 
아니면 그냥 ggml버전 모델만 지원하는 거고 llama.cpp랑 직접적인 연관은 없는 건지...
혹시 아시면 설명 좀 부탁드립니당. 초보자 눈높이로.ㅎㅎ

펼쳐보기▼

2023-05-08 12:52:32 답글

연계라는게 별건 아니고 llama.cpp 이랑 llama-cpp-python 사이에 llama_cpp 이라는 C 바인딩 인터페이스가 있어요.
저 인터페이스가 llama.cpp에 있는 ggml 사용하는 함수들만 감싸서 가져온다고 보시면 돼요.

펼쳐보기▼

2023-05-08 14:07:15 답글

아아 그렇군요. 설명 감사드려요. 문외한 입장에선 신기방기하네요. 그걸 어떻게 찾아서 가져온데;

펼쳐보기▼

2023-05-08 12:09:09 답글

나만 안되는게 아니었구나
cuBLAS 지원한다길래 신나서 삽질해보고 있었는데 ㅠ

펼쳐보기▼

2023-05-08 12:14:35 답글

cuda 저거 go 바인딩에 넣을 때 식겁했었는데 내꺼도 안됐으면 정신병 걸렸을듯 ㄷㄷ

펼쳐보기▼

2023-05-09 07:22:37 답글

https://arca.live/b/alpaca/75915904
저는 이 방법으로 윈도우에서 cuBLAS 켜는데 성공했어요. 
무식하게 한 거라 다른 분들에게도 효과가 있을지는 장담 못하지만 참고해 보세요.ㅎㅎ

펼쳐보기▼

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 31190169

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6242

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 28368

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 9379

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

바바리맨 2023.08.01 5428

공지 신문고

바바리맨 2023.04.18 2349

숨겨진 공지 펼치기(1개)

질문 어떻게 시작해야되나요 [1]

앙야겜띠 2023.05.09 155 0

질문 우바부가에서 이렇게 뜨면 현재 어떤 모델을 사용중인거야? [6]

ㅇㅇ (223.195) 2023.05.09 188 0

질문 peft와 lora 차이점 [2]

1234 (39.7) 2023.05.09 335 0

일반 WizardLM-7B-Uncensored의 제작자가 위협을 받고 있다고함 [8]

시큼한파인애플 2023.05.09 580 3

일반 우바부가 처음 설치를 위한 유툽 안내 [3]

쿠레레 (106.101) 2023.05.09 2376 1

질문 보통 cpp 실행할때 설정은 어떻게 하시나요 [2]

시큼한파인애플 2023.05.09 181 0

정보 주력모델을 소개해 봅시다 (링크추가) [17]

산정 2023.05.09 1240 13

일반 한글로 로컬 임베딩은 불가한건가..ㅠ [16]

웹러닝 2023.05.09 1186 0

질문 lora 파일의 ggml 변환

모찌파 2023.05.08 406 0

질문 로컬 모델의 컨텍스트 길이와 띄어쓰기 [2]

모찌파 2023.05.08 221 0

일반 혹시 여러분 프로젝트 활동 관심 있으십니까 [28]

사과는맛있어맛있으면바나나 2023.05.08 726 2

일반 llama-cpp-python /w cuda 윈도우로 안됨 [9]

꿈돌리 2023.05.08 464 0

일반 이 질문에 제대로 답하는 모델이 안보이네 [9]

kukukaka 2023.05.08 552 1

공지 이 채널에 대해 알게 된 경로나 다른 커뮤니티에 대해 알려주세요 [28]

hkhk 2023.05.08 645 3

질문 ggml하고 gptq 차이가 뭐야?? [6]

ㅇㅇ (223.195) 2023.05.08 1643 0

질문 koalpaca [3]

1234 (118.235) 2023.05.08 445 0

일반 pc 어떻게 구성하고 사용하시나요? [7]

웹러닝 2023.05.08 294 0

일반 이렇게 나오면 되는거임? [12]

꿈돌리 2023.05.08 343 1

질문 ggml fp16 format이 뭔지 설명해주실 분.! [13]

haiyy (1.225) 2023.05.08 1078 0

전체글 개념글