exllamav2로
rem : 26gb
gpu : rtx3090
환경에서 2.55bit로 양자화 하는 중입니다만
그..
혹시 2.55bit로 양자화 해도 일반적으로 사용이 가능할 정도로 동작할까요?
exllamav2에 llama2 70b 모델을 했던 benchmark가 있어서 해보려고 하는데요.
exllamav2로
rem : 26gb
gpu : rtx3090
환경에서 2.55bit로 양자화 하는 중입니다만
그..
혹시 2.55bit로 양자화 해도 일반적으로 사용이 가능할 정도로 동작할까요?
exllamav2에 llama2 70b 모델을 했던 benchmark가 있어서 해보려고 하는데요.