exllamav2로

rem : 26gb

gpu : rtx3090 

환경에서 2.55bit로 양자화 하는 중입니다만

그..

혹시 2.55bit로 양자화 해도 일반적으로 사용이 가능할 정도로 동작할까요?

exllamav2에 llama2 70b 모델을 했던 benchmark가 있어서 해보려고 하는데요.