라마3를 온디바이스 (스마트폰)에서 돌려보고 싶은데, 얼마나 양자화를 해야할까요?

아이폰은 mlx 라는걸 사용해서 돌려보는 것 같은데, 안드로이드에서는 어떻게 해야할지 감이 안오네요.


관련한 지식을 알고 계신분들은 키워드만이라도 알려주시면 감사하겠습니다.


https://twitter.com/awnihannun/status/1781062696835912155