https://github.com/mustafaaljadery/gemma-2B-10M


메모리가 O(N) 즉 산술급수적으로 자라는게 핵심인거 같네요


써본 분 있으면 댓 달아주세요 🙃