개념글 모음

https://huggingface.co/microsoft/Phi-3-medium-128k-instruct

small은 7B에 컨텍스트 8k/128k

medium은 14B에 컨텍스트 4k/128k

학습은 전부 4.8T 토큰 정도 했다네요