https://ar.snap.com/snapml-quantization-support


Lens Studio와 Spectacles에서 머신 러닝을 이용하여 강력한 AR 경험을 사용할 수 있어 제작자에게 다양한 컨텐츠를 만들 수 있습니다.

기기에서 ML 모델을 사용하는데에 있어서 제일 큰 문제점은 전력 소비입니다. 이를 최소화하기 위해서는 DSP에서 ML모델을 사용하는 것이 제일 좋은 솔루션입니다. 제일 전력 효율이 좋기 때문입니다.


지금까지 SnapML은 float모델을 지원했습니다. 한편, DSP에서 사용하기 위해서는 양자화를 지원하여야합니다. 그렇기 때문에 SnapML을 통한 양자화 지원이 도입됩니다.


제작자가 양자화된 모델을 사용하면 세가지 주요 이점이 있습니다.

  • 빠른 추론 속도
  • 작은 모델 크기
  • 향상된 전력 효율성


양자화는 고정 소수점 계산과 더 적은 메모리 대역폭 사용으로 인해 모델의 추론 속도를 향상시키는 동시에 모델 크기를 줄일 수 있습니다.


사용자가 모델을 양자화할 수 있도록 하는 Python 라이브러리로 구성된 Lens Studio의 훈련 후 양자화 파이프라인을 포함하도록 SnapM 프레임워크를 업데이트했습니다.


이 업데이트를 통해 SnapML은 이제 Tensorflow Lite 가져오기 도구에서 양자화된 모델을 지원합니다.


https://github.com/Snapchat/snapml-templates/blob/main/Quantization%20With%20TFLite/classification_and_quantization_with_tflite.ipynb