GPU에서 정수연산기와 실수 연산기는 독립적으로 동작하잖아요? 

그런데 양자화된 모델이 가중치를 정수값으로 갖는경우 추론시에 실수연산기는 거의 안쓰나요? 

그렇다면 GPU에서 실수연산기가 차지하는 면적이 더 클텐데 뭔가 아쉬울거 같습니다. 

가중치가 정수일 경우에는 계산 할때만이라도 일부 가중치를 실수로 변경해서 실수 연산기를 쓸 수 있으면 좋을거 같은데 말이죠... 음... 데이터 타입 변경하는 오버헤드가 더 크려나요?