신경망의 값을 양자화하는 것과 연산을 양자화 하는 것의 차이? 양자화 두 기법 - 1. 실수만 모으기 (S) 2. 비트시프팅 (S shifting & downscaling)1. 100% 정수연산 양자화의 필요성온디바이스 AI의 필요성 - 네트워크(클라우드)가 끊겨도 돌아가야하는 현장 (의료, 제조 등) 에서 필수적.이러한 온디바이스 AI를 위해서 - 경량화가 필요.그러한 경량화를 위해 -> 100% 정수연산 양자화 필요. AI 가속기는 신경망 연산에 특화, 정수 연산만 지원하거나 정수 연산에서 효율적으로 동작.(Coral Edge TPU, ARM NPU 시리즈) - 1. 일반적 양자화 : r이라는 실수 값을 q라는 정수로 표현하고 싶다-> 무한한 실수를 모두 나타내는 것은 불가능하니 유한한 관심 범위(r..