속도 나름 빠름.


RX 5700 XT으로

Width 512 | Height 1024 | 50 Sampling Rates

커널 수준의 CPU에서의 Group Normalization C++ 구현 보고 PyTorch 텐서 구현으로 옮김
방법은 자고 일어나서 올리겠습니다.