저도 magio 학습 rmvpe 추론 함. rmvpe가 지저분한 거 속에서 보컬을 잘 찾아내는걸로 아는데 이게 추론할땐 좋은데 학습할때는 별로 안좋을 거라고 예상하고 있음.. 그리고 crepe는 rmvpe랑 비교하면 상대적으로 그 반대고... crepe는 잡음에 되게 민감하다고 알고있음. 근데 여러가지 모델로 해봤는데도 결국 저거보단 추론 곡이 얼마나 깨끗하냐가 제일 중요한듯. 추론곡의 깨끗함이랑 비교하면 학습 모델 선택 영향은 되게 미미한거같음
저 같은 경우에는 이걸 best라고 봅니다.
학습 시 : harvest 또는 mangio-crepe
추론 시 : harvest 또는 fcpe
이렇게 쓰고있어요. rmvpe가 추론시 삑사리도 적고 고음도 잘 뽑는다는건 팩트입니다만, 음색이 상대적으로 덜 풍성하고 밋밋한 편이라서
발음이 조금 뭉게지고 초고음이 불안정하더라도 음색을 잘 살려내는 harvest랑 fcpe로 추론하고 있어요.