Gradio로만 일단 보컬 에코까지 제거해서 추출했는데 UVR로 데이터셋 만드는게 Gradio로 만드는거보다 더 음성 품질이 좋음?

둘이 비슷비슷하면 그냥 지금 있는거 그대로쓰고 아니면 UVR로 다시 만드려고함