제 경우 rvc로 추론을 하면 절대 처음부터 끝까지 발음이나 음질이 잘나오지 않습니다. 그래서저는 hatvest, crepe, pm 방식으로 각각뽑아서 3개를 뽑고 원곡을 다른가수가 부른 커버송도 2개정도 더 추론해서 총 10개정도 추론을 뽑습니다. 그다음 이거를 각각 구절을 일일히 귀로 들으면서 10개중 가장 음질이나 발음이 정확한 버전만 잘라서 이어붙이기 합니다. 가사 모든 문장을 이렇게하는데 그러면 약 7~10시간정도 걸립니다. 근데 이렇게 하는게 맞나요? 너무 오래걸리는거 같고 원래 이렇게 일일히 이어붙이기 하는게 아니라 한큐에 정확하게 뽑아져야되는건지 궁금합니다.