참조용 깃주소 https://github.com/svc-develop-team/so-vits-svc
질문1. 말끔한 음성 데이터셋 약 5천개 가량 약 6만스탭을 so vits svc 4.0 으로 학습해서 추론을 진행하는데, 전반적으로 멀쩡한데 특정음에서 깨짐? 일그러진 음성이 들어가는 경우엔 어떤걸 해결해야 되는지 질문

1. 추론용 원본은 배경음이 제거된 가사(음정포함) wav 이게 문제다
 ㄴ 이건 가우디랩으로 분리해서 사용함
2. 고음/저음부 샘플이 모자란거다
3. 학습수가 충분하지 못하다
4. 학습용 svc가 문제가있다

질문2. 지금 사용하는 so vits svc 4.0 에 클러스터 학습이란게 있던데 어떤용도로 사용하고 학습방법 안내된게 있을까요? 해당 깃에 설명을 봐도 어느때 사용해야 이점이 있는지 이해가 안가네요.