내가 독특하지 않은 목소리로 학습을 저품질로 시키고 에포크도 적게했더니 정말 목소리가 갸우뚱 할 수밖에 없는 목소리가 나왔음 반면에 비교적 고품질에 에포크도 높고 독특한 목소리로 하니깐 정말 좋은 목소리가 나왔음


결국 품질,에포크 수,독특한 목소리가 중요한듯 데이터셋 길이는 그 다음 영역이고...