https://colab.research.google.com/drive/1N6TuLGT70WKkB08JcCC5_S3EJJYmZHV5?usp=sharing#scrollTo=chc8ubQiISJx


ai음성은 RVC 학습, 추론만 해본 뉴비가 tts에도 관심이 생겨서 일단 이 코랩으로 해보려 하는데


만들고 싶은 캐릭터는 일본 게임 캐릭터라서 품질, 분량은 빵빵한데 데이터셋을 어떻게 만들어야 할지 모르겠음


한 음성당 몇 초 길이로 하면 적당한지, 대본 적을 때 히라가나로만 적어야 하는지, 데이터셋 형식을 어떻게 해야 하는지 모르겠는데


혹시 도움 주실 수 있을까요..