안녕하세요. AI번역기 도다리 개발자입니다.

지난번에 무제한 tts를 모두가 사용하기 쉽게 하는 개발을 진행할지 이곳에 문의드렸는데요. 

당시에 샘플로 들려들었는 openVoice의 경우 품질이 좋지 않다는 평을 들어서요.


다시 이것저것 테스트하면서 알아보던 중 xtts라는 걸 발견하였고 음성을 만들어 보았습니다.



모두가 아주 짧은 1,2분 내외의 음성으로 훈련하였고 어떠한 후처리도 하지 않았는데요.

저한테는 꽤 괜찮게 들리는데, 어떠신가요?


그리고 마지막은 finetunning 3분을 더 한 버전인데요. 기계음은 좀 섞였어도 훨씬 더 자연스러워진 기분인데요.


어떠신지 의견 좀 부탁드립니다. 채팅 tts에도 도움이 되도록 개발하겠습니다.

(품질에 대한 평가가 괜찮다면 이걸로 개발을 진행해볼까 합니다. 당연히 깃헙에 소스코드도 공개하고요)