저번에 질문글을 통해 잘 도와준 넷상 친구덕에 잘 돌려봤는데

발라드 여가수의 노래를 inst 지우고 보컬만 남겨서 몇곡으로 러닝 해봤는데

4만 6만 step도 gt와 wav 비교해보니 거의 똑같을 정도였음

그래서 결과물을 뽑아봤는데 영 아니더라

그래서 다시 10시간넘게 돌려서 16만step정도 왔는데 

이래도 이상하더라

언어가 바뀌거나 해도 잘 된다는걸 봤는데

약간의 영어와 일본노래는 거의 깨지는듯 싶고

심지어 남자노래 (남자 보컬)로 돌리면 다깨짐 하나도 안들린다 ㅋㅋㅋ

내 생각엔 보컬만 남겨도 보컬이 에코같은게 좀씩 섞여서 그런거같단 생각임..

결론은 다들 말하는거처럼 데이터셋 소스가 가장 중요한게 아닌가 싶다.

전자기기 리뷰어 행님의 목소리도 학습해봤는데 

이분은 진짜 깔끔하게 목소리의 음성만 있어서 나름 선방 했는데

고음이 없는 똑같은 음의 목소리라 학습후 결과물 뽑으면

고음부가 다깨짐 ㅋㅋ

고음과 저음 그리고 깔끔한 음성이 필요한데 이게 참 어렵다

나중에 데이터셋 만들기 그나마 쉬운사람 발견하면 다시 시도해보긴 할거고


가족들 목소리도 많이 남겨놓으면 좋겠단 생각을 했음

갑자기 가족을 잃는다면 이걸 통해서라도 위로를 얻을 수 있지 않을까 라는 생각


좋게 쓰면 정말 좋은 기술이고 나쁘게 쓰면 정말 나쁜 기술이지 




아 그리고 시발... 베러 댄 예스터데이만 돌리면 쿠다 메모리 초과뜬다 ㅋㅋㅋ 15기가정도 필요하다고 지랄남

ㅅㅂ것... 다른건 잘되는데 

곡 자체가 좀 길어서 그런건가 싶네 원본이 flac이기도했고