내가 가진 보컬 드라이 파일 약 10분 정도 분량으로
3000 epochs 정도 돌려서 써봤는데
다른데는 다 좋은데 일정이상 음정으로 올라가면 소리가 깨짐
이건 원 데이터셋에서 가수가 높게 부른 부분이 없어서 당연한 결과일거라고 생각했는데
같은 노래를 ai hub에서 받은 아리아나 그란데 모델로 돌리니까 깨지지 않고 시원하게 지르는 느낌이 나는데
이건 왜 그런거지??
문제의 음이 3옥타브 솔 정도인데 아리아나 그란데 데이터 셋도 3옥타브 솔까지 나오는 음은 없을걸로 알거든...
번외로 내가 학습시킨 모델 인덱스는 70메가인데 아리아나 그란데 모델 인덱스 파일은 758메가나 됨,
왜 이렇게 많이 차이가 나는지 아는 분?