내가 가진 보컬 드라이 파일 약 10분 정도 분량으로

3000 epochs 정도 돌려서 써봤는데

다른데는 다 좋은데 일정이상 음정으로 올라가면 소리가 깨짐


이건 원 데이터셋에서 가수가 높게 부른 부분이 없어서 당연한 결과일거라고 생각했는데


같은 노래를 ai hub에서 받은 아리아나 그란데 모델로 돌리니까 깨지지 않고 시원하게 지르는 느낌이 나는데

이건 왜 그런거지??

문제의 음이 3옥타브 솔 정도인데 아리아나 그란데 데이터 셋도 3옥타브 솔까지 나오는 음은 없을걸로 알거든...



번외로 내가 학습시킨 모델 인덱스는 70메가인데 아리아나 그란데 모델 인덱스 파일은 758메가나 됨,

왜 이렇게 많이 차이가 나는지 아는 분?