노래 파일 44개이고 길이는 1시간 50분쯤 된다고 함
근데 1에포크 학습이 35초 만에 끝남??
배치 사이즈도 32였음
글카는 4060ti 16gb
로그 폴더에서 학습 데이터 로딩된 걸로 추정되는 폴더도 열어봤는데
앞글자가 번호라고 생각하면 42(0부터 시작)이라 하나만 차이나고 잘 처리된 것 같음
원래 rvc는 학습 속도가 빠른 거임?
여기서 데이터셋이 크면 학습이 느려진단 뉘앙스의 글을 봤는데
난 배치사이즈도 최대인 32로 먹였고 파일도 많은데 여전히 빠른 거 같아서 이상함
로스율도 첨부함
소리 들어보니까 목소리는 비슷해서 학습은 잘 된 거 같음
근데 데이터가 많은데도 고음-저음 전환에서 목소리가 완전 튀길래
속도 빠른 거랑 관련이 있는 건가 해서 물어봄
그리고 이건 두 번째 질문인데 지금 3500쯤에서 과적합 된 거 맞지?
여기서 더 학습은 안해도 되려나