노래 파일 44개이고 길이는 1시간 50분쯤 된다고 함

근데 1에포크 학습이 35초 만에 끝남??

배치 사이즈도 32였음

글카는 4060ti 16gb



로그 폴더에서 학습 데이터 로딩된 걸로 추정되는 폴더도 열어봤는데

앞글자가 번호라고 생각하면 42(0부터 시작)이라 하나만 차이나고 잘 처리된 것 같음


원래 rvc는 학습 속도가 빠른 거임?

여기서 데이터셋이 크면 학습이 느려진단 뉘앙스의 글을 봤는데

난 배치사이즈도 최대인 32로 먹였고 파일도 많은데 여전히 빠른 거 같아서 이상함


로스율도 첨부함

소리 들어보니까 목소리는 비슷해서 학습은 잘 된 거 같음

근데 데이터가 많은데도 고음-저음 전환에서 목소리가 완전 튀길래

속도 빠른 거랑 관련이 있는 건가 해서 물어봄


그리고 이건 두 번째 질문인데 지금 3500쯤에서 과적합 된 거 맞지?

여기서 더 학습은 안해도 되려나