프로그램 따라 케바케. VITS같은 TTS는 보통 2~15초 처럼 문장 한 두개 단위로 쪼개야 하고, Diffusion-svc나 So-VITS-svc 같은 음성변환 계열도 쪼개야 하긴 하는데 얘네들은 문장단위로 나눌 필요가 없는 경우도 있어서 RVC같이 한 뭉텅이로 넣어도 자체 자르기 처리하는 경우도 있음
다만 RVC에 1시간 통째로 넣으면 자르기 안되는 버그가 있어서 RVC 학습이면 30분/30분 잘라서 사용하는 걸 추천
근데 배경음 없애고 말 안 하는 구간 지워버리면 1시간까진 아닐껄