1시간정도 잡담하는 방송이 있다치고 이걸 데이터셋으로 쓸려면 그냥 1시간짜리 파일 하나를 데이터로 쓰나요?

아니면 그 파일을 10분이든 5분이든 쪼개서 파일 여러개를 만들어서 쓰나요?