평범하게 잡담하는 방송을 데이터셋으로 쓸때 파일을 분할해야하나요? - AI 음성 채널

AI 음성 채널

알림 알림 중 알림 취소

구독자 5607명 알림수신 131명 @The_Voice

TTS, VITS, SVC와 같은 딥러닝 음성 합성 기술 관련 정보와 이야기를 공유합니다.

❓질문 평범하게 잡담하는 방송을 데이터셋으로 쓸때 파일을 분할해야하나요?

하트제로겟서

추천 0 비추천 0 댓글 2 조회수 192 작성일 2024-04-16 09:09:58

⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다.

https://arca.live/b/aispeech/103784320

1시간정도 잡담하는 방송이 있다치고 이걸 데이터셋으로 쓸려면 그냥 1시간짜리 파일 하나를 데이터로 쓰나요?

아니면 그 파일을 10분이든 5분이든 쪼개서 파일 여러개를 만들어서 쓰나요?

댓글 [2]

PPAP

2024-04-16 11:45:30

프로그램 따라 케바케. VITS같은 TTS는 보통 2~15초 처럼 문장 한 두개 단위로 쪼개야 하고, Diffusion-svc나 So-VITS-svc 같은 음성변환 계열도 쪼개야 하긴 하는데 얘네들은 문장단위로 나눌 필요가 없는 경우도 있어서 RVC같이 한 뭉텅이로 넣어도 자체 자르기 처리하는 경우도 있음
다만 RVC에 1시간 통째로 넣으면 자르기 안되는 버그가 있어서 RVC 학습이면 30분/30분 잘라서 사용하는 걸 추천
근데 배경음 없애고 말 안 하는 구간 지워버리면 1시간까진 아닐껄

펼쳐보기▼

하트제로겟서

2024-04-16 14:25:08

ㄳㄳ rvc 쓰니까 쪼개서 써야겠네요

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 📄정보 💾자료 ❓질문 ❗공지 🔨운영

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30877154

공지 ★필독★ AI 음성 채널 기본 통합 공지 (23-06-12)

ㅇㅇ 2023.03.06 25744

공지 ★필독★ 음성모델 공유 관련 규정 (23-06-14)

The_Voice 2023.06.13 16041

공지 AI 음성챈을 처음 방문한 히치하이커를 위한 안내서 (23-07-01)

Tacotron2 2023.06.07 45202

공지 채널 내에서 "AI 성우" 라는 용어 사용을 자제해주길 바람.

ㅇㅇ 2023.03.06 9374

공지 음성 채널 신문고

ㅇㅇ 2023.03.06 2545

공지 채널 홍보용 광고 패널

패챤 2023.04.01 1870

공지 국내 가수 및 스트리머, 성우를 활용한 창작물은 업로드 금지임

무명의개념 2023.07.04 4495

숨겨진 공지 펼치기(3개)

5285 ❓질문 open voice로 만든 tts음성인데요 [4]

wk 2024.05.08 487 0

5284 일반 2. 초보자를 위한 모델 붕괴 & 일반화 실패 이야기 [4]

DeepWeb 2024.05.07 749 15

5283 ❓질문 uvr denosie 사용하시는분들 수치 어느정도로 사용하시나요?

qw2r 2024.05.07 87 0

5282 ❓질문 고퀄리티 데이터셋의 기준이 뭐임? [7]

돌대갈희 2024.05.07 259 0

5281 ❓질문 공지보면서 공부중인데 요건 좀 고전자료야? [2]

ㅇㅇ 2024.05.07 292 0

5280 ❓질문 스트리머 tts랑 ai cover만들려고 들어왔는데 요즘 제일 좋은 방식이 뭔가요?

Lulu 2024.05.07 433 0

5279 ❓질문 open voice 사용하시는 분 계신가요? [4]

wk 2024.05.07 282 0

5278 ❓질문 보이스체인저 타입 DDSP-SVC [2]

Nna912105 2024.05.07 293 0

5277 ❓질문 데이터셋은 많으면 많을수록 좋은거임? 아니면 [3]

돌대갈희 2024.05.06 284 0

5276 ❓질문 Validation이 정확히 무엇이고 이거를 어떻게 넣는지 말해주실수 있나요? [2]

선무공신 2024.05.06 207 0

5275 ❓질문 혹시 RVC 모델을 임포트해서 쓸 수 있는 디스코드 TTS봇이 있을까 [2]

magicalrgm 2024.05.06 218 0

5274 ❓질문 더블링은 제거가 힘듦? [2]

선풍기가돌아가요 2024.05.06 197 0

5273 ❓질문 train 데이터를 여러 사람의 보이스를 사용하였을 때 [2]

감도 2024.05.05 206 0

5272 일반 1. 초보를 위한 TensorBoard 그래프를 보는방법~! [10]

DeepWeb 2024.05.04 1436 30

5271 ❓질문 ai커버 처음만들어볼려고하는데 [2]

깨무 2024.05.04 353 0

5270 ❓질문 17분짜리 적용하는데 보통 얼마나 걸림? [1]

야아두미 2024.05.03 200 0

5269 ❓질문 코랩 rvc 사전학습모델 기본이 f0인가요? [1]

Shuffle 2024.05.03 172 0

5268 일반 코랩 TPU v2로 학습시켜본분? [2]

선풍기가돌아가요 2024.05.03 169 0

전체글 개념글