추론에 관해서 질문 - AI 음성 채널

AI 음성 채널

알림 알림 중 알림 취소

구독자 5628명 알림수신 131명 @The_Voice

TTS, VITS, SVC와 같은 딥러닝 음성 합성 기술 관련 정보와 이야기를 공유합니다.

❓질문 추론에 관해서 질문

Nark

추천 0 비추천 0 댓글 2 조회수 566 작성일 2023-03-14 04:26:01

⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다.

https://arca.live/b/aispeech/71775062

참조용 깃주소 https://github.com/svc-develop-team/so-vits-svc
질문1. 말끔한 음성 데이터셋 약 5천개 가량 약 6만스탭을 so vits svc 4.0 으로 학습해서 추론을 진행하는데, 전반적으로 멀쩡한데 특정음에서 깨짐? 일그러진 음성이 들어가는 경우엔 어떤걸 해결해야 되는지 질문

1. 추론용 원본은 배경음이 제거된 가사(음정포함) wav 이게 문제다
ㄴ 이건 가우디랩으로 분리해서 사용함
2. 고음/저음부 샘플이 모자란거다
3. 학습수가 충분하지 못하다
4. 학습용 svc가 문제가있다

질문2. 지금 사용하는 so vits svc 4.0 에 클러스터 학습이란게 있던데 어떤용도로 사용하고 학습방법 안내된게 있을까요? 해당 깃에 설명을 봐도 어느때 사용해야 이점이 있는지 이해가 안가네요.

댓글 [2]

2023-03-14 05:00:47

https://mega.nz/folder/EdNzzDQY#PgiSB55lQHg_p3eZO7DMGQ 이걸로 한번 추론해봐. https://arca.live/b/aiart/70581126 이 글에서 테스트할 때 쓴 보컬임. 이걸로 추론했을 때도 이상하면 결과적으로 모델의 문제라고 볼 수 있음. 모델의 문제가 곧 데이터셋의 문제라고 바로 결론지을 수 없는게, 아직 4.0에서는 사전학습모델이 없어서 사전학습모델을 쓴 3.0보다 결과가 별로더라.

17.94 MB folder on MEGA

이걸로 한번 추론해봐. https://arca.live/b/aiart/70581126 이 글에서 테스트할 때 쓴 보컬임. 이걸로 추론했을 때도 이상하면 결과적으로 모델의 문제라고 볼 수 있음. 모델의 문제가 곧 데이터셋의 문제라고 바로 결론지을 수 없는게, 아직 4.0에서는 사전학습모델이 없어서 사전학습모델을 쓴 3.0보다 결과가 별로더라.

펼쳐보기▼

Nark

2023-03-14 06:25:33

*수정됨

고맙읍니다
+ 수정 확실히 보내준 추론 샘플은 깨지는게 없긴하네요

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 📄정보 💾자료 ❓질문 ❗공지 🔨운영

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 31293088

공지 ★필독★ AI 음성 채널 기본 통합 공지 (23-06-12)

ㅇㅇ 2023.03.06 25886

공지 ★필독★ 음성모델 공유 관련 규정 (23-06-14)

The_Voice 2023.06.13 16209

공지 AI 음성챈을 처음 방문한 히치하이커를 위한 안내서 (23-07-01)

Tacotron2 2023.06.07 45472

공지 채널 내에서 "AI 성우" 라는 용어 사용을 자제해주길 바람.

ㅇㅇ 2023.03.06 9451

공지 음성 채널 신문고

ㅇㅇ 2023.03.06 2567

공지 채널 홍보용 광고 패널

패챤 2023.04.01 1887

공지 국내 가수 및 스트리머, 성우를 활용한 창작물은 업로드 금지임

무명의개념 2023.07.04 4571

숨겨진 공지 펼치기(3개)

22 일반 고음 몇포인트 안나오는건 그냥 보컬추출한걸

123asdas21345 2023.06.04 136 0

21 ❓질문 혹시 so-vits는 fmax 어디서 수정함? [1]

1q2w 2023.06.02 109 0

20 일반 와 음역대 개높은노래는 ㄹㅇ 커버힘드네 ㅋㅋ

123asdas21345 2023.06.01 262 0

19 📄정보 rvc v2 자동백업 코랩

aat 2023.05.31 492 3

18 일반 대충하기에 진짜 개좋은건 rvc인듯

캘렛 2023.05.30 627 0

17 ❓질문 DDSP가 어쨰 고음 지르는 부분에서 삑사리 내는데 뭐가 문제일까 [5]

1q2w 2023.05.29 293 0

16 📄정보 RVC 피치 조정 팁 [6]

aat 2023.05.22 1221 1

15 일반 구르는돌->쿠기밍 목소리로. DDSP로 하니까 깨끗하게 나오네 [12]

최애의AI 2023.05.21 587 2

14 💾자료 깨끗한 파일에다 입혀봤는데도 역시 좀 불안함 [7]

최애의AI 2023.05.20 1298 1

13 ❓질문 목소리 갈라지는거 어떻게 보정 못하나

ㅇㅇ 2023.05.18 273 0

12 일반 지난번에 한국어 SVC 데이터셋 오픈소스로 만들어보겠다고 한 챈럼인데 [2]

nrr 2023.05.11 1187 12

11 일반 혼자 독학하다 지금 하고있는거.. [6]

이름없어진놈 2023.04.26 1038 0

10 일반 lora 이거 물건이네 ㄹㅇ

Shrimp 2023.04.20 612 0

9 ❓질문 ddsp 찍먹 후 질문 [2]

purplepopcorn 2023.04.17 487 0

8 📄정보 DDSP-SVC 사용법 A to Z [90]

dbsqeen 2023.04.15 28884 19

7 ❓질문 diff-svc 학습 데이터/결과물 질문

kikikiki 2023.04.06 511 0

전체글 개념글