노래로 학습시킨 모델이 랩할땐 대사로 만든 모델보다 약할 수 있을거같다는 가정 - AI 음성 채널

AI 음성 채널

알림 알림 중 알림 취소

구독자 5611명 알림수신 131명 @The_Voice

TTS, VITS, SVC와 같은 딥러닝 음성 합성 기술 관련 정보와 이야기를 공유합니다.

일반 노래로 학습시킨 모델이 랩할땐 대사로 만든 모델보다 약할 수 있을거같다는 가정

미사키메이무메이

추천 0 비추천 0 댓글 5 조회수 232 작성일 2024-04-18 01:57:12 수정일 2024-04-18 02:05:38

https://arca.live/b/aispeech/103918381

본인은 일단 노래 커버가 주목적이라서 최근엔 대사로 모델 만든적이 없는데

내가 만든 모델 기준으로 랩할때 굉장히 약함. 랩할때 발음 사이사이마다 sh 소리.. 이걸 치찰음이라고 하나? 이게 일반 노래보다 더 많이 두드러짐. 당연히 발음이 자주 바뀌니깐..

근데 보통 게임 대사로 만든 모델들.. 예를들면 블루아카 같은건 노래가 없으니 당연 대사로 학습시킨 애들일텐데

얘네들은 랩 되게 잘하더라고.. 이 부분에 대해서 나도 비교 실험을 해볼 예정이지만 혹시 양쪽 모델에 대해 학습해서 비교를 해본 사람 있으면 의견좀 부탁함. 추측도 환영

댓글 [5]

증말할거업는넘

2024-04-18 02:18:35

개인적인 의견인데 보통 게임 대사로 만든 모델들은 소리가 대부분 뭉퉁?하다해야하나 치찰음이 잘 안끼는거같음 
사람들이 노래부를때와 일반적으로 말할때 발음의 세기가 다르듯이
편하게 말한 데이터를 학습시키니까 그만큼 편하게 나오는거 아닌가 싶음

펼쳐보기▼

증말할거업는넘

2024-04-18 02:20:29

이거 뭐 말을 어캐해야할지를 모르겠어서 좀 두서없네 쨋든 개인적으로 게임 대사로 만든 모델은 치찰음이 잘 안낌 다른 모델에 비해서 경험상

펼쳐보기▼

미사키메이무메이

2024-04-18 04:35:20

좋은정보 ㄳㄳ 확실히 대사로 만든 모델이 편하게 말하는 느낌 동의함

펼쳐보기▼

에반게리온

2024-04-18 13:19:29

내생각에는 노래데이터+대사데이터 만들면 어떻게될지 궁금하긴함

펼쳐보기▼

미사키메이무메이

2024-04-19 00:27:20

초기에 한번 해본적있는데 난 대사로 학습한 모델은 결국 노래할때 부자연스럽고 생각돼서 피했는데 이 상황에서라면 그냥 모델 두개 만들거같음. 문제는 같은 캐릭터인데도 대사모델이랑 보컬모델이 음색이 약간 차이가 있더라

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 📄정보 💾자료 ❓질문 ❗공지 🔨운영

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30896618

공지 ★필독★ AI 음성 채널 기본 통합 공지 (23-06-12)

ㅇㅇ 2023.03.06 25757

공지 ★필독★ 음성모델 공유 관련 규정 (23-06-14)

The_Voice 2023.06.13 16055

공지 AI 음성챈을 처음 방문한 히치하이커를 위한 안내서 (23-07-01)

Tacotron2 2023.06.07 45227

공지 채널 내에서 "AI 성우" 라는 용어 사용을 자제해주길 바람.

ㅇㅇ 2023.03.06 9381

공지 음성 채널 신문고

ㅇㅇ 2023.03.06 2546

공지 채널 홍보용 광고 패널

패챤 2023.04.01 1874

공지 국내 가수 및 스트리머, 성우를 활용한 창작물은 업로드 금지임

무명의개념 2023.07.04 4504

숨겨진 공지 펼치기(3개)

5286 일반 3. 초보자를 위한 Pre-Trained Model의 설명과 이해 [8]

DeepWeb 2024.05.08 921 14

5285 ❓질문 open voice로 만든 tts음성인데요 [4]

wk 2024.05.08 494 0

5284 일반 2. 초보자를 위한 모델 붕괴 & 일반화 실패 이야기 [4]

DeepWeb 2024.05.07 751 15

5283 ❓질문 uvr denosie 사용하시는분들 수치 어느정도로 사용하시나요?

qw2r 2024.05.07 87 0

5282 ❓질문 고퀄리티 데이터셋의 기준이 뭐임? [7]

돌대갈희 2024.05.07 260 0

5281 ❓질문 공지보면서 공부중인데 요건 좀 고전자료야? [2]

ㅇㅇ 2024.05.07 292 0

5280 ❓질문 스트리머 tts랑 ai cover만들려고 들어왔는데 요즘 제일 좋은 방식이 뭔가요?

Lulu 2024.05.07 435 0

5279 ❓질문 open voice 사용하시는 분 계신가요? [4]

wk 2024.05.07 286 0

5278 ❓질문 보이스체인저 타입 DDSP-SVC [2]

Nna912105 2024.05.07 293 0

5277 ❓질문 데이터셋은 많으면 많을수록 좋은거임? 아니면 [3]

돌대갈희 2024.05.06 284 0

5276 ❓질문 Validation이 정확히 무엇이고 이거를 어떻게 넣는지 말해주실수 있나요? [2]

선무공신 2024.05.06 207 0

5275 ❓질문 혹시 RVC 모델을 임포트해서 쓸 수 있는 디스코드 TTS봇이 있을까 [2]

magicalrgm 2024.05.06 218 0

5274 ❓질문 더블링은 제거가 힘듦? [2]

선풍기가돌아가요 2024.05.06 197 0

5273 ❓질문 train 데이터를 여러 사람의 보이스를 사용하였을 때 [2]

감도 2024.05.05 206 0

5272 일반 1. 초보를 위한 TensorBoard 그래프를 보는방법~! [10]

DeepWeb 2024.05.04 1442 30

5271 ❓질문 ai커버 처음만들어볼려고하는데 [2]

깨무 2024.05.04 353 0

5270 ❓질문 17분짜리 적용하는데 보통 얼마나 걸림? [1]

야아두미 2024.05.03 200 0

5269 ❓질문 코랩 rvc 사전학습모델 기본이 f0인가요? [1]

Shuffle 2024.05.03 172 0

전체글 개념글