UVR5 베타 업데이트 및 MDX23C 사용하는법

AI 음성 채널

알림 알림 중 알림 취소

구독자 5556명 알림수신 129명 @The_Voice

TTS, VITS, SVC와 같은 딥러닝 음성 합성 기술 관련 정보와 이야기를 공유합니다.

📄정보 UVR5 베타 업데이트 및 MDX23C 사용하는법

Still_Kids

추천 13 비추천 0 댓글 20 조회수 4175 작성일 2023-08-15 08:14:47 수정일 2023-08-15 08:55:14

https://arca.live/b/aispeech/83827109

베타 업데이트로 UVR5에서도 MDX23C 모델이 사용 가능해졌는데 생각보다 모르는 사람들이 많은 거 같아서 공유함

https://github.com/TRvlvr/model_repo/releases/download/uvr_update_patches/UVR_Patch_7_11_23_20_51_BETA.exe
UVR5 베타로 업데이트하고

https://github.com/TRvlvr/model_repo/releases/download/all_public_uvr_models/MDX23C_D1581.ckpt
모델 다운받아서 MDX_Net_Models 폴더에 넣으면 됨

단 풀밴드 모델이 아니며 풀밴드 모델은 몇 달 내에 출시 예정이라 함

그래서 난 이 모델만 단독으로 사용하지 말고 Ensemble 조합으로 쓰는 걸 권장함

실제로 단독으로 사용했을 때보다 voc ft, Inst HQ3 등 다른 모델과 조합했을 때 보컬 SDR이 높은 걸 볼 수 있음

https://mvsep.com/quality_checker/entry/4420

https://mvsep.com/quality_checker/multisong_leaderboard?sort=vocals

그리고 UVR5 베타버전 내부에 새로운 옵션들이 생겼는데 이게 생각보다 중요함

개발자 피셜 SDR이 크게 증가한다고 함

각 옵션들의 자세한 설명은 이거 번역해서 읽어보면 이해될거임

Full ability to run the MDXNET23 models: You can find the models via the following links - mdx_AB, cdx, mdx_C - Please note, all you need are the checkpoints, that's it. You must change the model names in "mdx_C" from "ckpt" to model1.ckpt, model2.ckpt, & model3.ckpt. Also, we've trained some very good models on this network. We have yet to work out a release date for them, but we will keep you updated! The good news is this patch is 100% compatible with them.
Segmentation: The original MDX-NET code had its own built-in chunking mechanism in place since the beginning. This is why vocal chops persisted despite the introduction of batch mode a few months ago. Due to the use of onnx, I had to make some tweaks to add the ability to change the native segment/chunk size (the default has been 256). The previous method we used for chunking was essentially nesting the code's native chunks, leading to double chunking (and worse conversion results). Larger segment sizes lead to better results, higher SDR scores, and more RAM/V-RAM usage.
Overlap: This feature helps eliminate vocal chops, almost entirely, depending on your setting. Overlap works with the native chunking mechanism. I modeled it after Demucs' overlap feature. It increases the SDR by a lot!
Pitch-shift Conversion: You can now change the pitch of the input for conversion. Each whole number represents a semitone. For example, setting -2 is minus- 2 semitones, 0 is native pitch, and 2 is plus 2 semitones. Pitch shift is compatible with all the networks and models except VR Arch.
You can find more details on the rest of the changes in the change log within the GUI.

본인은 MDX23C, voc ft, Inst HQ3 3개 조합에
Segmentation 1760 Overlap 0.8 MDXNET23 Overlap 8 정도로 사용중임

마지막으로 에밀리아 아이돌 커버 듣고 가

댓글 [20]

3007

2023-08-15 08:23:00

개추

펼쳐보기▼

LeoNeed

2023-08-15 08:37:35

이거 하고 나온결과에 가라오케 돌리니까 더 괜찮은듯?

펼쳐보기▼

Still_Kids

2023-08-15 08:42:32

난 가라오케는 화음 분리용으로만 씀

펼쳐보기▼

aat

2023-08-15 08:54:17

이거 코랩가능한가

펼쳐보기▼

Still_Kids

2023-08-15 08:55:07

https://github.com/jarredou/MVSEP-MDX23-Colab_v2

GitHub

GitHub - jarredou/MVSEP-MDX23-Colab_v2: Colab adaptation of MVSep Model for MDX23 music separation contest

Colab adaptation of MVSep Model for MDX23 music separation contest - GitHub - jarredou/MVSEP-MDX23-Colab_v2: Colab adaptation of MVSep Model for MDX23 music separation contest

aat

2023-08-15 08:56:47

v2가 최신버전이었구나 v3이 최신인줄알았는데 답글 ㄳ 나는 근데 voc ft랑 차이를 못느끼겠음 ensemble로 해봐도

펼쳐보기▼

미사키메이무메이

2023-08-15 08:58:59

voc_ft 가 못지우는 특정 악기나 효과음들 있는데 모아놨다가 mdx23c가 그거 지울 수 있는지 테스트 해봐야겠네

펼쳐보기▼

로간

2023-08-15 10:20:55

KooKoo

2023-08-15 11:35:09

volii

2023-08-16 01:20:05

*수정됨

감사합니다
혹시 Segmentation 1760 Overlap 0.8 MDXNET23 Overlap 8 이 부분이 잘 이해가 안되는데 어떻게 설정하는지랑 얘네들 관련된 설명도 좀 해주실 수 있을까요?

펼쳐보기▼

Still_Kids

2023-08-16 04:27:44

본문에 영문이 저 옵션들 설명하는거임 번역해서 읽어보면 이해 가능

펼쳐보기▼

volii

2023-08-16 05:40:46

감사합니다!

펼쳐보기▼

diffsvc

2023-08-21 08:32:08

아 찾았습니다 감사합니다

펼쳐보기▼

diffsvc

2023-08-20 17:20:51

저도 궁금함 저 옵션들이 뭘 말하는지는 알겠는데 저 옵션 설정을 어디서 해야되나요?

펼쳐보기▼

이하비스

2023-08-16 06:07:39

페

2023-08-16 07:56:17

Hyun

2023-08-18 00:34:34

끼얏호

펼쳐보기▼

volii

2023-08-22 08:42:03

Pitch-shift Conversion 얘는 설정에서 0으로 두는게 맞는거죠??

펼쳐보기▼

Still_Kids

2023-08-22 13:09:35

네

펼쳐보기▼

하나님

2023-09-06 05:03:35

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 📄정보 💾자료 ❓질문 ❗공지 🔨운영

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 29402246

공지 ★필독★ AI 음성 채널 기본 통합 공지 (23-06-12)

ㅇㅇ 2023.03.06 25329

공지 ★필독★ 음성모델 공유 관련 규정 (23-06-14)

The_Voice 2023.06.13 15599

공지 AI 음성챈을 처음 방문한 히치하이커를 위한 안내서 (23-07-01)

Tacotron2 2023.06.07 44535

공지 채널 내에서 "AI 성우" 라는 용어 사용을 자제해주길 바람.

공지 국내 가수 및 스트리머, 성우를 활용한 창작물은 업로드 금지임

무명의개념 2023.07.04 4302

숨겨진 공지 펼치기(3개)

📄정보 [업데이트] mangio 포크 UI 변경, RVMPE+ 출시 [8]

aat 2023.08.15 2208 10

일반 ai 믹싱 마스터링에 대해 잘 아는사람없냐

aat 2023.08.15 220 0

일반 학습이랑 추론할때 파일 뭘로함

aat 2023.08.15 153 0

❓질문 1000step이랑 200000step이랑 결과물이 똑같음... [9]

illiliiil1 2023.08.15 274 0

❓질문 rvc 학습 처음해보는데 용량 이렇게 많이 먹는거 맞음? [5]

이퀘스트리아 2023.08.15 441 0

❓질문 vits kss 학습시 압축에 대한 질문 [19]

별빛 2023.08.15 393 0

📄정보 RVC에서 코러스 추론하고 믹싱할때 팁 [8]

Still_Kids 2023.08.15 1149 6

일반 요즘 뭐가 유행임? [1]

popop098 2023.08.15 296 0

❓질문 이건 어떤 오류인가요? ㅠ

임마기막 2023.08.15 70 0

❓질문 선생님들 혹시 노래 음성을 바꾸는거말고 tts 기능을 사용하는 방법아시는분있나요? [2]

zkzlmpok 2023.08.15 641 0

📄정보 UVR5 베타 업데이트 및 MDX23C 사용하는법 [20]

Still_Kids 2023.08.15 4176 13

❓질문 코랩 백업 폴더가 있는데 자꾸 따로 생성되요ㅠ

28664 2023.08.15 43 0

💾자료 VITS TTS 추론을 위한 webui 기능 개선판 v1.01 [10]

theAS 2023.08.15 3561 10

📄정보 RVC추론마다 결과물의 차이가 생기는 예시. [6]

shiro 2023.08.15 1247 2

❓질문 모델 용량이 다 똑같음... [4]

illiliiil1 2023.08.15 364 0

❓질문 이 에러는 도대체 뭘까요? [1]

asfdvaesfgw4 2023.08.15 122 0

❓질문 rvc crepe로 상업적 이용하는거 [1]

히카린 2023.08.15 361 0

❓질문 애저 tts로 노래만들려고하는데 방법이 있을까요? ㅠㅠ

몰라 2023.08.15 85 0

전체글 개념글