RVC 코랩 간단 사용법 - AI 음성 채널

AI 음성 채널

알림 알림 중 알림 취소

구독자 5586명 알림수신 129명 @The_Voice

TTS, VITS, SVC와 같은 딥러닝 음성 합성 기술 관련 정보와 이야기를 공유합니다.

📄정보 RVC 코랩 간단 사용법

PPAP

추천 17 비추천 0 댓글 109 조회수 20463 작성일 2023-05-28 17:02:55 수정일 2023-11-06 12:29:33

https://arca.live/b/aispeech/77411828

2023-11-06 현재, 무료 미결제 상태로 작동 안 함

***

https://arca.live/b/aispeech/80030656

자동백업, 추가 기능이 있는 코랩을 사용하는 코랩 가이드

***

준비물:

1. A의 음성 wav 10분 이상

2. B의 노래/대화(목소리만)

결과물:

A의 노래/대화

이 글(독수리임ㅎ)에서는 준비물에는 어떠한 후보정도 필요 없는 데이터셋으로써 이상적인 상태라고 가정하고 진행

로컬 말고 코랩 기준 글임

https://colab.research.google.com/github/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/Retrieval_based_Voice_Conversion_WebUI_v2.ipynb

코랩 또는 이 글 내용이 낡아서 맞지 않거나 오류가 나는 부분이 있을 수 있으므로 참고로만 하고 오류나면 채널에 질문글 올리던가 다른 글 찾아보던가 할 것

+코랩 오류나면 이 글에 사용된 코랩 말고 rvc crepe 코랩 찾아서 쓰는 걸 추천함. 사용법 다르니까 알아서 쓰셈

https://colab.research.google.com/drive/1TU-kkQWVf-PLO_hSa2QCMZS1XF5xVHqs?usp=sharing

+코랩이 아닌 컴퓨터에 깔아서 로컬로 쓰는 거면 올인원 가이드로

https://arca.live/b/aispeech/78639996

1. 음성 wav 파일(A의 음성) 정비

기본적으로 음성 학습 시에는 각 음성들을 5~15초 정도로 잘라 학습하는 것이 보통임

그러나 rvc에는 노말라이즈 등의 기능과 함께 자체 컷팅 기능이 동봉되어 있으므로(나도 방금 앎) 딱히 미리 잘라놓을 필요는 없음

근데 아무것도 없으면 좀 섭섭하므로 대신 wav들을 합치는 방법을 알려줌

***이미 2~15초? 정도의 적당한 크기로 짤려 있으면 압축하는 부분으로 바로 넘어가도 됨***

(대충 음성 wav들)

나는 전부 합칠 때 Audacity를 쓰지만 다른 프로그램도 있을 거임

암튼 전부 드래그해서 편집창에 던진다

대충 전부 때려박은 화면

오디오의 출발 지점이 모두 같음. 이대로 저장하면 개판이 난다

선택 -> 전체 하여 전체를 먼저 선택

여러 트랙->트랙 맞춤->말단에 맞추기로 나열함

이제 파일 -> 내보내기 -> WAV로 내보내기로 내보내면 됨

혹시 모르니까 파일 이름은 영어 숫자 밑줄로만 되있으면 좋고 인코딩은 16bit면 좋음

2. 코랩 사용

이제 해당 wav파일(또는 파일들)을 zip으로 압축한다

드라이브 열어서 아무데나 업로드 하기

나중에 또 써먹어야 되니까 어디 올려놨는지 정도는 기억해놓는 게 좋다.

참고로 압축하는 이유는 코랩 작업을 쉽게 하기 위해서지, rvc 자체에 필요한 건 아님

따라서 로컬로 할 경우 압축하지말고 작업폴더 안에 아무 빈 폴더 만들어서 거기 쑤셔박고 나중에 path to training folder로 경로지정 하면 된다.

이제 RVC를 연다

나는 GPU가 없는 븅신컴이므로 코랩으로 연다

https://colab.research.google.com/github/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/Retrieval_based_Voice_Conversion_WebUI_v2.ipynb

일단 나는 이 코랩으로 열지만, 시간이 지나서 이 글이 오래되면 이 코랩이 작동을 안할 수 있으니 따로 최신 코랩 찾아서 하는 걸 추천한다

각 코랩마다 방식은 조금씩 달라도 같은 RVC라면 WebUI까지 돌리면 다 비슷비슷할거니까 대충 알아서 하셈

코랩 열었다

기본적으로는 코랩의 지시에 따르면 제대로 작동 된다

만약 위쪽 링크의 코랩을 사용했다면 3가지 미리 고쳐놔야할 부분이 있다

(1)

克隆仓库

부분 실행 직전에

import os
my_current_path = os.getcwd()
os.mkdir(my_current_path+ "/" + "Retrieval-based-Voice-Conversion-WebUI")

추가하고 실행

(2)

启动web

부분 실행 직전에

!aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/hubert_base.pt -d /content -o hubert_base.pt

추가하고 실행.

(3)

启动web

부분에서

%cd /content/Retrieval-based-Voice-Conversion-WebUI

를 지우고, 대신

%cd /content

를 입력하고 실행

이상을 잘 지킨다면 1차적으로 해당 코랩의 오류는 전부 해결된다

여태까지 RVC 코랩을 시도했다가 실패한 여러분들에게 심심한 사과(맛있음)의 말씀 드린다

~~+4)~~

~~安装依赖에서 gradio==3.14.0을 gradio==3.34.0으로~~

다른 코랩 보니 6/20일자로 고쳐진 것으로 추정

이제 각 문단의 왼쪽 위에 있는 탐스러운 재생 버튼을 순서대로 눌러주기만 하면 된다

이하는 위 링크의 코랩을 사용했다는 가정하에 적혀있다

위 링크의 코랩을 사용하지 않았다면 코랩의 자체 지시에 따르면 대충 진행될거임

WebUI부터는 사용법에 거의 차이가 없으므로 다시 이 글을 참고하면 됨

맨 위에 저 부분 실행하면 마지막에 (아니면 중간중간에) 저게 뜰텐데, 저 코드가 끝나면 꼭 저 버튼을 눌러서 런타임을 재시작하기 바란다

쭉 넘어가서 이 부분이 여러분들의 wav를 불러오는 부분이다

왼쪽의 폴더같은 마크를 열어 drive 폴더에 들어가 zip 파일을 올렸던 곳으로 이동한다

해당 파일을 우클릭 해서 경로 복사를 해주자

그대로 Ctrl V 해주면 경로가 복붙되니까 그 다음에 시작 버튼을 눌러주면 된

해당 부분까지 왔다면 시작 버튼을 누르고 잠시 기다린다

그러면 (코랩 기준)Running on public URL 이라고 뜨는 링크로 들어가서 WebUI를 열면 된다

3. rvc WebUI 사용

처음 들어갔을 때는 Model Inference 탭이다

노래/대사를 뽑아낼 때 사용하는 화면이므로 지금은 필요 없다

Train 탭을 눌러 음성 학습을 시작

Experiment name에는 이 모델의 식별 이름을 마음대로

기왕이면 띄어쓰기가 없는 영어/숫자/밑줄의 조합이 좋음

Target sampling rate는 wav의 주파수

v1을 선택했다면 네가 가져온 wav의 주파수에 가까운 주파수를

v2를 선택했다면 무조건 40k를 선택하자

*현재 v2 32/48k도 일단 되긴 하는데 이 코랩에선 안됨

Path to training folder는 위 링크 코랩을 썼으면 /content/dataset 을 지정하면 된다

네가 코랩의 화살표 버튼들을 돌리면서 너의 zip이 여기로 압축풀기 되었기 때문

로컬이라면 네가 음성 파일들을 쑤셔박은 그 폴더를 지장하면 될 거다

이제 저기 탐스러운 주황색 Process Data 버튼을 누르도록 하자

이 때 새로 열린 창이 아닌 원래 코랩 창으로 돌아가면 현재 진행상황을 볼 수 있다

혹시 몰라 말해두는데 새 창 열렸다고 코랩 닫지 마라

코랩이 RVC를 대신 돌려주는 거라 코랩 없으면 안된다

옆의 output message의 테두리가 오렌지색에서 하양으로 되돌아오면 해당 처리가 완료됐다는 뜻이다

다음은 피치 추출이다

코랩으로 열었다면 맨 왼쪽은 건들 필요 없고, 로컬이면 알아서 정보 넣어라

속도는 pm>dio>harvest 순이고, 성능은 역순이다

harvest로 해도 네가 무슨 3시간짜리 파일을 들고왔다던가 하는 게 아니면 그렇게까지 오래 걸리진 않는다

귀여운 Feature extraction 버튼을 눌러주고 오렌지색 테두리가 없어질때까지 기다린다

다음은 대망의 학습이다

Load pre-trained base path: 사전학습 모델이다

v1라면

/content/Retrieval-based-Voice-Conversion-WebUI/pretrained/f0G(선택한주파수)k.pth (위쪽)

/content/Retrieval-based-Voice-Conversion-WebUI/pretrained/f0D(선택한주파수)k.pth (아래쪽)

v2라면

/content/Retrieval-based-Voice-Conversion-WebUI/pretrained_v2/f0G40k.pth (위쪽)

/content/Retrieval-based-Voice-Conversion-WebUI/pretrained_v2/f0D40k.pth (아래쪽)

이라고 쳐둔다

참고로 파일의 f0은 피치를 추출한다는 뜻이며, 만약 If the model have pitch guidance~ 부분을 False로 했다면 f0이라고 적힌 부분을 떼고 복붙해야 한다

여기부터 보라색 짤이 섞일텐데, 이 path 부분을 잘못 입력한거 모르고 코랩오류인가 싶어서 다른 코랩 켜서 그렇다

이런 능지로도 돌릴 수 있는 RVC 굉장해

saving frequency: 얼마나 중간저장할건지

rvc는 최종버전이 되면 다시 학습할 수 없으므로 중간저장버전을 이용해야만 학습 재시작이 가능해진다

코랩이 중간에 끊기면 어짜피 중간 저장 버전도 날아가므로 그냥 맨 뒤로 돌리면 된다

코랩 안 써도 어짜피 용량 생각보다 많이 차지해서 숫자 낮게 하는 건 개인적으로 추천 안 한다

Total training epochs: 얼마나 학습을 오래할건지

epoch 1개당 모든 wav 파일을 한 번 순회하여 학습했다는 걸 의미하며, 파일 전체의 크기가 커질수록 epoch 하나의 시간도 늘어난다

나는 약 30분 파일인데, 1epoch당 1분 살짝 안 되게 걸리니까 참고하셈

나는 보통 100 epoch로 학습시키는데, 300은 기본으로 쓴다는 사람도 있었으니, 자기 wav에 가장 적합한 epoch 수를 찾기 위해서는 시행착오를 겪어야 할 수도 있음

높은 epoch가 보통 가장 좋긴 하지만, 900 epoch 정도는 오히려 정확도가 떨어질 수 있다고 함

batch_size for every GPU: 잘 모르지만 코랩 기준 20으로 올려놓으면 학습이 조금 빨라진다

어짜피 코랩 막 사용할수록 일찍 뺏어간다는데 총량 비슷할거면 빠른 편이 좋을 듯?

Train model을 먼저 하고

그 다음에 Train feature index를 하도록 한다

train model이 가장 시간을 많이 잡아먹는다 index는 그다지

이제 학습은 모두 끝났으니 맨 처음 Model inference 탭으로 돌아온다

Inferencing voice를 눌러 학습한 모델의 pth를 선택해준다

선택창에 없으면 Refresh voice list and index path를 누르고 다시 선택한다

transpose: 음악 키 변경

기본 설정은 0, 범위는 위아래로 각각 1옥타브만큼

숫자가 올라갈수록 노래의 피치가 올라가고 반대로 숫자가 내려갈수록 노래의 피치가 내려간다

여자 목소리로 남자 노래를 부르게 할 때나 반대 상황에서 사용할 수 있다

Enter the path audio~에서 부르게 할 노래의 경로를 지정해준다

맨 위에서 얘기한 B의 노래/대화가 들어갈 자리

구글드라이브에 있다면 zip 파일을 찾을 때와 마찬가지로 경로를 찾아 복붙하면 되고, 아니라면 코랩에 직접 업로드 하고 지정해도 된다

코랩에 업로드 한 건 런타임 끝나면 사라지니까 조심

Path to Feature index file~은 코랩에서 logs/(모델이름) 폴더 밑에 있는 경로를 찾아 added_IVF~~.index 라고 되어있는 파일의 경로를 주면 된다

해당 파일이 어딨는지 모르겠다면, 밑에 있는 Path to the '.index' file in~~ 부분에서 자동으로 검색해주니까 그걸로 찾으면 됨

대신 위쪽 Enter the path audio~ 경로는 비어있어야 함

Select the algorithm for pitch extraction~은 학습때와 마찬가지로 피치를 추출하는 알고리즘 선택이다

원래는 pm이랑 harvest밖에 없는데 다른 코랩으로 열어서 이렇다

위에 나와있는 대로 pm이 더 빠르고 harvest가 더 고퀄이다

하지만 가끔 pm이 무시하는 삑사리를 harvest가 잡아내서 이상하게 나오는 경우가 있으므로 나는 pm이랑 harvest 결과물 따로따로 보관해서 나중에 삑사리 나는 부분만 pm으로 바꿔 넣기도 함

참고로 harvest로 추출하면 노래가 1분 좀 넘기 시작하면 에러가 뜨므로 몇 조각으로 잘라서 추론하는 걸 추천한다

+최근에 crepe 추가됨. 속도 pm>harvest>crepe, 성능 역순

Resample the audio in post-processing~: 주파수 샘플링

0으로 하면 전에 결과물이 직접 고른 주파수로 나온다

0 이외는 선택한 숫자대로의 주파수로 샘플링 되어 나온다

Use volume envelope of input to~: 원본 목소리 크기 사용

숫자가 낮아질수록 원본과 같은 음량을 따라간다

기본은 1 모델의 음량을 사용

탐스러운 Convert 버튼을 누르면 잠시 후 옆칸에 오디오가 출력되므로 알아서 다운로드 하면 된다

그 밑에는 폴더 단위로 변환하는 기능이고 대충 비슷하게 하면 된다

해당 모델을 나중에 다시 써먹고 싶으면 logs 폴더의 added_IVF~~.index랑 weight 폴더의 (모델이름).pth를 다운로드 해서 다음번에 학습은 건너뛰고 pth를 같은 위치에 업로드하면 된다(index는 구글드라이브에 있어도 Path to Feature index file~에서 경로 지정하면 됨)

댓글 [109]

ceRISystem

2023-05-28 23:02:47

KooKoo

2023-05-29 09:52:48

선생님... 지금 머리 ddsp로 하려다가 머리 깨질거같아서 rvc로 넘어가려고 이 글 보고 진행중인데 이거 쓰기 줜나어렵네요 ㅇㅇ
일단 1.A의 음성파일 wav 10분이상 짜리를 구글 코랩에 넣는거까지는 이해했습니다.

2.B의 노래 는 어디다가 어떻게 쓰는지 ㄹㅇ 모르겠습니다..

펼쳐보기▼

PPAP

2023-05-29 10:04:46

충분히 많은 양의 A의 음성 파일 + B의 노래/말소리 -> A가 부른 B의 노래/말소리
예를 들어 한지우의 존나 많은 음성 파일이랑 웅이가 '꼬지모'라고 말한 음성이 있을 때, A가 한지우고 B가 웅이면 한지우가 '꼬지모'라고 말한 음성을 만들 수 있음
A에서는 '누가'를, B에서는 '무엇을'을 뽑아 먹는거임

B의 노래도 대충 구글드라이브 어디에 던져놓고 webui 열어서 결과물 뽑아먹을 때 경로 베껴서 Enter the path audio~ 에 넣으면 됨
아니면 코랩에 직접 드래그해서 올려도 코랩에 올라가니까 직접 올리고 경로 베껴도 됨 대신 시간 좀 오래걸림

펼쳐보기▼

KooKoo

2023-05-29 10:06:12

지금 이거 보고도 머리 깨질거같아서 구글에 RVC ai song 치고 유튜브 보면서 공부중입니다. 이게 최근 한달만에 나온 기술이라 ai로 그림뽑아내는거랑은 차원이다르게 어렵네요 ㅇㅇㅇ

펼쳐보기▼

모레모

2023-05-29 10:32:47

뭔가 애매했던 부분 자세히 설명해줘서 도움이 많이 되었어요. 감사합니다

펼쳐보기▼

ddiyong

2023-05-29 10:58:21

*수정됨

克隆仓库
부분 실행 직전에
import os
my_current_path = os.getcwd()
os.mkdir(my_current_path+ "/" + "Retrieval-based-Voice-Conversion-WebUI")
추가하고 실행

요부분하면 ---------------------------------------------------------------------------
FileExistsError                           Traceback (most recent call last)
<ipython-input-7-ce3df8802b7b> in <cell line: 3>()
      1 import os
      2 my_current_path = os.getcwd()
----> 3 os.mkdir(my_current_path+ "/" + "Retrieval-based-Voice-Conversion-WebUI")

FileExistsError: [Errno 17] File exists: '/content/Retrieval-based-Voice-Conversion-WebUI' 
File "<ipython-input-12-c99fbc825064>", line 1
    ---------------------------------------------------------------------------
                                                                               ^
SyntaxError: invalid syntax 왜이러는지아시나요?

펼쳐보기▼

PPAP

2023-05-29 11:51:05

뭐야 고쳐졌나 보네 이제 안 돌려도 됨~~

펼쳐보기▼

PPAP

2023-05-29 12:00:58

아니 다시 보니까 딱히 고쳐진 부분 없는데??? 오류 안 나면 계속 그대로 해도 되는데 오류 나면 다시 댓글좀

펼쳐보기▼

ddiyong

2023-05-29 11:00:15

유튭이나 다른 글에서 읽은 방법으로 여러번 학습시켜봣는데 자꾸 기계음이랑 노이즈가 나오는건 방법이잘못된건지 음원이 잘못된건지..

펼쳐보기▼

KooKoo

2023-05-29 11:27:08

선생님 RVC에서 자체적으로 음성10~15로 짜를수 있다고 하셧는데 그냥 음성파일 집어넣으면 지가 알아서 잘라주나요??

펼쳐보기▼

PPAP

2023-05-29 12:05:30

ㅇㅇ 데이터셋 폴더에 있는 게 짤리지는 않고 읽어들일 때 짤림. 전처리 이후에 logs 폴더에서 앞에 숫자 붙어있는 폴더들 보면 알 수 있음

펼쳐보기▼

KooKoo

2023-05-29 12:14:36

하... 이미 골드웨이브랑 슬라이서 받아서 하는중이라....

펼쳐보기▼

PPAP

2023-05-29 12:18:51

쟁여놨다가 ddsp 같은 거 건드릴 때 쓰셈
어짜피 다른 프로그램이어도 돌리는 방식은 다 거기서 거기라서 rvc 익숙해지면 심심해서라도 다른 것도 돌리게 되어있음

펼쳐보기▼

KooKoo

2023-05-29 12:27:38

volii

2023-05-29 12:18:53

pm으로 추론하고 그 결과물을 다시 가져와 harvast로 추론한다는게 pm 결과물이 결국 B의 데이터가 되는게 맞는거죠?

학습된 모델A + pm = pm(a) 이면
학습된 모델A + pm(a) 이걸 harvest로 = 결과물

제가 이해한게 맞을까요?

펼쳐보기▼

PPAP

2023-05-29 12:29:27

ㄴㄴ pm 결과물 하나랑 harvest 결과물 하나 따로따로 저장해 놓는다는 뜻이었음
A (pm) B -> pm(a)
A (harvest) B -> harvest(a')
ㅈㅅㅈㅅ

펼쳐보기▼

volii

2023-05-29 12:31:59

감사합니다 둘중에 잘나온걸 써야겠네요

펼쳐보기▼

volii

2023-05-29 12:19:23

*수정됨

아 그리고 추가로 RVC 랑 DDSP 둘중에 어느게 더 성능이 좋을까요?

노래 데이터 뽑을꺼고 데이터는 15초 슬라이스로 대략 450개 정도 됩니다..

펼쳐보기▼

PPAP

2023-05-29 12:33:05

데이터 질만 좋으면 그렇게 큰 상관은 없을 거 같은데, 노래 뽑을거면 개인적으로는 ddsp 추천
1시간 이상에 음질도 좋으면 좀 더 오래 걸리긴 할텐데 나중에 diff도 써봐

펼쳐보기▼

volii

2023-05-29 12:47:58

감사합니다!

펼쳐보기▼

KooKoo

2023-05-29 13:02:46

ddsp 지랄맞게 생겨서 아까 하다가 포기했음 ㅇㅇㅇ지금 겨우 선생님 글 읽고 train model 누르고 기다리고 있습니다.  음악하나짜리 15초정도로 자른것들이라 3분도 안되는 길이인데 궁금해서 epo 660으로 돌리고 있습니다.

오늘안에 버즈 목소리로 어디에도 부르게하는게 목표입니다.

펼쳐보기▼

PPAP

2023-05-29 13:18:19

왜 답글을 여기다 씀
암튼 좋은 결과 있길 바람
여기 채널에서 한국 가수 결과물 만들어서 올리는 거는 금지니까 어디 올리려면 유튜브에 올리셈

펼쳐보기▼

모레모

2023-05-29 14:37:24

선생님 근데  added_IVF~~.index 이거는 무슨 역할인가요?

펼쳐보기▼

PPAP

2023-05-29 14:38:10

나도 잘 모름. 말투인가?

펼쳐보기▼

ceRISystem

2023-05-30 03:43:51

*수정됨

Process data 하고 Feature extraction 끝내서 pth 파일 (G, D) 뽑았는데,
해당 pth 파일 뽑힌 경로 지정하고 

Train model 버튼 누르면, log 박스에
"训练结束, 您可查看控制台训练日志或实验文件夹下的train.log"
이 메시지 뱉으면서 5초 만에 끝나버리고,

Train feature index 버튼 누르면, log 박스에
(508897, 768), 11413 training
메시지 뜨고 주황 테두리 계속 깜빡 거리는데

이거 제대로 학습하고 있는 거 맞음?

글에는 Train model 이 Train feature index 보다 더 오래 걸린다고 되어 있길래 물어봄

펼쳐보기▼

ceRISystem

2023-05-30 03:57:22

*수정됨

Train feature index이 끝났는 지
"(508897, 768),11413
training
adding
成功构建索引，added_IVF11413_Flat_nprobe_1_v2.index"
이 메시지 뱉었는데,

막상 Model Inference 하려고 하면 리스트에 안 나옴
리프레시 해도 목록에 아무 것도 안 뜨더라...

펼쳐보기▼

PPAP

2023-05-30 04:16:08

https://huggingface.co/lj1995/VoiceConversionWebUI/tree/main

feature extraction 결과물중에 G, D 파일도 있음...? 몰랐음
재학습 할 거 아니면 기본적으로 이 코랩 기준 pretrained 아니면 pretrained_v2에 있는 모델 쓰면 될거임. 없으면 저기 링크에 있는 폴더 다운로드 해서 쓰면 됨

왜 학습이 5초컷 나는지는 나도 모르겠음 ㅈㅅ...

huggingface.co

lj1995/VoiceConversionWebUI at main

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

feature extraction 결과물중에 G, D 파일도 있음...? 몰랐음
재학습 할 거 아니면 기본적으로 이 코랩 기준 pretrained 아니면 pretrained_v2에 있는 모델 쓰면 될거임. 없으면 저기 링크에 있는 폴더 다운로드 해서 쓰면 됨

왜 학습이 5초컷 나는지는 나도 모르겠음 ㅈㅅ...

펼쳐보기▼

ceRISystem

2023-05-30 04:36:52

D40K.pth, G40K.pth 말한 거 였음

펼쳐보기▼

PPAP

2023-05-30 04:45:52

index 트레이닝은 잘 된 거 같은데, 모델쪽(모델이름.pth)이 아예 학습이 안 되서 목록에 안 뜨는 거 같음
왜 학습이 안 되는지는 모르겠음 ㅈㅅ

펼쳐보기▼

rext

2023-05-30 04:21:08

*수정됨

RuntimeError: Failed to load audio: ffmpeg error (see stderr output for detail)

AttributeError: 'NoneType' object has no attribute 'tobytes'
이거는 무슨에러임??

펼쳐보기▼

rext

2023-05-30 04:21:28

학습끝내고 추출하려니까 컨버트안되고 에러뜨네

펼쳐보기▼

PPAP

2023-05-30 05:00:22

인터넷 찾아보니 로컬이면 파이썬이나 다른 거 버전 문제일 수도 있다고 하는데 코랩이면 해당사항 없을텐데
혹시 mp3 넣어줬으면 wav로 바꿔보셈
그걸로도 안되면 문제 원인이 뭔지 모르겠음 ㅈㅅ

펼쳐보기▼

rext

2023-05-30 05:03:30

그리고 Enter the path of the audio file to be processed로 
경로 /content/drive/MyDrive/RVC/test.zip 지정해줘도 해당 폴더를 찾을수없다고 뜨는건 무슨 이유임??

펼쳐보기▼

PPAP

2023-05-30 06:15:01

그건 압축 안 해도 됨

펼쳐보기▼

rext

2023-05-30 06:15:49

답변 ㄱㅅㄱㅅ 해결해서 돌리고 있는데 보통 얼마나 걸렷음??

4분짜리 컨버트하는데 3000초가 넘어가네

펼쳐보기▼

PPAP

2023-05-30 06:20:37

코랩 기준 pm 10초 harvest로 노래 길이 1.5배정도
crepe는 안 돌려봐서 모르는데 harvest보다 길거임

펼쳐보기▼

청가궐

2023-05-30 06:12:05

혹시 학습 다하고 pth, index파일을 다운로드 받았는데 학습 건너뛰고 하려는데 index 경로는 지정했는데 pth파일은 어떻게 해야할까요?ㅠㅠ

펼쳐보기▼

PPAP

2023-05-30 06:15:39

pth 파일을 weight 폴더에 올리고 다 업로드되면 Refresh voice list and index path 버튼 눌르고 선택

펼쳐보기▼

청가궐

2023-05-30 06:17:15

감사합니다!

펼쳐보기▼

volii

2023-05-30 13:15:26

*수정됨

선생님 Feature extraction 누르고 굉장히 오래 걸리는데 이게 맞는걸까요..

펼쳐보기▼

PPAP

2023-05-30 13:17:47

harvest나 crepe로 했으면 좀 오래걸리긴 함

펼쳐보기▼

volii

2023-05-30 13:20:55

P Request: POST http://127.0.0.1:7860/api/predict "HTTP/1.1 200 OK"
/content/extract_f0_print.py:89: DeprecationWarning: `np.int` is a deprecated alias for the builtin `int`. To silence this warning, use `int` by itself. Doing this will not modify any behavior and is safe. When replacing `np.int`, you may wish to use e.g. `np.int64` or `np.int32` to specify the precision. If you wish to review your current use, check the release note link for additional information.
Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations
  f0_coarse = np.rint(f0_mel).astype(np.int)

위에 보이는 POST 주소랑 duidance 주소가 계속 반복됩니다 같은 수치로.. 잘 되고 있는거겠죠..

document.write(`<img src="../_static/numpylogo_dark.svg" class="logo__image only-dark" alt="NumPy v2.1.dev0 Manual - Home"/>`);

NumPy 1.20.0 Release Notes — NumPy v2.1.dev0 Manual

*수정됨

P Request: POST http://127.0.0.1:7860/api/predict "HTTP/1.1 200 OK"
/content/extract_f0_print.py:89: DeprecationWarning: `np.int` is a deprecated alias for the builtin `int`. To silence this warning, use `int` by itself. Doing this will not modify any behavior and is safe. When replacing `np.int`, you may wish to use e.g. `np.int64` or `np.int32` to specify the precision. If you wish to review your current use, check the release note link for additional information.
Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations
  f0_coarse = np.rint(f0_mel).astype(np.int)

위에 보이는 POST 주소랑 duidance 주소가 계속 반복됩니다 같은 수치로.. 잘 되고 있는거겠죠..

펼쳐보기▼

PPAP

2023-05-30 13:21:57

ㅇㅇ

펼쳐보기▼

volii

2023-05-30 13:22:41

으으 감사합니다 제발 되라

펼쳐보기▼

와상즈

2023-05-31 09:48:38

선생님 바쁘신중 죄송합니다ㅜㅜ
제가 15분분량 음성파일로 train model을 돌리니까 믿을 수 없을만큼 속도가 빨리 되네요;;
거의 한 2분만에 300 epoch를 돌려버립니다
여기서 뭔가 쎄하긴 했는데요
pth파일이 생성은 됩니다만 added_ivf index파일이 생성이 안됩니다
아무리 Refresh해도 못 찾고요ㅜㅜ
이렇게 친절하게 설명해주셨는데 못떠먹으니 미칠 노릇이네요...

펼쳐보기▼

PPAP

2023-05-31 10:40:24

내가 겪어본 오류가 아니어서 어디서 문제가 났는지 아예 모르겠네
오류 메세지라도 있으면 원인이라도 알텐데
뭘 해줄 수가 없을 거 같음 ㅈㅅㅈㅅ

펼쳐보기▼

와상즈

2023-05-31 10:49:03

감사합니다ㅜㅜ

펼쳐보기▼

ㅇㅇ

2023-05-31 10:50:40

Train feature index가 생각보다 오래 걸리는데 이 과정은 건너뛰어도 되는건가요?

펼쳐보기▼

ㅇㅇ

2023-05-31 10:56:30

*수정됨

아 된다 괜한 댓글 죄송합니다

펼쳐보기▼

샤미5324

2023-05-31 13:33:18

*수정됨

wav 안 짤라도 자동으로 된다고 써놨는데 코랩 어느 부분에서 그게 자동으로 되는거임? 20분짜리 파일 안 짜르고 넣어놨더니 안 되네..

펼쳐보기▼

PPAP

2023-05-31 13:38:28

webui에서 process data 때 알아서 잘라서 가져감
원본 데이터셋은 그대로

펼쳐보기▼

샤미5324

2023-05-31 13:48:44

*수정됨

아 이제 된다... 근데 어떤거는 되고 어떤거는 안 되고 기준을 모르겟네... 암튼 ㄳ

펼쳐보기▼

샤미5324

2023-05-31 13:55:13

아 그리고 추출할 때 pm으로 하면 잘 나오는데 harvest로 하면 안 나오는건 무슨 오류임?? 

2023-05-31 13:53:37 | INFO | fairseq.tasks.hubert_pretraining | current directory is /content
2023-05-31 13:53:37 | INFO | fairseq.tasks.hubert_pretraining | HubertPretrainingTask Config {'_name': 'hubert_pretraining', 'data': 'metadata', 'fine_tuning': False, 'labels': ['km'], 'label_dir': 'label', 'label_rate': 50.0, 'sample_rate': 16000, 'normalize': False, 'enable_padding': False, 'max_keep_size': None, 'max_sample_size': 250000, 'min_sample_size': 32000, 'single_target': False, 'random_crop': True, 'pad_audio': False}
2023-05-31 13:53:37 | INFO | fairseq.models.hubert.hubert | HubertModel Config: {'_name': 'hubert', 'label_rate': 50.0, 'extractor_mode': default, 'encoder_layers': 12, 'encoder_embed_dim': 768, 'encoder_ffn_embed_dim': 3072, 'encoder_attention_heads': 12, 'activation_fn': gelu, 'layer_type': transformer, 'dropout': 0.1, 'attention_dropout': 0.1, 'activation_dropout': 0.0, 'encoder_layerdrop': 0.05, 'dropout_input': 0.1, 'dropout_features': 0.1, 'final_dim': 256, 'untie_final_proj': True, 'layer_norm_first': False, 'conv_feature_layers': '[(512,10,5)] + [(512,3,2)] * 4 + [(512,2,2)] * 2', 'conv_bias': False, 'logit_temp': 0.1, 'target_glu': False, 'feature_grad_mult': 0.1, 'mask_length': 10, 'mask_prob': 0.8, 'mask_selection': static, 'mask_other': 0.0, 'no_mask_overlap': False, 'mask_min_space': 1, 'mask_channel_length': 10, 'mask_channel_prob': 0.0, 'mask_channel_selection': static, 'mask_channel_other': 0.0, 'no_mask_channel_overlap': False, 'mask_channel_min_space': 1, 'conv_pos': 128, 'conv_pos_groups': 16, 'latent_temp': [2.0, 0.5, 0.999995], 'skip_masked': False, 'skip_nomask': False, 'checkpoint_activations': False, 'required_seq_len_multiple': 2, 'depthwise_conv_kernel_size': 31, 'attn_type': '', 'pos_enc_type': 'abs', 'fp16': False}

이러면서 안 되는데

펼쳐보기▼

PPAP

2023-06-01 12:37:55

pm으로는 되다가 harvest로 안되는 거면 노래를 1분정도로 짤라서 넣으면 잘 나옴

펼쳐보기▼

도야지냥이

2023-06-01 11:49:21

음성 부분에 배경소리같은거 들가있어도 상관없나용

펼쳐보기▼

PPAP

2023-06-01 12:36:42

https://arca.live/b/aispeech/77616748
안돼
Ultimate vocal remover로 보컬이랑 배경음 분리하던가 알아서 배경소리 지워라
근데 이게 노래에서 보컬 추출하는 프로그램이라 그냥 배경소리 분리에도 효과 있을지는 모르겠네

펼쳐보기▼

도야지냥이

2023-06-01 13:47:02

고마워유!

펼쳐보기▼

ceRISystem

2023-06-02 02:27:29

어제 코랩에서 추론 음성파일 까지 뽑았는데,
((process data > feature extraction > train model > train feature index 까지 성공)
오늘 model inference 탭으로 이동해서 돌리려고 보니까 
inferencing voice 리스트에 아무 것도 없더라

이거 쓸 때마다 train 해서 추론 음성파일 뽑아야 댐?

펼쳐보기▼

PPAP

2023-06-02 03:12:12

저번에 코랩에서 (모델이름).pth파일이랑 added~.index 파일을 다운로드 해놨으면
해당 .pth 파일을 weight 폴더로 복붙하고 Refresh voice list and index path 버튼 누르면 뜸. index는 직접 Path to Feature index file 칸에서 경로 지정
.pth 파일을 저번에 다운로드 안 해놨으면 train 다시 해야되는 거 맞음

펼쳐보기▼

ceRISystem

2023-06-02 03:49:52

*수정됨

쉽게 말해 train feature index 까지 해뒀으면, 
weight 폴더에 가서 (모델이름).pth 파일들 따로 백업해두라는 거지? 

근데 added~.index 파일은 뭐고 어디에 있음?

펼쳐보기▼

PPAP

2023-06-02 04:05:53

ㅇㅇ 맞음 백업해야 재사용 가능
무슨 역할 하는지는 나도 모름ㅈㅅ
아마 logs 폴더 밑 어딘가에 있을 거임

펼쳐보기▼

ceRISystem

2023-06-02 05:24:40

*수정됨

일단 결과물 export 까지 성공은 했는데, 결과물의 상태가 메롱이네
결과물의 보컬이 속닥속닥 귓속말 하듯 노래를 못 부르는데,
그 마저도 제대로 얘기도 못 함.

추론할 때 대신 부르게 할 음악의 원곡을 넣는 게 아니라 UVR로 inst(MR)랑 vocal로 찢어서
음악 없는 vocal 파일을 넣어서 나온 결과물을 찢은 inst랑 합치면 되겠다 맞지?

펼쳐보기▼

PPAP

2023-06-02 05:27:22

ㅇㅇㅇ 배경음이랑 같이 넣으면 배경음도 같이 부르려고 함. 찢어서 넣는 거 맞음

펼쳐보기▼

밭오리

2023-06-02 07:07:03

Path to the '.index' file in~ 부분에서 아무것도 안나오는데 어디서부터 잘못 된 걸까?

펼쳐보기▼

PPAP

2023-06-02 08:56:45

일단 Refresh voice list and index path 버튼 누르고 재확인
Path to the '.index' file in 에서 아무것도 안뜨면 logs 폴더 밑에 .index 파일이 없음 == train feature index가 제대로 작동 안 한거임
코랩이면 train feature index 버튼 누르고 코랩에 뜨는 문장들 긁어오셈 무슨 오류인지 보게

펼쳐보기▼

밭오리

2023-06-02 08:59:41

다른 코랩 썼더니 그냥 해결되었음

펼쳐보기▼

1주1닭

2023-06-03 00:21:09

index 생성이 안되면 어떻게 해야할까요? pth까지는 2번이나 생성했는데 인덱스 생성이 안되네요; 클릭해도 2초?내에 끝나고.... 그냥 pth 갖고 model inference 들어가서 무작정 해보려 하니 이것도 error뜨면서 안됩니다 어떤 에러인지 나오지도 않네요; 뭐가 문제인지...

펼쳐보기▼

PPAP

2023-06-03 01:11:47

https://arca.live/b/aispeech/77718260
그건 무슨 오류인지 나도 모르겠음 ㅈㅅ...
오류 뜰 때 코랩 화면 gradio webui 말고 코랩 들어가면 오류 뜰건데 index 없으면 오류 뜨는 게 정상이니 train featured index 버튼 누르고 인덱스 생성이 안 될 때 코랩 들어가서 뜨는 오류 봐야 알 듯
이 글 코랩 쓴거면 오류 고치기 (2)번 启动web 셀 전에 돌린 거 맞지?
혹시 모르니까 다른 코랩으로도 한 번 해보겠음? 모델 불러오기는 건너뛰고

펼쳐보기▼

1주1닭

2023-06-03 03:42:46

*수정됨

60epoch로 다시 학습시켜서 index까진 얻었는데 이번엔 model inference 단계에서 조금 돌아가더니 Connection errored out라고 뜨네요                                                       
               위 글 링크의 다른 코랩은 데이터셋 불러오기때 -
Exception                                 Traceback (most recent call last)
<ipython-input-14-7b120b84c6b3> in <cell line: 6>()
      5 import os
      6 if not os.path.exists(dataset_path):
----> 7   raise Exception(f'There is no {DATASET} in {os.path.dirname(dataset_path)}')
      8 get_ipython().system('mkdir -p /content/dataset')
      9 get_ipython().system('unzip -d /content/dataset -B {dataset_path}')

Exception: There is no /content/drive/MyDrive/dataset/SH.zip in /content/drive/MyDrive/dataset//content/drive/MyDrive/dataset 라고만 뜹니다

펼쳐보기▼

PPAP

2023-06-03 05:00:21

https://arca.live/b/aispeech/76647642
harvest로 돌리면 1분보다 좀 더 길면 뱉어냄. 잘라서 넣어보셈. 그걸로 돌아가면 길이 문제임.
그걸로도 안 되면 링크 가서 guitar_vocal_k 아님 guitar_vocal_t 중에 하나 다운받아서 써보셈. 그걸로 돌아가면 파일 문제임.
그게 문제가 아니면 그 에러 뜰 때 코랩 화면으로 가서 오류 글 긁어봐야 뭐가 문제인지 알 거 같음

다른 코랩에선 SH.zip이라고만 쳐도 될거임. /content/drive/MyDrive/dataset/까지 미리 인풋으로 들어가있어서

펼쳐보기▼

리스트

2023-06-12 09:30:27

학습 도중에 런타임 끊어지면 설마 처음부터 다 다시해야 함?

펼쳐보기▼

PPAP

2023-06-12 09:40:51

https://colab.research.google.com/drive/1TU-kkQWVf-PLO_hSa2QCMZS1XF5xVHqs?usp=sharing
이 글 코랩 썼으면 ㅇㅇ 처음부터
이 댓글 링크 코랩은 오토 세이브. 대신 용량 좀 많이 잡아먹음

colab.research.google.com

Google Colaboratory

이 글 코랩 썼으면 ㅇㅇ 처음부터
이 댓글 링크 코랩은 오토 세이브. 대신 용량 좀 많이 잡아먹음

펼쳐보기▼

리스트

2023-06-12 09:41:41

내 5시간이

펼쳐보기▼

터미네이터알파고

2023-06-15 13:43:01

*수정됨

흠.. 왜 모델이 안뜰까요..찾아보니 pth 파일을 weight폴더에 넣으라는데 pth 파일이 생성된게 없는데...
logs 폴더에 트레이닝 된 겨과물은 있는거 같은데..

펼쳐보기▼

PPAP

2023-06-15 15:17:24

train model 버튼 누른 과정에서 문제가 있는 거 같음
다른 코랩 링크를 찾아서 쓰던가, 런타임 삭제하고 글에서 코랩 키는 부분부터 다시 따라하던가 해보셈
아마 미리 고쳐놔야할 부분 (2)이 제 때 실행 안 되서 그런가 싶긴 한데 코랩 오류 문구를 모르니까 아닐 수도 있음

펼쳐보기▼

터미네이터알파고

2023-06-15 15:19:11

다른 코랩도 써봤는데 거긴 또 index 파일 생성이 안되고 ㅠㅠ 첨부터 다시해보거나 여기저기 다해봐서 짜맞추든가 해야겠네요

펼쳐보기▼

샤미5324

2023-06-16 13:16:11

*수정됨

https://arca.live/b/aispeech/78823535
1주일 전까지 잘 되다가 갑자기 이러면서 안 되는데 얘 왜이럼?

펼쳐보기▼

앙잉응행

2023-06-21 03:09:30

从谷歌云盘加载打包好的数据集到/content/dataset

펼쳐보기▼

앙잉응행

2023-06-21 03:09:41

여기부분에서

펼쳐보기▼

앙잉응행

2023-06-21 03:09:54

unzip:  cannot find or open https://drive.google.com/file/d/1Xh_-l1LUiHs7_uXXAgCNiW1onS6iwotB/view?usp=drive_link, https://drive.google.com/file/d/1Xh_-l1LUiHs7_uXXAgCNiW1onS6iwotB/view?usp=drive_link.zip or https://drive.google.com/file/d/1Xh_-l1LUiHs7_uXXAgCNiW1onS6iwotB/view?usp=drive_link.ZIP.

No zipfiles found.

drive.google.com

Google Drive: Sign-in

Access Google Drive with a Google account (for personal use) or Google Workspace account (for business use).

unzip:  cannot find or open https://drive.google.com/file/d/1Xh_-l1LUiHs7_uXXAgCNiW1onS6iwotB/view?usp=drive_link, https://drive.google.com/file/d/1Xh_-l1LUiHs7_uXXAgCNiW1onS6iwotB/view?usp=drive_link.zip or https://drive.google.com/file/d/1Xh_-l1LUiHs7_uXXAgCNiW1onS6iwotB/view?usp=drive_link.ZIP.

No zipfiles found.

펼쳐보기▼

앙잉응행

2023-06-21 03:10:21

*수정됨

이렇게뜨는데 혹시 적용이 안된걸까요 그렇다면 적용을 어떻게 해야하는지 말씀좀 부탁드립니다 참고로 내 드라이브에서 링크를 그대로 붙여놓은겁니다

펼쳐보기▼

PPAP

2023-06-21 03:15:50

드라이브 링크를 그대로 붙여넣지 말고 코랩이랑 구글 드라이브 마운트 성공한 이후에 코랩 왼쪽에 폴더 표시를 눌러서 파일 위치를 찾아서 우클릭하고 경로 복사 해서 복사한 내용 넣어야 함
경로가 /content/drive/MyDrive 이런 식으로 시작해야 할거임

펼쳐보기▼

앙잉응행

2023-06-21 03:16:34

*수정됨

/content/drive/MyDrive/asdfasdf/voice alrenbee asdf.zip

펼쳐보기▼

앙잉응행

2023-06-21 03:26:20

*수정됨

감사합니다

펼쳐보기▼

앙잉응행

2023-06-21 03:32:43

(_ _)

펼쳐보기▼

PPAP

2023-06-22 13:39:32

https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/issues/538

그 부분 오류 있어서 임시로 맨위에서 두번째 安装依赖 gradio==3.14.0를 3.34.0으로 받으라는데 잘은 모르겠다
일단 가이드는 이 코랩으로 쓰긴 했는데 나도 요즘은 저 코랩 안 써서 gradio만 고쳐서 돌아가는지 모르겠음 ㅈㅅ
일단 gradio 저걸로 바꿔놓고 그 安装依赖 부분만 한 번 더 돌리고 다시 启动web 돌려봐

GitHub

Colab; infer-web.py have an issue with gradio · Issue #538 · RVC-Project/Retrieval-based-Voice-Conversion-WebUI

Input: !python3 infer-web.py --colab --pycmd python3 Output: Traceback (most recent call last): File ”/content/Retrieval-based-Voice-Conversion-WebUI/infer-web.py”, line 96, in <module> class ToolB...

그 부분 오류 있어서 임시로 맨위에서 두번째 安装依赖 gradio==3.14.0를 3.34.0으로 받으라는데 잘은 모르겠다
일단 가이드는 이 코랩으로 쓰긴 했는데 나도 요즘은 저 코랩 안 써서 gradio만 고쳐서 돌아가는지 모르겠음 ㅈㅅ
일단 gradio 저걸로 바꿔놓고 그 安装依赖 부분만 한 번 더 돌리고 다시 启动web 돌려봐

펼쳐보기▼

PPAP

2023-06-29 13:32:32

https://colab.research.google.com/drive/1TU-kkQWVf-PLO_hSa2QCMZS1XF5xVHqs?usp=sharing
진행 되면 괜찮겠지
근데 요즘 이 코랩 안 쓰고 다른 코랩 쓰느라 나도 잘 모름

그 코랩 쓰다가 또 안되면 rvc crepe 코랩 써보셈. 걔가 더 실행 간단하고 용량땜시 학습파일 빼고 지워야하긴 하는데 학습 중 자동저장도 해줌

코랩 Step 1. 실행
-> 구글드라이브에 dataset폴더 만들고 음성zip(A의 음성) 넣기
-> 코랩 Click this to load a DATASET instead 에 경로 없이 음성zip 이름만 넣고 실행
-> 코랩 Step 3. 실행

순으로 하면 보라색이긴 한데 webui 뜸

colab.research.google.com

Google Colaboratory

*수정됨

진행 되면 괜찮겠지
근데 요즘 이 코랩 안 쓰고 다른 코랩 쓰느라 나도 잘 모름

그 코랩 쓰다가 또 안되면 rvc crepe 코랩 써보셈. 걔가 더 실행 간단하고 용량땜시 학습파일 빼고 지워야하긴 하는데 학습 중 자동저장도 해줌

코랩 Step 1. 실행
-> 구글드라이브에 dataset폴더 만들고 음성zip(A의 음성) 넣기
-> 코랩 Click this to load a DATASET instead 에 경로 없이 음성zip 이름만 넣고 실행
-> 코랩 Step 3. 실행

순으로 하면 보라색이긴 한데 webui 뜸

펼쳐보기▼

PPAP

2023-06-29 13:43:31

ㄴㄴ B의 음성은 압축 안 한 상태로 올려서 코랩 기준 경로 Enter the path audio~에 복붙해서 돌리면 됨

펼쳐보기▼

PPAP

2023-06-29 13:56:22

ㅊㅊㅊㅊㅊㅊ
피치 추출 방식 결과물은 케바케더라. 피치가 급격하게 변하지 않고 노래 상태가 좋으면 pm도 잘 나옴

펼쳐보기▼

장래희망멘헤라

2023-07-01 09:08:03

선생님 gradio 링크가 안나오고 /content
python3: can't open file '/content/infer-web.py': [Errno 2] No such file or directory 라고만 출력되는데 어떻게해야할까요..

펼쳐보기▼

Shinji

2023-07-01 13:26:04

Feature extraction 하다가 끊겨서 다시 하는데 혹시 이거 이어서 되는걸까 아니면 처음부터 다시하는걸까?

펼쳐보기▼

PPAP

2023-07-01 13:31:08

feature extraction만 끊겼다는거? 아니면 코랩 런타임이 아예 끊겼다는 거?
런타임 아예 끊긴거면 코랩을 첫 스텝부터 다시 해야할 거고 feature extraction만 끊긴거면 이미 작업한 파일은 넘어갈걸?
인터넷 상태 때문에 잠깐 끊긴것 처럼 보이는 경우는 ㄱㅊ
webui쪽은 가끔 그냥 시간 너무 오래 걸린다고 connection error 걸어버리는 경우 있어서 진짜 끊긴건지 알고 싶으면 코랩쪽 보고 있는 게 나음

펼쳐보기▼

Shinji

2023-07-01 13:35:55

하...속아서 이미 꺼버렸네.. 암튼 고맙다

펼쳐보기▼

tlqkffusdk

2023-07-03 01:38:47

*수정됨

어제  logs 폴더의 added_IVF~~.index랑 weight 폴더의 (모델이름).pth 이 부분 두 파일 다운 받고 , 오늘 다시 학습 시키고 added_IVF~~다시 다운 받으려는데 파일이 없네요

펼쳐보기▼

PPAP

2023-07-03 01:41:52

Train feature index 하면 생길거임

펼쳐보기▼

tlqkffusdk

2023-07-03 01:44:56

했는데도 안생김ㄷㄷ..

펼쳐보기▼

PPAP

2023-07-03 01:45:27

PPAP

2023-07-03 01:45:36

코랩에는 뭐라고 뜸?

펼쳐보기▼

tlqkffusdk

2023-07-03 01:46:33

*수정됨

2023-07-03 01:45:03 | INFO | httpx | HTTP Request: POST http://127.0.0.1:7860/api/predict "HTTP/1.1 200 OK"
2023-07-03 01:45:03 | INFO | httpx | HTTP Request: POST http://127.0.0.1:7860/reset "HTTP/1.1 200 OK"
이런식으로만 뜸

펼쳐보기▼

PPAP

2023-07-03 01:48:02

PPAP

2023-07-03 01:48:38

*수정됨

굉장히 아임 파인 땡큐 앤 유 하게 보이는데
그럼 WebUI 쪽 output message에는 뭐라고 뜸?

펼쳐보기▼

따뜻한흑백

2023-07-04 01:46:56

글 읽고 잘 학습시켰습니다.
그런데 궁금한 것이, A의 음성데이터는 평범한 대화음성에 국한되는 건가요??
A의 커버곡에서 vocal remover로 vocal만 추출한 데이터들을 18분정도 학습시켰더니
A의 대화음성 10분 학습시킨거 보다 기계음이 훨씬 많고 불안정하네요,,

펼쳐보기▼

PPAP

2023-07-04 02:27:55

대화 음성이든 노래 음성도 상관 없음 근데 노래 데이터는 좀 더 까다로움
학습에서 가장 중요한 건 음성 퀄리티인데 보컬 리무버를 쓰면 어떻게든 조금씩 품질이 낮아져서 결과물이 대화 음성보다 품질 낮아지는 것 처럼 느껴지는 거 정상임
노래할 때의 발성은 대화할 때랑 달라서 노래로 학습시키는 거에 의의가 없는 건 아닌데, 보컬 리무버 여러번 돌리면 음색마저도 깎여나간다더라
나는 노래 음성은 학습시켜본 적이 없어서 자세한 건 모르겠음 ㅈㅅ...

펼쳐보기▼

따뜻한흑백

2023-07-04 02:41:22

글쿤요 감사합니다

펼쳐보기▼

만두덮밥

2023-07-18 15:50:04

ModuleNotFoundError: No module named 'infer_pack' 이라는 오류가 계속뜨는데 이게뭔가요 ㅠㅠ 미치겠습니다

펼쳐보기▼

ㅇㅇ

2023-07-31 19:14:28

2023-08-01 04:13:11 | ERROR | root | Exception in callback _ProactorBasePipeTransport._call_connection_lost(None)
handle: <Handle _ProactorBasePipeTransport._call_connection_lost(None)>
Traceback (most recent call last):
  File "asyncio\events.py", line 80, in _run
  File "asyncio\proactor_events.py", line 162, in _call_connection_lost
ConnectionResetError: [WinError 10054] 현재 연결은 원격 호스트에 의해 강제로 끊겼습니다

라고 오류뜨는데 이유 아시나요 ㅠㅠ

펼쳐보기▼

선무공신

2023-11-05 21:01:48

로컬로는 학습방법 누가 알려줄수 없나.. 코랩은 문제 생길꺼같은데 거의 학습글이다 코랩임..

펼쳐보기▼

PPAP

2023-11-06 00:08:50

https://arca.live/b/aispeech/78639996
https://arca.live/b/aispeech/79375084
헷갈리는 부분은 외국어 자료 찾아보거나, 질문글 올리셈

펼쳐보기▼

선무공신

2023-11-06 04:43:06

아리가토우

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 📄정보 💾자료 ❓질문 ❗공지 🔨운영

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30645053

공지 ★필독★ AI 음성 채널 기본 통합 공지 (23-06-12)

ㅇㅇ 2023.03.06 25606

공지 ★필독★ 음성모델 공유 관련 규정 (23-06-14)

The_Voice 2023.06.13 15902

공지 AI 음성챈을 처음 방문한 히치하이커를 위한 안내서 (23-07-01)

Tacotron2 2023.06.07 44995

공지 채널 내에서 "AI 성우" 라는 용어 사용을 자제해주길 바람.

공지 국내 가수 및 스트리머, 성우를 활용한 창작물은 업로드 금지임

무명의개념 2023.07.04 4401

숨겨진 공지 펼치기(3개)

11 📄정보 입문이 어려운 초보자를 위한 TTS 학습 2편 MB-iSTFT-VITS-Korean [14]

선무공신 2024.05.19 1700 23

10 📄정보 번역) SiFi-VITS2-44100-Ja [5]

PPAP 2023.09.25 546 3

9 📄정보 전처리 종류만 96가지 커스터마이징 끝판왕 급인 svc 레포지토리 [6]

Tacotron2 2023.09.12 972 5

8 📄정보 Diffusion-svc 사용?법 [8]

전진탱킹하는힐러 2023.07.24 5085 15

7 📄정보 RVC 코랩 공유 모델 zip 링크 사용 가이드 [3]

PPAP 2023.07.02 5351 4

6 📄정보 RVC mangio 코랩 간단 사용법 [60]

PPAP 2023.07.01 16745 17

5 📄정보 DDSP/sovits 부속 diff 단품 출시 [6]

PPAP 2023.06.09 1229 1

4 📄정보 RipX 후기 [3]

SVC 2023.06.07 771 0

3 📄정보 rvc v2 50epoch 500epoch 차이 (crepe로 학습) [1]

aat 2023.05.31 806 0

2 📄정보 RVC 코랩 간단 사용법 [109]

PPAP 2023.05.28 20464 17

1 📄정보 AI 음성 학습 코랩 링크 모음 외 [9]

PPAP 2023.05.23 6816 18

전체글 개념글