우선 데이터셋은 상황을 강조하기 위해 영상으로 업로드함을 알려드림



일단 비추천을 넘어 안되는거



1.노래데이터

이런건 진짜 하지마셈



2.그냥 잡음에 가까운 소리.


여기는 예시를 들지도 않겠음. 이정도는 그냥 알거라 믿음



3.잡음이 섞인 보이스

이렇게 뭔가(예,비명소리)같이 뭔가라도 섞인 보이스는 안됨.

특히 후술한 경우는 박수소리가 들릴텐데, 이 박수소리는 후술할 mr제거로도 안먹히니 주의!



4.감정이 섞인 보이스.



여기 흐르는 음악같은 경우는 uvr쓰면 다 해결되는데


2개가 해결이 안됨


첫번째는 중간부터의 박수소리고,

두번째는 감정이 심하게 담긴 목소리.


감정 어느정도 담긴건 괜찮은데, 엄청 심하게 담긴, 목소리가 평소와 다를정도로 심하게 다르면,

개같이 버려야함.




이제 어느정도 작업하면 데이터로 쓸수있는 음성파일.




1. 음악이 섞여있는 경우



이런건 uvr 쓰면 해결됨. 위에서 말했던 감정도 별로 안들어있는 등 딱히 음악이 있다는 점만 뺴면 비추천할 요인은 없음.


물론 배경음악 없는 데이터라도 uvr 써서 싹 해버리는거 추천함 


은근 배경음악 섞여 나오는 경우도 있음.




이런 경우처럼 음악이 은근슬쩍 있는 경우도 있으니 


그냥 애초에 음원 데이터셋을  uvr로 돌려버리는걸 추천함


종합하자면


1.노래데이터, 잡음에 가까운 소리, 잡음이 섞인 소리, 감정이 심하게 묻어나는 음성 쓰면 X

2.음악이 섞여있으면 UVR로 돌려버리면 바로 쓸수있는 데이터가 되니 위에 해당되지 않는 음악이 섞인 음성이라면 UVR 돌려버리면 됨.