스트리머를 대상으로 ai모델 제작 중인데 문제가 쓸만한 고음 소스가 없습니다

정확히는 고음이라고 할만한게 호통치는거랑 비명 지르는거 밖에 없는데 이 때 마이크에서 찢어지는 소리가 납니다

지금까지는 고음 부분은 pm ,search ratio 0으로 처리해서 원곡 냄새가 좀 나도 잘라붙혀서 만들었는데 추론을 시키면 시킬수록 고음 소스에 대한 갈증이 느껴지는데 찢어지는 부분이라도 최대한 살려서 넣어볼까요?

원곡 잘라서 넣는것도 해봤는데 25분 스트리머 원곡4분 비율로 해서 학습시키니까
제3의 목소리가 나오더라구요

한 번 해볼만 한 다른 방법은 없을까요?