본인은 일단 노래 커버가 주목적이라서 최근엔 대사로 모델 만든적이 없는데



내가 만든 모델 기준으로 랩할때 굉장히 약함. 랩할때 발음 사이사이마다 sh 소리.. 이걸 치찰음이라고 하나? 이게 일반 노래보다 더 많이 두드러짐. 당연히 발음이 자주 바뀌니깐..



근데 보통 게임 대사로 만든 모델들.. 예를들면 블루아카 같은건 노래가 없으니 당연 대사로 학습시킨 애들일텐데



얘네들은 랩 되게 잘하더라고.. 이 부분에 대해서 나도 비교 실험을 해볼 예정이지만 혹시 양쪽 모델에 대해 학습해서 비교를 해본 사람 있으면 의견좀 부탁함. 추측도 환영