안녕하세요~

자체학습을 진행하고 있는 초보 개발자 입니다.

학습데이터 구축 중 궁금한 사항이 있어 글을 올립니다.


한국어 챗봇 모델을 구축하고 있는데, 한국어 데이터에 영어 데이터도 같이 포함시켜서 학습시키는게 더 성능이 좋을까요? 아니면 한국어만 학습시키는게 좋을까요?

만약, 전자가 맞다면 왜 그런건지 여쭤봐도 될까요?

영어 데이터로 학습시키면 영어만 잘할 것 같은 느낌이어서요~!