RAG 방식을 사용하기 위해서 

intfloat/Mistral-7B를 사용해서 로컬 임베딩 모델을 사용하고 있습니다.


제가 사용하고자 하는 도메인 데이터로 학습한 뒤에

특정 도메인에 대한 문서를 임베딩 모델을 통해 Vector DB에 저장하고 쿼리에 대해 리트리버 하는 중인데,


모델 파인튜닝을 완료한 뒤에, 특정 단어를 강하게 인식한다거나, 튜닝 전에는 잘 찾아오던 데이터를 튜닝 이후에 못찾는 경우가 생깁니다. 


이 경우는 어떤 방식으로 접근해보는 것이 좋을까요 ?


ps /

문서는 굉장히 작게 거의 한문장 단위로 Chunk를 구분하여 진행했습니다.