임베딩모델 학습후 특정 단어를 못찾는 경우?

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3797명 알림수신 191명 @바바리맨

제한없는 언어모델을 위한 채널

일반 임베딩모델 학습후 특정 단어를 못찾는 경우?

ㅇㅇ (121.135)

추천 0 비추천 0 댓글 1 조회수 342 작성일 2024-04-04 04:57:30 수정일 2024-04-04 04:57:45

https://arca.live/b/alpaca/102831395

RAG 방식을 사용하기 위해서

intfloat/Mistral-7B를 사용해서 로컬 임베딩 모델을 사용하고 있습니다.

제가 사용하고자 하는 도메인 데이터로 학습한 뒤에

특정 도메인에 대한 문서를 임베딩 모델을 통해 Vector DB에 저장하고 쿼리에 대해 리트리버 하는 중인데,

모델 파인튜닝을 완료한 뒤에, 특정 단어를 강하게 인식한다거나, 튜닝 전에는 잘 찾아오던 데이터를 튜닝 이후에 못찾는 경우가 생깁니다.

이 경우는 어떤 방식으로 접근해보는 것이 좋을까요 ?

ps /

문서는 굉장히 작게 거의 한문장 단위로 Chunk를 구분하여 진행했습니다.

댓글 [1] 글쓰기

ㅇㅇ (49.174)

2024-04-04 07:48:33 삭제 수정 답글

학습이 제대로 된 건지 전, 후 평가를 해보셔야 할 것 같은데요. 튜닝 후에 도메인 데이터에 대해서 확실히 성능이 오른 건 맞다면 BM25와 같은 키워드 기반의 검색기랑 같이 사용해보셔도 좋을 것 같네요

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 36294823

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 7370

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 33521

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 11269

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

1764 일반 일리야 수츠케버가 설립한 SSI Inc 홈페이지 내용

키릴로차 2024.06.23 501 3

1763 일반 NVidia에서 최근 공개한 오픈소스 로컬 Nemotron 340b 사용 가능한 사이트 [7]

ㅇㅇ 2024.06.23 926 2

1762 일반 RTX3060 vs ARC A770 (llama.cpp, vllm) [4]

bedovyy 2024.06.22 812 8

1761 일반 LogicKor 리더보드 업데이트 예정 및 모델 평가 요청 [5]

maywell 2024.06.21 998 21

1760 일반 chameleon-7B 후기 [7]

ㅇㅇ 2024.06.20 998 7

1759 일반 런팟+vLLM+Marlin+배치 번역작업 GPU가성비 표 [21]

가취 2024.06.20 1590 12

1758 일반 스마트테크쇼 갔습니다 [1]

ㅇㅇ (220.75) 2024.06.20 508 0

1757 일반 메타 카멜레온 7b, 30b가 공개 되었네요 [9]

ㅇㅇ 2024.06.19 1086 7

1756 일반 코딩 특화모델 deepseek coder v2 버전을 발표했네요 [2]

ㅇㅇ 2024.06.18 912 4

1755 일반 구글이 gemma2 27b와 비전모델인 paligemma를 발표했네요 [4]

ㅇㅇ 2024.06.18 717 3

1754 일반 qwen2 72b 학습 시작했습니다. [5]

ㅇㅇ (210.183) 2024.06.17 1419 21

1753 일반 애플 기기들 클러스터링해서 쓰는 거 신기하네요 [2]

ㅇㅇ 2024.06.16 903 4

1752 일반 동일 질의에 대한 여러 모델에 대한 답변 취합 [4]

ㅇㅇ (59.13) 2024.06.13 490 2

1751 일반 이건 어떤건가요? [4]

이게머고 2024.06.12 633 0

1750 일반 outlier.ai라는곳이 있네요 ai 학습시키는 사람들 모집하는곳 [7]

ㅇㅇ 2024.06.12 1487 0

1749 일반 RecurrentGemma 9B 출시

ET 2024.06.11 661 8

1748 일반 sglang 좋네요 [2]

감별사 2024.06.11 912 5

1747 일반 VRAM 이 부족하면 RAM 에 모델에 필요한 메모리를 할당하는 방법도 있나요? [4]

ovp 2024.06.11 826 0

1746 일반 Qwen2 72B 라이센스 GPT4o 물어봄 [3]

zzzzz5 2024.06.11 988 3

1745 일반 눕질문) ollama 에서 70b모델 돌리고 싶은데 가능할까요? [7]

ㅇㅇ (121.150) 2024.06.11 813 0

글쓰기

전체글 개념글