https://dev.to/bdougieyo/build-your-own-chatgpt-starter-kit-41gm


챗GPT 3.5 를 기반으로 그 위에 자신의 웹사이트나 서비스에 필요한 데이터를 덧붙이는 파인튜닝을 하기 위한 프로젝트 소개


https://github.com/gannonh/gpt3.5-turbo-pgvector




사람들은 openai 의 모델중 채팅 모델을 주로 쓰고 있는데, 이거 말고도 openai 가 엠베딩 모델 서비스도 api 로 제공하고 있음.


엠베딩은 단어, 문장, 문서를 '벡터'의 형태로 변환한 것임. 일단 엠베딩벡터로 변환하고 나면 그 엠베딩과 비슷한 것을 검색하거나,  (예: QnA 검색) 엠베딩들의 시퀀스를 주고 다음에 나올 엠베딩을 추측하게 만들거나 (문장 이어나가기) 하는 식으로 심도 있는 활용이 가능함


엠베딩으로 만든 벡터는 디비 같은데 모아놓아야 쓸 수가 있는데, 보통의 디비는 숫자나 문자열 기반으로 검색 인덱스를 만들게 되어 있어서 벡터 검색에는 활용이 어려운데, 벡터를 저장하고 검색할 수 있도록 하는 플러그인들이 존재함.