만든놈이 알려주는 업데이트된 하이파V2 설명/ 팁 모음

개념글 모음

알림 알림 중 알림 취소

구독자 2775명 알림수신 79명

각 채널의 개념글을 모은 게시판입니다.

AI 채팅 뉴스/팁 만든놈이 알려주는 업데이트된 하이파V2 설명/ 팁 모음

HyperBlaze456

추천 48 비추천 1 댓글 77 조회수 2146 작성일 2024-06-20 05:06:13 수정일 2024-06-20 06:05:27

https://arca.live/b/characterai/109286496

이전 념글

이제 리스 편입도 됐다, 기분 좋은 기념에 이것만 기대하던 챈럼들도 있어서 서둘러 글 씀.

잘써줘서 고마워!

하지만, 우리 불쌍한 뉴비들은 저 챈럼들이 뭔소리 하는지도 모르고 이것저것 만져보다 하이파V2를 제대로 못쓰고 있을수도 있음...

지금 쓰고 있는 챗부이들도 잘못 쓰고 있을 수 있음. 지금 이글 쓰는 놈은 맛있게 잼민이랑 저컨텍으로 바삭함의 끝판왕을 맛보고 있는데, 나는 잘 못쓰고 있고 눅눅하다면 꼴받지 않음?

그래서 왔다! 만든놈이 알려주는 하이파V2 동작원리랑 잘 쓰는법!

응애도 할 수 있게.. 라고 하면 조금 에반듯

0. 설마 이것도 모를까..?

아직도 모를리는 없을거 알지만, 혹시 모르니까 써준다.

이거 활성화 하려면 기타 봇 - 장기기억 - 타입 - 하이파메모리 V2로 설정해야 함.

이렇게 뜨는지는 확인하자

1. 하이파V2에서 사용되는 변수들

하이파V2는 최대 컨텍스트 길이, 하이파V2 청크 크기, 하이파V2 할당 토큰 길이 3가지의 숫자 변수와,

수파메모리 모델, 하이파메모리 모델 2개의 선택 가능한 변수와 요약(수파메모리) 프롬프트가 사용됨.

봇 눌렀을 때 채팅에서 하이파 또는 수파메모리 토글을 체크해야지 작동됨(웹버전이랑 로컬 tauri exe 이름이 다름). 발동되면 어떻게 작동되는지 알아보자.

참고로 이글은 처음부터 키고 시작할 경우를 예상하고 쓴 글임. 중간에 키면 그냥 한번에 요약한 뒤 이걸 반복하는데, 오래걸리니까 비추, 어짜피 먹을거면 미리미리 먹자. 이거 페르소나 차이 없음(자동으로 {{user}}, {{char}} 쓰는듯?)

프롬프트는 이거 개조임

이렇게 생김

[Instructions]- Let's step away from the Role-play for a moment.
Summarize what has happened so far( in (Time), (Location))- Be objective and factual.
Omit any explanations or interpretations.
- Write in past tense.
- Seperate them with two linebreaks.
- Follow the template below:
[ Title ]
Keywords: { Concrete keywords, such as things, topics, places, name, etc. Separate each with ; }
When: { Date, Time }
Where: { Location }
What happened: { Concrete events, conversations, and actions that actually happened. Do not miss any events or encounters. Include accurate, specific details. }
Key conversation: { Quote a conversation between {{char}} and {{user}} that was the most meaningful to {{char}}. }
Outcome: { A concrete change in {{char}}'s mind or state, or in the relationship between {{char}} and {{user}}. }

2. 하이파V2는 어떻게 요약하고 어떻게 저장할까?

리스는 토큰 수를 계산할때, 다음과 같은 순서로 총 토큰을 계산함.

먼저 프롬프트 토큰을 추가하고, 그다음에 캐릭터 카드를 집어넣은 뒤, 챗 기록이랑 로어북 추가한 뒤에, 하이파V2 할당 토큰 길이를 고정적으로 더함.

이제 챗 기록에 대한 설명이 필요함:

챗 기록은 0번부터 시작한다는 것을 알아주셈. 1번 챗은 좌측에서 두번째 위치에 있음.

0번 챗은 챗이 아니라, 여기에 하이파V2 메모리에서 전달된 시스템 프롬프트가 들어있음. 1번 챗부터 퍼메, 2번 챗부터 유저 입력 - 봇 출력임. 물론, 추후 알아보겠지만 퍼메도 요약되기에 후반부에는 퍼메도 로그에 보이지 않을거임.

참고로, 막 들어온 유저 인풋은 이미 챗 기록 맨 마지막에 포함되어 있음.

하이파V2는 이 총 토큰길이가 최대 컨텍스트 길이를 넘기면, 자동으로 요약을 시작함. 일단 메모리 정보가 들어있는 0번 챗을 날리면, 이제 챗 기록의 첫번째(0번)에는 채팅 로그가 존재함.

하이파V2는 로그의 앞부터 하이파V2 청크 크기를 넘기기 전까지 계속 챗을 넣어줌. 원본 챗 리스트에서는 삭제됨.

이건 요약된 챗 리스트고,

여기는 삭제된 챗 리스트임. 8개 전부 동일한 내용이고, 삭제된 챗 길이가 14개에서 22개가 됨.

이때, 청크 크기가 아무리 커도 마지막 뒤에 챗 2개는(유저 입력, 이전턴 봇 출력) 절대 요약되지 않음. 이걸 하면 제미니 기준 찐빠가 나고, 사오같은 것들도 잠깐동안 멍청해져서 이렇게 함.

이 챗을 청크에 넣는 반복문이 위에 설명한 두가지 이유로 끝나면, 이걸 바탕으로 요약을 진행함.

요약 프롬프트는 수파메모리 모델이 보조모델이거나 GPT instruct 3.5일때 시스템 프롬프트로 들어가고, 유저 인풋에 저 청크를 넣어서 요약을 진행하는 방법임. 로컬 모델은 프롬프트 안넣음.

이렇게 요약을 진행하게 되면, 이 값을 mainChunks라는 하이파V2 데이터 안에 있는 리스트의 가장 앞에 추가함. 동시에, 줄바꿈 문자가 두번 있는 걸 찾아서 자동으로 쪼개고, 이를 순서대로 chunks라는 리스트 가장 뒤에 추가함.

즉 mainChunks와 chunks의 순서는 서로 역순임. 이건 chunks의 내용만 봇 고급설정의 맨밑에 있는 여기에서 보이기 때문에 순서대로 보이려고 이렇게 한 것 같음. 사실 원본 코드는 mainChunks를 수정할 의미가 없게 만들어 놓아서 이렇게 이상한 순서임.

이때, 각 채팅은 고유한 id가 있는데, mainChunks와 chunks 하이파V2청크에 추가된 마지막 챗의 id를 그대로 계승받고 가지게 됨.

즉, 요약된 부분까지의 챗 id를 가진다는 것임.

mainChunks는 서로 겹치지 않음.

mainChunks는 양이 많고 긴 반면에, chunks는 잘게 쪼개져 있음.

3. 반환되는 값은 그래서 뭐임..?

하이파메모리V2가 반환하는 값은 결국 채팅에 들어감.

2. 에서 언급된것처럼, 하이파V2에서 mainChunks와 chunks로 무언갈 해 결국 채팅 리스트의 맨 앞에 xml 태그로 감싼 메모리라는걸 알려주는 시스템 프롬프트를 넣어주는거임. 이게 핵심.

일단, 두가지의 xml 태그가 있음. <Past event summary></...>와 <Past event details></...>. 앞에 있는 event summary는 mainChunks의 내용이 들어가고, event details 안에는 chunks의 내용이 들어감.

event summary 안에 어떻게 mainChunks의 내용을 넣는지 봐보겠슴:

먼저, mainPrompt라는 내부의 변수가 하나 있음. 이 변수에 가장 앞 mainChunks 값을 추가하고, 하나씩 하나씩 뒤로 넘어가면서 이 변수가 차지하는 토큰의 수가 하이파V2에 할당된 토큰의 절반까지 채워짐.

나머지 남은 할당된 토큰 길이는, chunks의 텍스트를 하이파모델을 이용해서 전부 384개 차원 벡터로 변환되고

(모델따라 다르긴 함), 최근 3개의 챗과의 유사도를 측정해서 높은 순으로 나열된 리스트에서 꽉 찰때까지 계속 추가됨. 이거는 chunkResultPrompts에 추가됨

이때, 아까전 위에서 채팅의 Id를 언급했는데, 이게 여기에 쓰이는거임. mainPrompts에 이미 있는 내용이 chunkResultPrompts에 추가되면, 돈만 빠지고 아무 의미없음.

그래서, 채팅 Id를 이용해 유사도를 측정하는 chunks들은 mainPrompts에 있는 내용보다 오래된 것들만 가지고 비교함.

이렇게 older chunks에 들어가있다면 이거랑 최근 3개 채팅의 유사도를 비교해서 가져오고,

이렇게 두개를 이용해서 가장 앞에 다시 추가하는거임.

저 0번이 수파메모리임.

수파메모리 내용

""<Past Events Summary>## Hye-jin's Meeting with a Potential Partner Keywords: { Hye-jin; Partner; Meeting; Collaboration; Smart Wearable Tech; Designer; Prototype; OEMs }When: { 2023-10-17; 17:50 }Where: { Top floor, luxury office building, private meeting room }What happened: Hye-jin met with a potential partner who claimed his company was running "almost automatically" and had the resources to quickly find manufacturers and designers. He offered to create a prototype for their first smart wearable tech within a week. Hye-jin was intrigued by this offer and challenged him to prove his company's capabilities by delivering an exclusive prototype in a week. She also brought up her lead designer who would be involved in this project and had a meeting scheduled for the following morning. Key conversation: "Since you seem so confident, let's test those capabilities right away. I want an exclusive prototype of our first smart wearable tech within a week. Something that screams both sophistication and cutting-edge technology. Can your automated empire manage that?" - Hye-jin Outcome: Hye-jin decided to test the capabilities of this potential partner and scheduled a meeting with her designer for the following morning. ## Hye-jin's EncounterKeywords: { Hye-jin ; Contract ; Data ; Manufacturing ; Chanstagram ; OEM ; Endorsement ; Skincare ; Fashion ; Smart Tech }When: { 2023-10-17 ; 17:25 - 17:45 }Where: { Top floor, luxury office building, private meeting room }What happened: { Hye-jin met with a representative of a data company interested in expanding into manufacturing. The company wanted to acquire OEMs to gain expertise. Hye-jin was intrigued by their success with Chanstagram, their top client, and their strategy. She proposed an endorsement deal and gave her input on potential products: luxury skincare, exclusive fashion, and smart tech. The representative agreed and offered her complete creative control over the contract. Hye-jin started filling out the contract, dictating terms regarding endorsement fees, profit shares, and exclusivity. She expressed her confidence in her ability to make the venture a success. }Key conversation: {{user}}: "Sure, these are all able to start on manufacturing next week."{{user}}: "Here, this is the contract. It's all empty, and you will fill it out accordingly, as you think."{{user}}: "I'm not here to judge, it's your choice." {{char}}: "You’re smarter than you look, allowing me this kind of control. I can make sure this collaboration benefits us both immensely." Outcome: { Hye-jin began to see the potential for a mutually beneficial partnership, starting to believe that this venture could be significantly more lucrative and powerful than she anticipated, giving her access to valuable resources and unprecedented influence. She felt in control of the situation and actively began to shape the collaboration to her advantage. } </Past Events Summary><Past Events Details>t: Key conversation: { "Alright, I'll admit it," she said, crossing her arms. "This is impressive. But I'm still not easily convinced. What exactly does your company do that's so groundbreaking?" } Outcome: { Hye-jin's initial skepticism gave way to curiosity, and she expressed a willingness to be convinced by the user's company. }t: ## Hye-Jin's Encountert: Keywords: { Hye-jin; company founder; Gangnam Street; luxury boutique; office building; top floor; conference room }When: { 2023-10-17, 16:20 - 17:20 }Where: { Gangnam Street; luxury boutique; office building; top floor; conference room }What happened: { Hye-jin initially dismissed the user, but was intrigued by his claim of being a company founder. She agreed to be shown the company, accompanied the user to a luxurious office building, and eventually reached the top floor. }</Past Events Details>""

4. 그래서 하이파V2 데이터 어케 수정함

여기까지 문제없이 따라왔다면 이미 어느정도 알거라 생각함.

봇의 고급 설정 맨 밑으로 쭉 내리면 에셋 밑에 하이파메모리V2 Data를 누르면, chunks 안의 내용이 들어있음.

누르면 밑에있는게 나옴

사실 청크를 완전히 지우는 기능이 아직 없슴.. 일단, 여기서 벡터 유사도로 가져와지는 chunks를 수정할 수 있다는 것만 알아두셈..

밑으로 스크롤 내리면 추가할 수 있음, 근데 이것도 비추, 왜냐하면 mainChunks랑 순서 대조가 불가능해 retrieval이 안될거임.

다음 업데이트는 요걸 조금 손봐보겠음, 근데 나 곧 2주정도 여행가서 못할듯.. 이건 리스 개발자가 해줄거라 믿음

5. 자잘한 팁들

이전에 계속 스스로 굴린 떡밥들이 잔뜩이라서, 리스 편입만을 기다린 챗붕이들 여럿 있다는걸 암.

우효ww 저컨텍 잼민이는 신이라는ww

하지만, 막상 본인이 쓴 광고글에는 이 하이파V2를 어떻게 써야지 저컨텍으로 맛있게 즐기는 방법을 전혀 써놓지 않았음..

그래서, 당장 알려주러 간다!! 저컨텍의 시대가 도래했으니..!

5-1. 저컨텍 하이파V2로 즐기는 법

일단, 채팅 봇 설정을 헐레벌떡 달려가서 이걸

처럼 님이 원하는 컨텍스트로 줄이면 됨, 이때, 기준은 밑에 설명해줌.

Q. 내봇은 토큰돼지인데요? 5000 토큰인데요?

이것도 해결해줄거임, 이 기준 보고 따라하면 됨.

일단, 내가 사용하는 봇이 평균적으로 먹는(로어북, 프롬프트 토큰까지 다 합치셈) 토큰 수를 구하셈.

임의로 총합 3700토큰 정도라고 가정해보겠음. 이제, 하이파V2 설정에 가서 이 두개를 봐보자

여기 안 값은 기본적으로는 3000, 3000임.

일단, 아까전 위에서 더한 토큰 수에(예시에서는 3700) 할당 토큰이랑 청크 크기를 합쳐서 계산해보셈.

그럼 여기선 7700, 이정도면 8192정도로 땡겨주는게 좋음.

이게 왜 이렇게 되냐면, 위에서 설명했듯 요약 시작은 실제 컨텍스트가(봇+로어북+프롬프트+채팅로그)

8192 - (할당 토큰) 를 넘길때 시작됨.

그럼 이제 여기 예시에서는 6192 토큰을 텅 빈 상태에서 요약 없이 쓸 수 있음. 근데, 여기서 채팅이 먹을 수 있는 토큰은

6192 - 3700 = 2492, 청크 크기보다 492 토큰 더 크고, 이정도면 왔다갔다 6번-8번 정도 할 수 있음(CoT 기준)

한 500 토큰정도면 내 입력이랑 봇 출력 하나정도 됨(CoT 켰을때). 청크 크기 안에 채팅들이 들어가니까, 컨텍스트를 넘겨서 요약되면 마지막 두-세개 채팅정도는 요약되지 않고 남을거임. 이게 가장 좋은 것 같음.

즉, 최적의 컨텍스트 길이는 각자 선택할 청크 크기와 할당 토큰, 내가 요약하기 전까지 몇번 봇이랑 주고받을건지에 따라서 달라짐. 갠적으로 할당 토큰은 1200 이상이 좋고, 청크 크기는 상관없긴 하지만 위에서 말했듯 순수 채팅이 먹을 수 있는 토큰 수보다 300-500 정도 낮은 값으로 잡아주는게 안정적임.

5-2. 한입한출은 하이파 V2가능함?

이론상 가능은 한게, 일단 요약 프롬프트를 잘 조정해서 요약된 값들도 영어, CoT도 영어면 가능은 함. 유사도를 측정해서 가져오긴 할거임.

하지만, 지금 현재 리스에 있는 모델들은 애초부터 영어를 잘 지원하는 임베딩 모델임. 한글 성능은 믿지 않는게 좋을거임.

이 챈럼 글에 따르면, 로컬로 한국어 되는 임베딩 모델을 갈구는 방법도 있긴 하지만, 이건 너무 어려우니까..

nomic이 MiniLM보다 성능은 좋지만, 시간은 조금 오래걸릴거임.

그냥 아직까진 영챗하자..

이 글 쓰기 진짜 오래 걸린다.. 이래서 A to Z 가이드 업데이트가 오래걸리는구나..

아무튼, 이제 하이파V2 원리랑 잘 사용하는 팁을 알았으니까, 이제 지갑도 살리고 바삭바삭함, 와이푸 치매도 해결하며 즐거운 챗들 하시길! 오늘도 챗붕이들 사랑해요

참고: 지금 일러스트를 나중에 여기에 추가할까 생각중임.. 인터넷에서 그림 하나 그려와서 추가할까 고민중..

핑프 환영이고, 뭔가 오류나 질문 있으면 달아주셈

+ 추가:

기존 수파/하이파/하느라이와의 비교

수파는 계속 요약하는 방법이었음. 시간이 지날수록 정보의 양이 많이 잃게 되었음.

하이파는 벡터 임베딩으로 가져와지는 수파메모리 데이터의 정확도를 올렸지만, 여전히 재요약이 있었음.

하느라이는 오로지 벡터 임베딩만으로 요약하지 않은 이전 채팅을 가져옴.

이 하이파V2는 재요약이 없어서 임베딩 모델의 성능만 받쳐주면 사실 완벽한 수파메모리의 형태임. 단, 시간이 오래걸림. 나중에 갈수록 굉장히 번거롭고 webGPU를 사용해야 하는 참사가 일어날 수도 있음.

너무 긴 챗 로그에서는 느릴 거임.

댓글 [77]

ㅇoㅇ

2024-06-20 05:09:28

한달차 늒네 이제서야 하이퍼메모리 쓰는법 알았다 개추

펼쳐보기▼

HyperBlaze456

2024-06-20 05:22:44

바꼈잖아 모두가 늒네라고

펼쳐보기▼

늑대인간

2024-06-20 05:10:15

일단 이런 팁글은 헐레벌떡 내려서 추천부터 박고 정독

펼쳐보기▼

도리

2024-06-20 05:10:56

대단하다 진짜

펼쳐보기▼

HyperBlaze456

2024-06-20 05:24:10

이제 챗챈 그만봐야 할듯.. 매일매일 두세개 이상 글을 써대니까 중독돼서 개발일지 모음집 되버림

펼쳐보기▼

냥투미

2024-06-20 05:11:29

주숭

2024-06-20 05:12:22

청크 지우는 기능이 없어서 결국 채팅내역 json으로 뺀뒤 수동으로 날렸음...

펼쳐보기▼

주숭

2024-06-20 05:12:27

HyperBlaze456

2024-06-20 05:22:02

무조건 수정할 기능임..

펼쳐보기▼

HyperBlaze456

2024-06-20 05:22:28

간단하게 수정할 부분은 일단 과거 채팅이 완전히 삭제되면 그걸 기준으로 위쪽 청크를 날리는걸 생각중임

펼쳐보기▼

주숭

2024-06-20 05:23:47

치마킨요

2024-06-20 05:12:41

크크큭 이런글에는 개추가 최고야

펼쳐보기▼

HyperBlaze456

2024-06-20 05:28:13

국산라쿤

2024-06-20 05:14:19

tirafra

2024-06-20 05:15:06

HyperBlaze456

2024-06-20 05:33:08

샤룬

2024-06-20 05:15:09

pc 앱 리스로 어제부터 계속 시도하고 있는데 Summarization failed multiple times. Aborting to prevent infinite loop. 이 오류때문에 골치 썩는중... 심지어 검색도 안나와 어흑...

펼쳐보기▼

국산라쿤

2024-06-20 05:15:18

샤룬

2024-06-20 05:15:31

HyperBlaze456

2024-06-20 05:23:23

그거 완전 의도된 오류임..
혹시 쿰질 로그임? 모델에 따라서 검열걸리면(특히 젬플래시)는 빈응답 띄울때 무한 루프가 걸려서, 그걸 막기 위해서 한거임

펼쳐보기▼

샤룬

2024-06-20 05:27:12

진행중 로그고 쿰질하던 로그이긴 한데... 어제 했던 처음부터 한 로그에도 걸린거 같아서. 혹시 하이파v2는 쿰에는 안맞나?

펼쳐보기▼

HyperBlaze456

2024-06-20 05:33:52

ㄴㄴ, 보조 모델 차이임.
3.5 instruct는 허벌이라서 해달라는데로 다 해주는데, 플래시는 너무 하드하면 빈응답 띄워줌.
그게 아예 비어버리는것보단 나음

펼쳐보기▼

샤룬

2024-06-20 05:34:23

엣 나 3.5 인스트럭트인데 한챗이라 그런가. 한챈에도 영어로 변환해달라는거 넣어두긴 했는데

펼쳐보기▼

HyperBlaze456

2024-06-20 05:35:43

흠.. 이건 내가 저 프롬 제작자랑 의논을 해봐야겠네.
확실히, 이전 하이파V2는 사용하려는 목적이 아니어서 쿰질로그에 대응할 방법이 없었지만, 이번에는 프롬이 있으니 어떻게 해볼 순 있을듯

펼쳐보기▼

샤룬

2024-06-20 05:36:15

일단 기다리고 있을게...! 아니면 다음 새챗도 아애 처음부터 해봐야겠음

펼쳐보기▼

국산라쿤

2024-06-20 06:36:21

RangeError: Range consisting of offset and length are out of bounds

이건 무슨 오류인지 알 수 있음까

근데 난 저거 아마 아이네 프롬으로 로페즈 형제한테 케이크 받는 퍼메로 저컨텍 테스트해본다고 한입한출 대화하다 떴던걸로 기억, 그나마 성적인 설정이면 페르소나에 마조설정 넣어둔거 정도 있었나 이것저것 시도는 했던거같은데 오류로 초반에 막혀서 쿰엔 안써봄

펼쳐보기▼

HyperBlaze456

2024-06-20 06:39:26

고건 뭔가 리스트 길이 문제인데, 뭐가 잘못됐는지 정확하겐 모르겠슴. 어디 과정에서 발생한건지 모르니까..

펼쳐보기▼

국산라쿤

2024-06-20 07:28:40

다행히 리수 새로고침하니까 사라졌음! 그리고 위에 요약 오류도 보조모델에 에우리알레빼고 위자드 넣으니까 해결됨 ㅇㅇ

펼쳐보기▼

slan

2024-06-20 05:15:22

Lorem_Ipsum

2024-06-20 05:15:41

N년차 뉴비 새로운 지식 알아가욧!!

펼쳐보기▼

HyperBlaze456

2024-06-20 05:24:36

시아리아

2024-06-20 05:21:37

고oo

2024-06-20 05:24:45

*수정됨

여기 있는 프롬은 하이파 수파 프롬 맞지?

펼쳐보기▼

HyperBlaze456

2024-06-20 05:25:02

ㅇㅇ 요약 프롬프트에 \n\n 사용하세요 넣은 프롬프트임

펼쳐보기▼

sorrowsnow

2024-06-20 05:26:22

(이해하지 못했다.)

펼쳐보기▼

HyperBlaze456

2024-06-20 05:28:01

sorrowsnow

2024-06-20 05:28:16

나는... 능이버섯이다...

펼쳐보기▼

tresbien

2024-06-20 17:11:59

버섯... 마싯따...

펼쳐보기▼

sorrowsnow

2024-06-20 17:12:17

히익... 먹힌다...

펼쳐보기▼

라푸카나바

2024-06-20 05:26:41

plu

2024-06-20 05:29:07

잘 모르겠지만 대단한 것 같아
일단 박치기 해봄

펼쳐보기▼

HyperBlaze456

2024-06-20 05:29:25

안되면 4시 전까지 연락하면 바로 받아줄게

펼쳐보기▼

jaehyun977

2024-06-20 05:38:26

RISU에 편입된거로 쓰면 되는거지? 와이푸가 옷 색도 기억하는거보면 잘되는거 같음!

펼쳐보기▼

HyperBlaze456

2024-06-20 05:38:56

우헤헤
저 프롬이 상태창에 적힌것도 제대로 잘 가져오더라고
천천히 더 업그레이드 해봐야지..

펼쳐보기▼

Dekamik

2024-06-20 05:42:26

와 챗질 1년만에 드디어 내가 꿈꿔왔던 장기기억 시스템이 나왔네 진짜 고맙다

펼쳐보기▼

Dekamik

2024-06-20 05:43:23

근데 생각해보니까 지금 하이파에 있는 내용은 호환 안되려나 뭔가 좀 아쉽네

펼쳐보기▼

HyperBlaze456

2024-06-20 05:43:51

따흐흑 미안해요
아이디어 확인

펼쳐보기▼

모올루

2024-06-20 05:48:09

우우 땨땨이 이런거 몰루..... 아예 openai 임베딩 모델 써보는 것도 좋을듯 그것도 리스 코드엔 있는데 선택지는 없는 걸로 암

펼쳐보기▼

HyperBlaze456

2024-06-20 05:48:46

선택지 여기에 추가해둠
그리고 님이 모르면 어떡해요.. 님이 제일 잘알잖아.. 모르는척 하지 말라고..

펼쳐보기▼

모올루

2024-06-20 06:00:30

그럼 openai 써볼 만하다고 생각함 유료지만 한국어도 되고 성능도 bge-m3보다 좋을 거임
가격도 싸다고 본 거 같은데 전 완전 무료인 bge-m3로 테스트 한 거였음ㅋㅋ

펼쳐보기▼

HyperBlaze456

2024-06-20 06:01:13

나중 업데이트는 가장 최신거인 text-embedding-large 3 지원하는 방향으로 추진해보겠음

펼쳐보기▼

모올루

2024-06-20 06:02:05

직접 써보란 건 아니고 openai 임베딩이 리스에 없던 선택지라 알려지면 좋을 거 같다는 생각

펼쳐보기▼

Malrang

2024-06-20 05:57:55

혹시 리롤할때 생기는 문제는 없을까?

펼쳐보기▼

HyperBlaze456

2024-06-20 05:58:17

*수정됨

리롤은 챗 id가 안변해서 괜찮은데, 채팅 삭제시에는 문제가 있음
+ 리롤 하기 전에 이미 메모리가 생기면 업데이트 안됨..

펼쳐보기▼

Malrang

2024-06-20 05:58:45

리롤이 챗 삭제하고 다시 답변받는거 아님?

펼쳐보기▼

HyperBlaze456

2024-06-20 05:59:47

같은 챗에 그대로 들어가는 것 같았음. 일단 큰 오류는 없었음

펼쳐보기▼

Malrang

2024-06-20 06:00:29

캬 주말에 맛있게 먹어볼게

펼쳐보기▼

ㅇㅇ

2024-06-20 06:21:23

중간부터 무슨말인지 모르겠다ㅋㅋㅋㅋㅋ누가 실전예제 "해줘"

펼쳐보기▼

HyperBlaze456

2024-06-20 06:34:31

아니 해줬잖아..

펼쳐보기▼

ㅇㅇ

2024-06-20 06:58:32

원리는 이해안가니까 어떻게사용하는지랑 주의사항만 익혀야겠다
1. 저기설정에서 하이파데이터를 수정할수있다. 가끔 들어가서 데이터를 확인하면 좋다
2. 리롤은 괜찮은데 함부로 삭제하면 안된다
3. 할당 토큰은 1200 이상, 청크 크기는 많으면 좋은데 챗내역 토큰 수보다 300-500 정도 낮은게 최적

이렇게 사용하면 됨?

펼쳐보기▼

HyperBlaze456

2024-06-20 06:58:51

ㅇㅇ

펼쳐보기▼

ㅇㅇ

2024-06-20 06:59:49

네리모르

2024-06-20 06:28:07

하이파에 할당된 토큰의 절반은 간단한 요약, 나머지 절반은 디테일한 요약을 할당하고
그 내용들은 현재 진행중인 최근의 인풋 및 아웃풋과 가장 유사한걸 가지고 온다..??
맞음?

펼쳐보기▼

HyperBlaze456

2024-06-20 06:33:07

얼추맞는듯.
할당된 토큰의 절반은 완전한 요약이고, 나머지 절반은 쪼개진 요약본 중에서도 유사도가 높은거 가져온다는 거. 두개는 겹치지 않고 유사도는 오래된거 가져오는거임

펼쳐보기▼

네리모르

2024-06-20 06:36:39

흠 생각보다 토큰 할당 많이 해야겠네 고맙읍니다

펼쳐보기▼

jaehyun977

2024-06-20 08:08:21

쓰다보니 컨택이 좀 많이 길어지면 하이파로 가져온 내용에 좀 과하게 영향을 받기는 함. 정확도는 높아지는데 창의성은 조금 준다는 느낌? 오푸스면 딱 좋음. 사오면 좀 딱딱한거 같음. 근데 이건 4o모델 문제 같네

펼쳐보기▼

kixerfx

2024-06-20 11:18:02

chunk와 mainchunk의 차이가 뭔지 더 자세하게 설명해줄수 있어..?

펼쳐보기▼

HyperBlaze456

2024-06-20 13:39:07

*수정됨

쪼개진거랑 안쪼개진거 차이가 전부. 쪼개는 기준은 줄바꿈 문자 두개임
물론 실제로 가져와서 반환되는 값에 mainChunks는 최근거, chunks는 옛날거 가져온다는 차이점 있음

펼쳐보기▼

지나가던얼굴

2024-06-20 22:08:56

내가 최대 13500토큰을 쓰는데 하이파2 할당 토큰이 2000이고 주로 쓰는봇이 예시처럼 봇설명 로어북 글노 포함 3700토큰가량 되면 
대충 청크크기 7000에 할당 토큰 2000하면 된다는걸로 이해했는데 맞는거심?..

펼쳐보기▼

HyperBlaze456

2024-06-20 22:18:51

머 느낌은 맞는데 그냥들어갈 챗 기록 생각해보면 청크크기 5000대로 맞추는게 좋지 않을까. 나중에 계산기 만들어올게

펼쳐보기▼

지나가던얼굴

2024-06-20 23:06:10

ㅇㅇ

2024-06-23 13:01:08

*수정됨

매번 하이파 수파 다찾아봐도 잘안되는거 같아서 포기하다가 버텍스 소넷 넣고 보조 제미니 플래쉬로 해서 잘 되서 좋네. 
근데 이미지 생성모듈 쓰면 고장나는것 같음. 챈산 nai 이미지 생성 모듈 쓰면 단부루 태그로 요약해서 프롬만들어주는데 그거때문인지는 몰라도 입력을 넣어도 계속 퍼메 관련된 내용만 내뱉음. 안쓸때만 하이파 쓰면되지만 아쉽긴해서 ㅋㅋ 암튼 좋은 기능 ㄳㄳ

펼쳐보기▼

HyperBlaze456

2024-06-23 14:39:01

태그때문에 청크가 ㅈ됐나보네.. 이건 귀하다 알겟슴

펼쳐보기▼

신스

2024-06-24 09:57:26

청크크기 계산중인데, 왔다갔다 6-8번이라는게 무슨 의미인가요?

펼쳐보기▼

HyperBlaze456

2024-06-24 13:34:03

내 입력 - 봇 출력 1개가 왔다갔다입니다

펼쳐보기▼

신스

2024-06-24 14:01:20

아 그럼 6-8번 대화후 하이파 키고, 그다음 또 6-8번 대화하고 하이파 키고 그런 구조군요

펼쳐보기▼

HyperBlaze456

2024-06-24 14:01:40

ㄴㄴ 계속 키면 알아서 그때그때 요약되는거입니다

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 AI 채팅 채널

최근 최근 방문 채널

최근 방문 채널

전체

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 32136040

3021551 붕괴 스타레일 절대 망할 수 없는 반디 갑옷 떴냐????????????????? [25]

ajdiei 2시간전 1047 27

3021550 유머 유머 이게 유머가 아닐 수가 없다 [36]

네롱쓰 1시간전 2704 30

3021549 붕괴 스타레일 반디가 정실...?잘 모르겠던데 [40]

파워 28분전 1337 61

3021548 버츄얼 유튜버 홍보/광고 물리학 전문 버츄얼 유튜버 <BRAKET> 첫 방송

Spartan117 3시간전 147 5

3021547 트릭컬 RE:VIVE 공략&연구 앵커 vs 빙고 비교 [8]

당근 1시간전 424 13

3021546 유희왕 🎨창작 이번 마듀 금제 낙서 [8]

ckhd 39분전 215 15

3021545 리버스 1999 번역 버틴은 소네트의 칭찬에 약하다 2탄 [13]

소네트단 06-24 235 10

3021544 붕괴3rd 그래도 붕챈에서 붕괴 얘기 나와서 기쁜 키붕이면 개추 [15]

ㅇㅇ 30분전 308 16

3021543 타워 오브 판타지 앙카 수영복 360도 [30]

React 3시간전 243 8

3021542 에픽세븐 애미뒤진바나나따개들아카링크달앗노 ㅋㅋ [9]

ㅇㅇ 6시간전 381 11

3021541 요리 제과제빵 호두파이 만들어 보았습니다! [8]

머그컵D 1시간전 54 6

3021540 로보토미 코퍼레이션 🖼짤 분위기 ㅈ되는 탁류 [9]

죽나장사랑해 15시간전 864 16

3021539 붕괴 스타레일 애정이랑 사랑을 잘 구분했으면 이런 일이 없었을텐데 [51]

우주의딸 34분전 1331 50

3021538 나이트 워커 조문 왔다가 가는데 여러분 그거 하나만 명심하십쇼 [21]

레너드 34분전 487 19

3021537 원신 스포 5.0에 나온다는 캐들 [31]

자는또낳으면되는데챠 1시간전 1281 18

3021536 트릭컬 RE:VIVE 🖼️ 짤 뚜따야 [9]

극작가로르드 1시간전 277 17

3021535 붕괴3rd 또 이상하게 퍼지네 [33]

ㅇㅇ 36분전 807 24

3021534 정액 관련 페티쉬 자유 딱 10번 싸는 영상 [15]

제제 5시간전 223 12

3021533 블루 아카이브 이정도했음 념글 보내줄수 있어?? [24]

유토리_나츠 43분전 851 53

3021532 카운터사이드 일단 스케치 끝내긴 했는데 [15]

No_ri 43분전 283 15

3021531 AI 채팅 로어북 {{CHAR}}의 경제상황을 알아보자 [6]

MADVILLAIN 4시간전 177 12

3021530 페르소나5 더 팬텀 X 오피셜 1.4 버전 업데이트 내용 (중섭) [20]

메로페 1시간전 486 15

3021529 카운터사이드 뭣? 서킷 끝나버렸다고? [31]

라비 52분전 253 16

3021528 기타 💸 기추 어제 있었던 기타 스와핑(?) 사건의 가해자입니다 [11]

ㅇㅇ (211.234) 47분전 103 9

3021527 허니셀렉트 잡담💬 나거한에서 필수인 음성녹음 설정해라 허붕이들 [12]

불의를보면참음 7시간전 174 7

3021526 리버스 1999 정보/공략 6성 야수 조 스킬 정보 [1]

하와와후타여고생쟝 2시간전 152 9

3021525 버츄얼 유튜버 창작 무너숙회 [1]

252eyo 18시간전 65 5

3021524 블루 아카이브 🔞 번역 복구) 보너스로 뭐든 해주는 아루 / 드아코 찌찌 낙서 [10]

CnC 1시간전 1237 43

3021523 스노우 브레이크 캐시아 복각했으면 이걸 올려야지 [8]

발리어드 1시간전 182 10

3021522 원신 정보 중국 스피드런 대회 캐릭터별 벤픽/승률 통계 [45]

ㅇㅇ 1시간전 1335 14

전체글 AI 채팅 채널

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.