개념글 모음

1. 이 시리즈의 소개


지금까지 챈에 종종 프롬 관련 잡팁들을 올려왔는데, AI챗에 여전히 유효하고 유용할 내용들도 시간이 흐르며 묻히거나 잊혀지곤 했다.


어짜피 앞으로도 팁은 생각날때마다 계속 쓸거니, 지식의 유실을 방지하기 위해 이제부터 쓸 글들은 정리할 수 있는건 시리즈로서 정리하고자 한다.


일단 이 시리즈 제목에서 말하는 '프롬프팅' 이란 이른바 '메인프롬'을 작성하는 것을 의미하는 협의의 프롬프팅을 의미하지 않는다. 그보다는 AI와 다양한 지시와 정보로 소통하는 광의의 프롬프팅 측면에 가깝다. 


또한, 사무용이나 Q&A용 프롬프팅보다는 챈의 취지에 맞게 RP나 유관 활용들 관련 프롬프팅에 집중될거다.


그냥 생각날때마다 하나씩 올릴거이므로, 4편을 1~3편을 안 읽고 읽는다거나 하는 식으로 순서 상관없이 읽어도 무방하다.


2. 이번에 다룰 것: " "와 “ ”의 차이


이 두 큰따옴표는 인간이 보기엔 미관상 차이를 제외하면 별다른 차이가 없다. 하지만 현재의 AI들은 텍스트를 토큰으로 쪼개서 인식하기에, 두 큰따옴표에 다른 토큰값이 할당된다.


토큰값이 달라지면 자연스럽게 해당 토큰값이 샘플링하는 텍스트들도 달라진다. 그런고로 " "와 “ ”를 퍼메에 넣거나 유저가 입력할시에, 용도나 목적에 맞게 잘 선택하는게 좋다.


그래서 구체적으로 어떤 차이가 있을까?


AI들은 자신들이 학습한 방대한 양의 텍스트를 기반으로 자신이 내뱉어야 하는 다음 텍스트가 무엇인지 예측한다. 즉, 유저의 인풋 중에서, AI의 학습 데이터중 특정 부분과 일치하는 부분이 있을 경우, AI는 데이터셋의 그 특정 부분의 다음에 이어지는 부분을, 유저의 리퀘스트에 대한 리스폰스에서도 유사하게 인용할 가능성이 높다. 그렇기에 유저 인풋의 경향성을 조절함으로써 AI가 참조할 데이터셋의 범위에 영향을 줄수 있는데, 따옴표 선택도 이와 깊이 연관된다.


대사를 감싸는 같은 큰따옴표일지라도, “ ”는 주로 문어체의 진중한 글에서 자주 활용되고, " "는 상대적으로 비격식적인 곳에서, 그리고 더 범용적으로 활용되는 경향이 있다. 그렇기에 퍼메나 인풋에서 “ ”를 쓸 경우 AI가 상대적으로 더 문어체적이고 딱딱한 아웃풋을 작성할 가능성이 높은 것이다. 


AI챗에 많이 쓰이는 번역기중 하나인 구글 번역기에서 "뭐시기뭐시기" 라고 치고 영어로 번역하면 큰따옴표가 자동으로 “ ”로 잘 바뀐다. 더 정밀한 인풋 컨트롤을 위해서는 그냥 자동으로 바뀐대로 입력하던 이런 따옴표도 더 신경쓸 필요가 있다.


3. 구체적 차이의 사례들


퍼메가 공백일 경우에 봇에게 먼저 말을 거는 경우를 가정해 보자. 이 때는 유저의 첫 인풋의 경향성이 AI의 다음 대답의 스타일을 크게 좌우하는데, 큰따옴표도 마찬가지다.


아래 예시들은 AI가 실제로 공백퍼메 이후 유저의 인풋에 대해 했던 출력의 일부를 번역하고, 예시에 쓸만하게 좀 변형한 것들이다.


---


(예시 A)

- User: “밥 먹었어?”

- Assistant: 불빛이 희미하게 켜진 생활감이라곤 없는 방 안, 짙게 깔린 우울 속에서 뒹굴던 <char>은 오래토록 감고 있던 눈을 그제서야 떴다.


“밥 먹었어?”


정적 속을 낯선 손님처럼 헤집고 들어온 <user>의 목소리. 거기에 담겨 있던건 인간 사회에서는 당연히 주거니받거니 하는 식사 안부였지만, 식음을 거의 전폐한지 오래인 <char>에겐 당연하지 않은, 낯선 것이었다.


“아니. 아직 안 먹었어.”


이렇게야 자신을 오래 알고 지내고서도 주기적 섭식 행위가 자신에게 낯선 것임을 모르냐는, 은근한 비난이, 그 퉁명스러움에는 섞여 있었다.


(예시 B)

- User: "밥 먹었어?"

- Assistant: "아니, 아직 안 먹었어."


<char>은 <user>의 물음에 퉁명스럽게 답했다. 그것도 그냥 안 먹은게 아니라 우울증에서 비롯된 거식증 때문에 오래 안 먹었다. 지금껏 별 신경 안쓰다가 이제와서 그걸 물어보는 의도가 무엇인지, <char>은 다소 불안해졌다.


---


이렇듯, 두 따옴표간에 샘플링 차이로 인해 아웃풋의분위기가 다르다. A의 경우 “ ”가 소설을 샘플링했는지 구조가 이것저것 묘사를 하면서 소설적이고, B의 경우 " "의 덜 격식적인 성향이 반영된건지 구조가 캐릭터의 정서와 반응 위주로 티키타카 RP 스타일이다.


원하는 스타일이나 메인프롬에서 지정한 세션 목적과의 일치 여부에 따라, 일반 큰따옴표를 사용할지 특문 큰따옴표를 사용할지 선택하면 된다.


모델의 성향에 따라서도 사용을 주의할 필요도 있다. 예를 들자면, 문어체 성향이 강한 GPT의 경우 일반 큰따옴표가 아니라 “ ”의 사용이 문어체 성향을 더욱 증폭시킬수도 있다. “ ”때문에 덩달아 격식있는 글에서 자주 쓰이는 엠대쉬가 증가하거나, 태피스트리 심포니 류의 표현이 늘어날수도 있다.


그렇기에 난 클로드같이 영미권 인터넷소설 스타일의 간결미가 있는 모델에는, “ ”를 필요할 경우에 한정적으로 투입함으로써 간결한 묘사를 더 자세하게 만드는 등의 활용이 가능하지만, GPT계열 모델에는 장황함을 초래할 수 있는 “ ”보다는 " "이 훨씬 권장된다고 생각한다. 메인프롬과의 조화나 각자 쓰는 봇 스타일에 따라서 다르니, 절대적인 건 아니다.


4. 요약

- 특수문자 큰따옴표와 일반 따옴표는 AI에게는 서로 다른 토큰으로 인식되기에, 샘플링이 다르게 될 수 있다. 특문은 좀 더 딱딱한 텍스트, 일반 따옴표는 더 일반적인 텍스트를 샘플링할수 있다.

- 그렇기에 개인의 취향이나 용도에 맞춰서, 대사 입력때 사용할 큰따옴표의 종류를 적절히 취사선택하는게 좋다.