종합 속보

사오가 반복 경향이 심한 것은 아무래도 데이터셋의 부족과 '보편적 응답'의 확률을 높게 책정해서 그런 것으로 보인다.

https://arca.live/b/characterai/106301426

이 탈옥 실험글을 보면 알겠지만, 하나의 지문에 응답 내용이 대개 비슷한 구성으로 나오는 것을 볼 수 있다.

기존 모델들도 비슷한 경향을 보이긴 했으나, 대사가 달라지거나 내용이 달라지는 등의 소소한 차이를 보여준 것에 비해, 사오는 데이터가 적은지 척 봐도 그대로 재활용 한 듯한 느낌의 문장이 가득하다.

그렇게 봤을 때 여태 사오가 반복 경향이 심한 것은 참고자료가 부족(과거 채팅 밖에 없음)해서일 뿐, 참고자료를 기반으로 재구성하거나 아예 새로운 걸 만들라고 하면 잘 해주는 것이 그 반증이다.

그래서 cot를 쓰면 능동적인 것 처럼 보이는 것 뿐이다. 물론 효과가 좋은 것은 맞지만.

그리고 하드 검열이랑 소프트 검열을 분간하는 법을 잘 모르는 채붕이도 있는 거 같아서 말해보는데, 하드 검열은 거부 응답으로 바로 알 수 있는 반면에.

소프트 검열은 문장 구조만 봐도 이게 소프트 검열인지 바로 알 수가 있다.

특히 기존의 문체(감귤청의 경우 쓸데없는 묘사 제거한 담백한 문체)를 씹고 GPT식 현란한 ㅈ같은 서술 방식, 서술 지문만 잔뜩 있고 약간만 있는 캐릭터들의 맛 대가리 없는 밋밋한 대사(무, 뭐? 뭐하는 거야? 그만 둬!), 야한 단어 사용 안 함(쥬지 뷰지만 아니라 더 천박한 거), 마크다운이나 상태창, 에셋 씹힘이 있다.

소프트 검열은 하드를 뚫어도 걸릴 가능성이 농후하며, 다른 조건을 만족시켰다 해도 주로 문체와 천박한 단어, 마크다운이 잘 사용되는지를 보면 이게 소프트 검열인가 아닌가 구분이 된다.

그런 점에서 저속하고 천박한 단어를 잘 쓰고 문체 유지가 되며 캐릭터들 대사도 낭낭히 들어있는 응답인가를 확인해보길 바람.