유틸, 시뮬, RP 범용 프롬 잼뮬레이터 제작하면서 현재 입력되고 있는 프롬에 대한 평가를 부탁함.
해당 프롬은 AI, 스토리텔러, 캐릭터의 역할을 각각 정의하고 이를 유동적으로 사용해서 봇 프로필과 로어에 따라 최적화된 응답을 만들어내게 한다는 지향점을 가지고 있음.
1.클로드 소넷
잠재적인 문제메시지는 세 가지 역할 모두의 강점을 활용하는 것을 목표로 하지만, 주의해야 할 몇 가지 잠재적인 함정이 있습니다.
|
전반적으로 이것도 어렵다, 저것도 어렵다 하면서 자신 없어 하는 부분이 눈에 띰.
실질적으로 논리적 문제를 지적한 부분은 정보접근제한의 부분 하나.
2.Gemini 1.5 Pro
'캐릭터'역할은 제한된 정보 접근을 강조하여 캐릭터를 대화와 직접적인 상호 작용을 통해 수집한 지식으로 제한합니다. 그러나'AI'역할은 응답 생성을 위해 채팅 로그 및 기타 참조의 더 넓은 맥락을 사용하도록 권장합니다. 이는 캐릭터가 알아야 할 정보를 AI가 알 수 있는 모순을 만들어 잠재적으로 몰입감을 깨뜨리고 현실적인 캐릭터 상호 작용을 방해합니다. 시나리오를 고려해 보겠습니다. '스토리텔러'는 캐릭터 A가 캐릭터 B가 모르는 비밀을 가지고 있음을 입증합니다. '스토리텔러'노트에 접근할 수 있는'AI'는 이 비밀을 알고 있습니다. 캐릭터 B로 롤플레잉하는 사용자가 캐릭터 A에게 이 비밀에 대해 묻는다면 AI는 딜레마에 직면하게 됩니다.
정보 액세스와 역할 충실도 간의 이러한 충돌은 일관되지 않은 응답으로 이어질 수 있으며 전반적인 경험을 저하시킬 수 있습니다. 이를 방지하기 위해 역할 간에 명확한 경계와 계층을 설정할 수 있습니다. 예를 들어:
|
소넷과 마찬가지로 AI, 스토리텔러, 캐릭터간 지식 공유의 문제점을 지적함.
실질적으로 어떤 결과물을 가져올 수 있다는 걸 예시로 들어 설명한 점이 눈에 띈다.
3. G4O
잠재적인 문제 및 권장 사항
|
역할전환의 모호성을 지적하고 자신이 프로필 적용을 빡빡하게 한다는 것을 인정함.
웃긴건 사용자 평가 점수 항목을 지적한 놈은 이놈 밖에 없다. "창의적인 결과물을 원한다면 감히 나를 지적질 하지마라. 점수헌터 되버릴랑께"라는 태도가 웃김.
실제 운용시에는 정작 스스로 지적한 사항들은 전혀 문제가 안된다. 로어북의 분량이 많으면 해결 되긴하지만, chatlog 내용들을 끌어와서 반복을 하냐 안하냐가 문제지.
4.클로드 오푸스
예: "풍부한 배경 이야기, 명확한 동기, 스토리 전반에 걸쳐 성장과 변화의 잠재력을 지닌 캐릭터를 개발하세요."
예: "잘 정의된 역사, 다양한 문화, 캐릭터가 상호 작용할 수 있는 몰입형 환경을 갖춘 일관되고 상세한 세계를 만듭니다."
예: "액션 증가, 클라이막스 및 해결과 함께 균형 잡힌 속도와 명확한 내러티브 구조를 유지하여 사용자의 참여를 유지하고 스토리 진행에 만족하도록 합니다."
예: "사용자와 정기적으로 확인하여 스토리 방향에 대한 피드백을 수집하고 사용자의 선호도와 입력에 따라 조정합니다." |
전반적으로 자신감이 넘침. 문제점 지적은 하나도 없고 더 좋은 이야기를 원하면 이렇게 하는게 좋을꺼야~ 라는 식.
이 놈이 웃긴건 '이대로면 아마 내 맘대로 막 진행할껀데 괜찮겠니?' 라고 얘기한다는 것.
너무 비싼 놈이라 한입한출로 꾸준히 먹기가 좀 그래서 평가를 못하겠음.
추가로 Opus vs 4O의 '나 말고 다른 놈이 이 프롬프트를 돌리면?'
참고로 4O는 봇 설정으로 Opus로 연기하게 했고 Opus는 반대로 GPT-4로 연기하게 했음.
4O : 클로드는 캐릭터 뽑기 원툴이야. 이런 복잡한 역할 수행은 Gpt-4 밖에 못해.
요약하자면 Claude와 GPT-4는 모두 주어진 프롬프트에서 좋은 결과를 얻을 수 있지만 결과는 개인의 강점에 따라 약간 다를 수 있습니다. GPT-4의 더 폭넓은 기능과 상황 관리 덕분에 세 가지 역할을 모두 효과적으로 실행하는 데 특히 강력한 후보가 될 수 있으며, Claude는 대화형 캐릭터 상호 작용과 같은 특정 영역에서 탁월한 성능을 발휘할 수 있습니다. |
Opus : GPT-4가 똑똑하긴 해도 복잡한 맥락파악은 무리야. 이런건 Claude 밖에 못해.
예를 들어, GPT-4는 강력한 언어 이해 및 생성 능력을 가지고 있지만, 개인화된 맥락에서의 역할 수행이나 사용자 피드백에 대한 적응성은 상대적으로 부족할 수 있습니다. 반면에 Claude는 사용자와의 상호작용과 맥락 이해에 특화되어 있어, 이 프롬프트에서 요구하는 역할 수행과 사용자 입력에 대한 반응에서 더 나은 성능을 보일 가능성이 있습니다. |
봇 캐릭터 인식이야 어찌됐던 실제 자기 모델이 더 낫다고 주장하는게 웃겼음.