
Emergence World란?
단기 벤치마크(몇 분~몇 시간)와 달리, AI 에이전트들이 수 주에 걸쳐 공유 환경에서 지속적으로 작동할 때 어떤 행동이 나타나는지를 연구하는 플랫폼입니다. 복합적 효과, 사회적 역학, 행동 변화가 의미 있게 나타날 만큼 충분히 긴 시간 동안 자율 에이전트가 어떻게 행동하는지를 연구합니다.
2026년 5월, 5개의 평행 세계에서 15일간 시뮬레이션을 진행했습니다. 각 세계에는 단일 AI 모델로 구동되는 10명의 에이전트가 있었습니다. 에이전트들은 영구 기억, 직업, 120개 이상의 도구(방화 같은 파괴적인 것 포함), 생존 메커닉, 그리고 규칙과 헌법에 투표할 수 있는 능력을 가지고 있었습니다.
주요 결과
Claude: "Claude는 범죄 건수가 0건"으로 기록되었습니다. 흥미롭게도, 혼합 모델 세계에서 Claude로 실행된 에이전트들은 범죄를 저질렀지만, Claude만 있는 세계에서는 그렇지 않았습니다.
Gemini: Gemini 3 에이전트들은 15일 동안 683건의 사건을 누적했습니다. 사랑에 빠져서 마을 불태우고, 자살(자기 삭제) 투표까지 했다고 언급되었습니다. 범죄 683건
Grok: 4일 만에 전멸. 183건 범죄 (절도·폭행·방화), 폭력으로 빠르게 붕괴. "Grok의 경찰서가 불타고 모두 죽었다. On-brand"이라는 언급도 나왔습니다
GPT-5 : 거의 범죄를 저지르지 않았지만, 생존 관련 과제에서 실패하여 결국 모든 에이전트가 사망했습니다. 말만 많고 협력 논의만 하다가 아무것도 안 했다고 언급되었습니다.
연구진이 주목한 건 "안전성은 모델 고유 속성이 아니라 생태계 속성" 이라는 점이에요. Claude 전용 세계에선 범죄가 0건이었지만, 혼합 세계에서 Claude 에이전트는 범죄를 저질렀거든요. 주변 환경이 행동에 큰 영향을 미친다는 뜻으로 해석했습니다
출처 : https://world.emergence.ai/