GPT-4가 부정적인 상황을 재구성하는 데 인간을 능가할 수 있다는 연구 결과가 나왔습니다.

https://the-decoder.com/gpt-4-can-outperform-humans-at-reframing-negative-situations-study-finds/
https://osf.io/preprints/psyarxiv/fzvd8

하버드 대학교와 그라츠 공과대학교 연구진의 연구에 따르면, GPT-4는 부정적인 상황에 대한 인지적 재평가에서 인간보다 더 나은 성능을 보인다고 합니다.

하버드 대학교의 과학자들은 두 가지 연구를 통해 인간과 GPT-4가 부정적인 상황을 얼마나 잘 재구성할 수 있는지 조사했습니다. 이 '인지적 재평가'는 다양한 상황에서 부정적인 감정을 줄이는 데 효과적인 방법입니다.

연구진은 인간 피험자와 GPT-4에게 슬픔, 두려움, 분노를 표현하는 총 18개의 부정적인 상황 묘사를 재해석하게 했습니다. 그런 다음 다른 피험자들은 효과성, 공감, 참신성, 구체성의 차원에서 재해석의 품질을 평가했습니다.

두 연구 모두에서 연구진은 GPT-4가 효과성, 공감, 참신성에서 인간을 능가한다는 사실을 발견했습니다. 원래 상황 설명과 재평가의 일관성(재평가 특이성)에서는 인간과 GPT-4 간에 유의미한 차이가 없었습니다.

두 번째 연구에서는 참가자들에게 보너스를 지급하여 더 나은 재해석을 제공하려는 동기를 부여했습니다. 그 결과 참가자들은 재해석에 더 많은 시간을 할애했지만, 인간과 GPT-4 간의 품질 차이는 줄어들지 않았습니다. 연구진은 이러한 차이가 노력보다는 능력에 의한 것임을 시사한다고 말합니다.

원래 상황 설명과 재평가 사이의 의미적 유사성을 분석한 결과, 인간의 재평가가 원래 설명과 더 유사한 경향이 있는 것으로 나타났습니다. 인간은 일반적인 대답을 하기보다는 설명된 상황에 훨씬 더 충실했습니다. GPT-4는 그 반대였습니다.

이 결과는 인간과 GPT-4의 재평가를 모두 개선할 수 있는 방법을 제시합니다: 인간은 특정 상황을 넘어 더 폭넓은 해석을 제공하는 방법을 배울 수 있는 반면, GPT-4는 세부 사항에 더 집중함으로써 이점을 얻을 수 있습니다.

인간의 재평가를 도울 수 있는 AI

연구진은 이번 연구 결과가 재평가 및 정신 건강 지원에 AI를 활용하는 데 시사하는 바가 있다고 강조합니다. GPT-4와 같은 모델은 초기 인간 재평가를 개선하기 위한 제안을 제공함으로써 인간의 재평가를 개선할 수 있습니다.

그러나 이 연구에는 몇 가지 한계가 있습니다. 다른 사람이 만들어낸 매우 구체적인 상황을 재평가하는 데 초점을 맞추었고 제한적이었습니다. 보다 복잡한 상황에서는 인간이 GPT-4를 능가할 수 있으며, 참가자들은 일부 재평가가 AI에 의해 이루어졌다는 사실을 인지하지 못했습니다. 이전 연구에서는 이것이 평가에 영향을 미칠 수 있다고 제안했습니다.

2023년 여름, 하버드 연구진의 연구 결과를 뒷받침하는 연구에 따르면, GPT-4는 주어진 시나리오에서 가능한 감정 범위를 인간보다 더 정확하게 묘사할 수 있다고 합니다. 하지만 그렇다고 해서 ChatGPT가 자동으로 더 나은 심리 치료사가 되는 것은 아닙니다.