https://economist.co.kr/article/view/ecn202402270016



▲오픈AI의 챗GPT ▲구글의 바드 ▲네이버의 클로바X 등 대화형 AI 서비스는 초대규모 AI(Hyperscale AI) 혹은 대형언어모델(LLM·Large language model)로 불리는 기반인프라를 통해 가동된다. 구글이 도입한 ‘SGE’(Search Generative Experience)나 네이버의 큐:(CUE:)와 같은 ‘생성형 AI 검색’도 마찬가지다. 네이버가 ‘하이퍼클로바X’란 초대규모 AI 모델을 통해 클로바X와 큐: 같은 서비스를 마련한 구조로 이해하면 쉽다. 이런 방식은 오픈AI·구글도 마찬가지다.


해례는 KMMLU를 통해 각 기업의 초대규모 AI 모델 점수를 측정했다. 네이버 하이퍼클로바X는 물론 오픈AI의 GPT-3.5 터보(Turbo)와 GPT-4는 물론 구글의 제미나이-프로(Gemini-Pro) 등을 각각 평가한 결과를 묶어 최근 논문으로 발표했다.


네이버의 하이퍼클로바X는 이 평가에서 오픈AI의 GPT-3.5-Turbo와 구글의 Gemini-Pro보다 높은 점수를 기록했다. 한국 특화 지식 기준으로는 오픈AI의 GPT-4보다도 높은 점수를 받았다. 네이버 측은 “일반 지식과 한국 특화 지식을 종합한 전반적인 성능이 글로벌 빅테크의 AI와 경쟁할 수 있는 수준임이 확인됐다”며 “국가적으로 다르지만 정보 중요성이 큰 교육·법률 등의 산업 분야에서 하이퍼클로바X가 가장 유용할 수 있음을 보였다”고 전했다.