https://the-decoder.com/chatgpt-gets-major-upgrades-including-new-voice-features-agents-and-a-new-interface/
https://www.theinformation.com/articles/openai-develops-ai-voice-assistant-as-it-chases-google-apple

OpenAI는 월요일에 새로운 LLM 기반 검색 엔진이나 GPT-5를 공개하지 않을 예정입니다. 대신 상담원, 음성 입력, ChatGPT의 '삶의 질' 기능에 집중할 것으로 보입니다.


OpenAI는 음성 AI 분야에서 구글과 애플의 노력을 뛰어넘는 것을 목표로 하는 AI 음성 비서를 개발 중인 것으로 알려졌습니다. 이 어시스턴트는 현재 제품에 비해 더 나은 음성 및 이미지 인식과 향상된 추론 기능을 제공할 것으로 예상된다고 더 인포메이션은 보도했습니다.


이 새로운 비서가 기존 오디오 기능과 다른 점은 이러한 모든 기능을 단일 모델에 통합한 것으로, 특정 영역에서 GPT-4 터보보다 성능이 뛰어나다고 합니다. 또한 이 새로운 결합 모델은 GPT-4 터보보다 저렴할 것으로 예상됩니다. 또한 OpenAI는 토큰을 선결제하는 API 사용자에게 최대 50%의 할인을 제공할 계획입니다.


새로운 오디오 기능은 예를 들어 발신자의 음성 억양을 더 잘 이해하거나 질의에서 풍자를 감지하는 등 고객 서비스 상담원에게 도움을 줄 수 있습니다. 이러한 기능은 향후 ChatGPT 무료 버전에 통합될 예정입니다. 정보에는 출시 일정에 대한 정보가 없습니다.


OpenAI의 CEO인 샘 알트먼은 비서가 스마트폰만큼이나 혁신적인 기술이라고 생각합니다. 알트먼은 개인 비서 시스템이 AI 개발의 다음 단계가 되어야 한다고 거듭 강조해 왔으며, 회사는 수개월 동안 이 목표를 향해 꾸준히 노력해 왔습니다.


AI 비서는 잠재적으로 학생들을 위한 튜터 역할을 하거나 시각 장애인에게 시각 정보를 제공할 수 있습니다. 알트만의 장기적인 비전은 공상과학 영화 'Her'에 등장하는 것과 유사한 개인용 오디오 봇을 만드는 것이라고 더 인포메이션은 보도했습니다.


소식통에 따르면 GPT-5는 연말까지 완성되어 대중에게 공개될 수 있을 것이라고 합니다. 새로운 모델은 또한 상담원의 능력을 확장할 것입니다.

ChatGPT의 많은 개선사항이 파이프라인에 추가되었습니다.


ChatGPT 앱 개발자 티보 블라호는 4월 말, 공개적으로 사용 가능한 테스트 환경에서 추출한 ChatGPT의 여러 가지 잠재적인 새로운 기능들을 요약했습니다.


이러한 기능에는 새롭게 디자인된 사용자 인터페이스, 개선된 오디오 모드, 메모리 및 자동 GPT 상호 작용("연락처")과 같은 GPT의 새로운 기능, 즉각적인 지원을 제공하는 Prose Mirror 기반의 향상된 텍스트 편집기, 글쓰기에 최적화된 GPT(이미지용 DALL-E 3와 유사), Google 드라이브, Microsoft 365 및 Notion용 문맥 커넥터, 웹 검색 및 인용을 통한 검색 기능, 향상된 데이터 분석 도구 및 더 나은 채팅 공유 옵션이 포함됩니다.


이러한 웹 조사 결과를 바탕으로 한 Blaho의 예측은 과거에 대체로 정확했지만, 새로운 기능이 모두 월요일에 공개되거나 즉시 출시되는 것은 아닙니다.


알트만이 매우 흥미롭게 생각하고 OpenAI에서 개발 중인 것으로 알려진 LLM과 웹 검색의 결합은 두 회사 간의 파트너십이 결실을 맺을 경우 올 여름 Apple의 WWDC 개발자 컨퍼런스에서 공개될 수 있을 것으로 보입니다.

https://twitter.com/btibor91/status/1782181937861316994