OpenAI의 이미지 AI DALL-E 3에 인터페이스 업데이트 제공

https://the-decoder.com/openais-image-ai-dall-e-3-gets-an-interface-update/

OpenAI는 DALL-E 3의 새로운 사용자 인터페이스를 테스트하고 있습니다.

미리 정의된 스타일과 화면비 중에서 DALL-E 3 GPT에서 직접 선택할 수 있습니다: 와이드스크린, 1:1 또는 세로.

이 옵션은 채팅 입력 줄 위에 나타납니다. 항목을 클릭하면 해당 항목이 채팅 입력줄에 텍스트 항목으로 삽입됩니다. 스타일 위로 마우스를 가져가면 해당 스타일의 고양이 이미지로 시각화됩니다. 대부분의 사용자들이 모든 아트 스타일을 알지 못하기 때문에 이 기능은 교육적인 측면에서 유용합니다.

지금까지 OpenAI는 DALL-E 3의 텍스트 입력 외의 제어 옵션을 완전히 포기했으며, 경쟁사인 Midjourney, Stable Diffusion 또는 Ideogram보다 훨씬 적은 기능을 제공했습니다.

새로운 기능이 이 사실을 바꾸지는 않지만, 적어도 OpenAI가 여전히 DALL-E 인터페이스에 대해 작업 중이라는 것을 보여줍니다.

DALL-E 2에는 이미지에 요소를 추가하거나 텍스트 프롬프트를 사용하여 이미지의 요소를 변경하는 아웃페인팅 및 인페인팅과 같은 기능도 제공하는 그래픽 사용자 인터페이스가 있었습니다.

DALL-E 3는 API를 통해 더 많은 시각적 다양성을 제공합니다: '내추럴'과 '비비드'라는 두 가지 기본 모드를 통해 자연스럽고 사실적이거나 초현실적이고 드라마틱한 콘텐츠를 생성할 수 있습니다.

다른 두 가지 품질 모드는 'HD'와 '표준'입니다. HD 모드는 더 많은 디테일을 표시하고 프롬프트를 더 정확하게 따르도록 설계되었지만 더 비싸고 시간이 더 오래 걸립니다.

DALL-E 3는 동급 시스템보다 더 정확하게 프롬프트를 따릅니다. 하지만 Midjourney와 Ideogram은 최신 업데이트를 따라잡았고, 특히 Midjourney는 더 나은 이미지 품질과 훨씬 더 많은 설정 옵션을 제공합니다. Ideogram은 Midjourney와 DALL-E 3보다 글꼴을 더 잘 렌더링할 수 있습니다. 새로운 Stable Diffusion 3는 텍스트를 더 잘 따라갈 수 있습니다.

DALL-E의 한 가지 장점: OpenAI는 생성된 이미지에 메타데이터를 삽입하여 출처를 확인할 수 있는 C2PA 표준을 구현했습니다. 이 메타데이터는 특정 웹사이트와 소셜 미디어 플랫폼에서 읽을 수 있습니다. 또한 OpenAI는 DALL-E 이미지를 안정적으로 인식하는 이미지 분류기를 개발 중입니다.