OpenAI의 새로운 ChatGPT 이미지 생성기로 사진 위조가 쉬워집니다

-


대부분의 사진 촬영의 경우 대략 200년 역사에서 사진을 설득력 있게 변경하려면 암실, 일부 Photoshop 전문 지식 또는 최소한 가위와 풀을 사용하는 꾸준한 손이 필요했습니다. 화요일에는 OpenAI 도구를 출시했다 문장을 입력하는 과정을 줄여줍니다.

그렇게 한 회사가 처음은 아니다. OpenAI는 이후 작업에 대화형 이미지 편집 모델을 가지고 있었지만 GPT-4o 2024년에는 Google이 OpenAI를 제치고 시장에 진출했습니다. 3월 공개 프로토타입을 만든 다음 이를 대중적인 모델로 개선했습니다. 나노바나나 이미지 모델(그리고 나노 바나나 프로). AI 커뮤니티에서 구글의 이미지 편집 모델에 대한 뜨거운 반응 OpenAI의 주목을 받았습니다.

OpenAI의 새로운 GPT 이미지 1.5 는 API를 통해 이전 모델보다 최대 4배 빠르게 이미지를 생성하고 비용은 약 20% 절감되는 AI 이미지 합성 모델입니다. 이 모델은 화요일에 모든 ChatGPT 사용자에게 출시되었으며 또 다른 단계 사실적인 이미지 조작을 특별한 시각적 기술이 필요하지 않은 일상적인 프로세스로 만드는 것입니다.

그만큼

ChatGPT에서 GPT 이미지 1.5를 사용하여 소파가 있는 방 사진에 “우주의 은하계 여왕”이 추가되었습니다.

GPT Image 1.5는 “네이티브 멀티모달” 이미지 모델이라는 점에서 주목할 만합니다. 즉, 이미지 생성이 언어 프롬프트를 처리하는 동일한 신경망 내에서 발생한다는 의미입니다. (반대로, DALL-E 3이전에 ChatGPT에 내장된 초기 OpenAI 이미지 생성기는 확산이라는 다른 기술을 사용하여 이미지를 생성했습니다.)

이 새로운 유형의 모델은 우리가 덮여 3월에 더 자세히 설명하면 이미지와 텍스트를 동일한 종류로 취급합니다. 예측할 “토큰”이라는 데이터 덩어리, 완성할 패턴입니다. 아버지의 사진을 업로드하고 “결혼식에서 그를 턱시도에 넣어라”라고 입력하면 모델은 통일된 공간에서 사용자의 단어와 이미지 픽셀을 처리한 다음 문장의 다음 단어를 출력하는 것과 동일한 방식으로 새 픽셀을 출력합니다.

이 기술을 사용하면 GPT Image 1.5는 이전 AI 이미지 모델보다 시각적 현실을 더 쉽게 변경할 수 있으며, 누군가의 포즈나 위치를 변경하거나 약간 다른 각도에서 장면을 렌더링할 수 있으며 다양한 성공률을 얻을 수 있습니다. 또한 연속적인 편집 과정에서 얼굴 모양을 유지하면서 개체를 제거하고, 시각적 스타일을 변경하고, 옷을 조정하고, 특정 영역을 다듬을 수 있습니다. ChatGPT에서 이메일 초안을 작업하는 것과 같은 방식으로 사진에 대해 AI 모델과 대화하고 개선하고 수정할 수 있습니다.

관련 기사