오픈AI, ‘DALL•E2’ 발표

‘DALL•E2’가 생성한 이미지들. 이미지 = 오픈AI 제공
‘DALL•E2’가 생성한 이미지들. 이미지 = 오픈AI 제공

요즘의 인공지능(AI) 기술은 우리 눈에 보이는 형태로 점점 진화해 가는 양상이다.

이와 관련, AI 연구단체 ‘오픈(Open)AI’는 새로운 AI ‘DALL•E2’를 최근 공식 블로그를 통해 발표했다.

‘DALL•E2’는 우리가 입력한 문자열을 이해하고 그에 따른 이미지를 생성하는 AI다.

예를 들어 ‘연필로 작성된 말을 타고 있는 우주비행사’라는 엉뚱한 문제를 제시해도 ‘DALL•E2’는 모든 요소를 갖춘 이미지를 생성해 준다.

오픈AI는 지난해 1월 텍스트에서 이미지를 생성하는 ‘DALL•E’를 발표했다. 물론 문자열을 입력하면 문자가 의미하는 이미지를 생성하는 것이다. 예를 들어, ‘아보카도 의자’를 입력하면 아보카드 모양을 하고 있는 의자 모양의 이미지가 생성된다.

'DALL•E2'가 생성한 아보카드 의자 이미지 이미지 = 오픈AI 제공
'DALL•E2'가 생성한 아보카드 의자 이미지 이미지 = 오픈AI 제공

오픈AI는 이번에 발표한 ‘DALL•E2’는 이 ‘DALL•E’를 업그레이드 한 것이다.

‘DALL•E2’는 ‘DALL•E’에 비해 표현의 다양성(변주 폭)이 풍부해 우리의 상상에 보다 가깝거나 또는 상상을 뛰어넘은 이미지를 만들어 준다.

실제로 ‘DALL•E2’에서 ‘아보카도 의자’를 입력하면 ‘DALL•E’와 비교해 훨씬 고해상도이고 리얼한 이미지가 생성된다. 이미지를 일부 편집해, 그 의자에 개를 앉히는 것도 가능하다.

‘DALL•E2’는 이미지와 그 이미지를 설명하는 텍스트 간의 관계를 학습한다. 이것을 바탕으로 우리의 요구에 대해서는, ‘확산(diffusion)’이라고 불리는 프로세스를 사용해 무작위의 도트(점) 패턴으로부터 서서히 특정의 이미지 패턴으로 접근해 감으로써 텍스트의 요구에 맞는 이미지를 생성한다.

‘DALL•E2’는 입력된 문장을 이해하고 이미지를 몇 가지 생성해 준다. 예를 들어 앞서 언급한 ‘연필로 작성된 말을 타고 있는 우주 비행사’의 경우라면 아래 사진과 같다.

이미지 = 오픈AI 제공
이미지 = 오픈AI 제공

또 ‘DALL•E2’는 기존 이미지의 그림자나 반사, 텍스처를 고려하면서 자연스럽게 편집해 준다.

예를 들어, 아래의 박물관 이미지. 이 그림의 어딘가에 개를 추가하고 싶다면 ‘DALL•E2’는 추가하는 장소에 따라 묘사 방법을 조정하면서 자연스럽게 만들어갈 수 있다. 생성된 이미지를 보면 알 수 있듯이, 그림 터치의 차이, 그리고 그림과 실제의 차이를 이해하고 자연스러운 형태로 개를 추가하고 있다.

이미지 = 오픈AI 제공
이미지 = 오픈AI 제공

‘DALL•E2’는, 오리지날 이미지와 유사한 이미지도 여러 가지로 생성할 수 있다. 다만 폭력적, 정치적 내용의 이미지 생성은 제한돼 있다.

‘DALL•E2’는 현재 연구자들에게만 제공되고 있기 때문에 일반인이 바로 사용하지는 못한다.

오리지널(좌), 오리지널을 바탕으로 생성한 이미지(중•우) 이미지 = 오픈AI 제공

 

저작권자 © 테크데일리(TechDaily) 무단전재 및 재배포 금지