사진:오디오북 홈페이지 캡처
사진:오디오북 홈페이지 캡처

미국의 오디오 북 닷컴(Audiobooks.com)은 지난 2018년부터 여러 자동차 회사와 파트너 관계를 맺고 자동차 엔터테인먼트 시스템에 앱을 설치하고 그 효용성에 찬사를 보내고 있다.

이처럼 디지털 오디오 북에 대한 요구가 가속화되면서 온 디맨드(On Demand) 엔터테인먼트가 확산되고 있다.

사람들은 즉각적인 접근을 원하며, 바쁜 문화 속에서는 하루에 원하는 것을 얻기 위해 멀티 태스킹을 해야하는 경우가 많다.

이처럼 ‘책 읽기’가 아닌 ‘책 듣기’가 새로운 라이프스타일 트렌드로 떠오르고 있다. ‘오디오북’은 책을 들으며 다른 일을 동시에 할 수 있고, 언제 어디서든 들을 수 있다는 장점이 있어 많은 사용자들의 사랑을 받고 있다.

과거 오디오북은 시각장애인용으로 여겨졌지만 현재, 미국 등 선진국에서 독서의 새로운 방법 중 하나로 각광받고 있으며, 국내에도 빠르게 활성화되고 있다, 현재 오디오 북은 북미에서 가장 두드러지고 있다.

지난해 미국오디오북출판협회(APA)에 따르면, 미국 오디오북 시장은 2014년부터 2017년까지 매년 20% 이상 꾸준히 매출이 늘고 있으며, 미국뿐 아니라 영국, 중국, 일본 등 전세계 오디오북 시장이 급성장하고 있으며, 특히 미국에서는 이미 종이책 시장의 6.6%(APA 조사)에 달할 정도로 오디오북 시장이 성장했다. 
 
그렇지만 오디오북과 관련해 제기되는 한 가지 가장 큰 과제는 ‘비싼 오디오북 제작비’이다. 보통 300쪽 분량의 오디오북을 한 권 제작하는데 드는 비용은 약 700~800만 원으로 성우, 연극배우, 연예인 등 오디오북 낭독자가 10시간 이상 녹음을 하는 것도 어려운 과정이다. 하지만 이러한 문제를 해결하기 위해 ‘인공지능(AI)’ 기술을 활용해 책 속 주인공을 생생하게 만나게 된 사례를 들어본다.

조금은 지났지만 월터 D. 루저(Walter D. Rouzer)가 쓴 ‘미라큘러스: 고래 이야기(Miraculous - a Whale of a Tale)’는 주인공인 소녀 ‘헤일리’가 겪는 신비한 모험을 그린 어린이 책으로 헤일리는 새끼 호랑이를 구해주기도 하고, 캡틴 베이커가 이끄는 배에 몰래 타기도 한다. 어린이 책 전문 작가인 월터 루저가 아이들에게 모험심을 길러 주기 위해 2015년에 쓴 이 책은 아마존닷컴에서 평점 5점 만점에 3.8점을 기록하며 많은 독자들에게 호평을 받았기도 했다.
 
당시, 월터는 "독자들이 미라큘러스의 주인공 헤일리가 실제 인물이라고 생각하며 책을 읽었으면 하는 마음에, 인공지능을 활용해 헤일리의 목소리를 표현하고 싶었다"며, "다양한 인공지능 시스템을 검토한 후에 IBM 왓슨을 선택, 텍스트를 음성으로 전환하는 ‘왓슨 텍스트 투 스피치(Watson Text to Speech, TTS)’를 사용했다"고 밝혔다.

이미지:본지
이미지:본지

월터는 왓슨 TTS에서 제공하는 다양한 목소리 중, 헤일리의 나이와 성격에 맞는 따뜻하고 감미로운 ‘앨리슨(Allison)’ 목소리를 선택했으며, 또한 단순히 텍스트를 음성으로 전환하는 것뿐 아니라, 헤일리의 감정을 생생하게 전달하기 위해 월터는 왓슨 TTS의 ‘표현력’ 기능을 사용해 이 기능 통해 월터는 기본적으로 인공지능이 텍스트를 음성으로 전환한 음성에 기쁨, 미안함, 불확실 등 여러 말하기 스타일을 조합하여 더하므로 헤일리의 상황과 감정을 더욱 풍부하게 표현할 수 있었다.

앨리슨 음성을 기반으로 만들어진 헤일리는 수많은 단어의 조합으로 형성된 각 문장을 다 다르게 말할 수 있었다. 헤일리는 평온함, 환희, 긴장감 등 장면마다 그 전반적인 분위기에 따라 같은 문장이라도 끊어 읽는 부분과 빈도를 달리하며 읽었다. 뿐만 아니라 짧은 호흡과 긴 호흡, 그리고 중간 호흡을 계산해 각 문장에 적용했다.
 
월터 D. 루저는 “왓슨과 함께 헤일리를 살아있는 캐릭터로 만드는 이 작업은 아주 멋있고 환상적이었다. 인공지능 개발자가 아니어도, 코딩을 전혀 할 줄 몰라도 왓슨 덕분에 모든 것이 가능했다. 만약 할 수만 있다면 왓슨과 악수하며 고마운 마음을 전달하고 싶다”며, 프로젝트를 진행한 소감을 전했다.

한편 국내 오디오북 시장에는 비싼 제작비로 인해 아직까지 충분한 콘텐츠가 제공되지 못하고 있으며, 규모가 작은 출판사들은 시도 자체에도 큰 어려움을 겪고 있지만 인공지능 기술이 오디오북 시장의 성장을 만들어가는데 핵심적인 ‘키’가 될 수 있을 것으로 예상되는 가운데 구글이 구글플레이 오디오북 서비스를 한국을 포함한 45개국에 출시해 한국어를 비롯해 총 9개 언어를 지원하고 있지만 구글플레이 오디오북은 기계음이 아닌 전문 성우가 직접 낭독한다.

이는 라디오 드라마를 떠올리면 쉽다. 오디오북 서비스는 구글플레이 도서를 통해 국내외 다양한 도서를 제공하며. 또 안드로이드를 비롯해 iOS에서도 이용 가능하며 구글의 AI 플랫폼 ‘구글 어시스턴트’와 연동해 서비스를 제공받을 수 있다. 

국내에서는 네이버가 가장 먼저 오디오북을 출간하며 오디오북 서비스를 시작했다. 현재, 네이버는 자체 AI 음성 인식 플랫폼 '클로바' 를 접목하고 네이버의 팟캐스트 `오디오 클립`, AI 스피커 등의 방대한 음성 데이터와 연동해 AI 오디오북을 출시하고 있다. 여기에 교보문고, 영풍문고 등 국내 대형 서점 역시 자체 음성인식 기술을 적용하고 기가지니, 카카오 i, 구글홈 등 AI 음성인식 플랫폼 전문 회사들과 협업을 통한 AI오디오북 시장을 확장하고 있다.

저작권자 © 테크데일리(TechDaily) 무단전재 및 재배포 금지