세계적 수준 심층질의응답기술 개발 성공, 범용성 확보
첨단 AI 언어모델 기반 한국어 독해능력 평가에서 1위

한국전자통신연구원(ETRI)은 자연어로 기술된 키워드 및 질문을 입력받아 정확한 정답을 찾아주는 자연어 심층질의응답 기술 `엑소브레인'을 ‘한컴오피스2020’ 지식검색 기능으로 탑재했다고 31일 밝혔다.

엑소브레인은 단순히 문서를 찾아주는 웹 검색 기능이나 단답형으로 응답을 하는 수준을 넘어 고난이도 서술형 질의응답이 가능하다. 이를 활용해 `일반상식 심층 질의응답 기술'과 `법령지식 심층 질의응답 기술' 서비스를 개발, 상용화로 이어질 수 있었다고 연구진은 설명했다.

연구진이 개발한 일반상식 심층 질의응답 기술은 위키백과를 분석해 관련된 정답을 찾아준다. 기계가 문제 유형을 판별한 뒤 유형별로 최적화된 해법을 적용하여 정답을 찾아내는 방식이다.

이 기술에는 한국어 질문분석 기술, 시맨틱 지식추출 기술, 위키피디아 기반 단답형·서술형 질의응답 기술, 질의응답 분산처리 플랫폼 기술 등이 적용됐다.

연구진은 단답형 답변 뿐 아니라 서술형 답변이 가능한 심층질의응답 기술 개발에도 성공했다. 현재, 전문용어와 한자어가 많은 법률 분야에서 활용이 가능한 수준이다.

예를 들어“타인의 물건을 동의없이 절취할 경우 성립되는 절도죄의 형벌은?”질문에 대해“6년 이하의 징역 또는 1천만원 이하 벌금”과 같은 고난이도의 서술형 답변이 가능하다.

이처럼 법률질의응답의 경우 법령문서에 기술된 전문용어와 문장 내 어순의 맥락을 파악하기 위해 법령문서를 대상으로 특화된 딥러닝 언어모델을 구축하였고, 단답형 문제와 서술형 문제 유형 별로 최적화된 문제풀이가 가능한 기계 독해 기술을 적용해 서비스가 가능케 되었다.

이 기술은 국회도서관과 국가과학기술연구회(NST)로부터 우수성을 인정 받아 내년부터 양 기관의 인공지능 기반 법무 서비스를 위한 SW로 활용될 예정이다.

NST는 현재 변호사를 고용해 이뤄지는 서비스를 엑소브레인을 통해 간단한 법령 질문에 응대하고 전문가의 검색 및 답변 과정을 보조할 목적으로 활용될 계획이다.

ETRI는 지난 6월 구글이 개발한 언어모델 버트(BERT) 대비 성능이 4.5% 우수한 코버트(KorBERT)를 개발해 공개한 바 있다.

연구진은 코버트에 적용된 뉴럴 검색과 기계 독해(MRC) 기술을 고도화하고 범용성을 확보해 이 기술을 개발할 수 있었다.

코버트는 공개 뒤 현재까지 331개 기관에서 활용이 이뤄지고 있다. 또한, 엑소브레인 기계 독해 기술은 한국어 기계 독해 대회인 KorQuAD 1.0에서 95.02점으로 현재 1위를 차지하고 있다.

ETRI 엑소브레인 총괄 연구책임자인 언어지능연구실 김현기 박사는“빅데이터라는 모래밭에서 바늘과 같은 정답을 찾을 수 있는 엑소브레인 심층질의응답 기술이 개발되어 국내 인공지능이 본격 상용화 하는데 큰 도움이 될 것으로 보인다”고 말했다.

ETRI 정보통신전시관에서 연구진들의 가상 엑소브레인 퀴즈대결 기술을 시연하는 모습
ETRI 정보통신전시관에서 연구진들의 가상 엑소브레인 퀴즈대결 기술을 시연하는 모습

김만수 한글과컴퓨터 미래기술연구본부장도“기존 한글 작업 시 사용자는 정보검색을 위해선 포털로 찾아야 했기에 시간이 소요되었는데 엑소브레인이 한글에 탑재됨에 따라 원하는 정보를 편리하고 빠르게 찾을 수 있어 문서작성 생산성과 효율을 높일 수 있게 됐다”고 밝혔다.

엑소브레인 사업단은 지난 2016년 EBS 장학퀴즈에서 우승한 이후 2017년부터 61건의 기술이전 및 사업화로 94억 원의 매출액을 달성했다.

이로써 국내에 구글·IBM 등과 같은 외산 인공지능 솔루션의 시장 잠식을 막는데 크게 기여하고 있다.

연구진은 앞으로 텍스트 뿐 아니라 음성을 통해서도 질의응답을 진행하고 사용자와 더욱 밀접하게 소통할 수 있는‘AI 지식 아바타’(가칭) 관련 기술 등을 연구개발할 예정이다.

저작권자 © 테크데일리(TechDaily) 무단전재 및 재배포 금지