인공지능 데이터 구축 방법 - 자연어처리 중심으로

적절한 학습데이터 구축의 중요성
적절한 학습데이터 구축의 중요성

서비스 대상 선정

인공지능 기반의 상담서비스는 대고객 대상 챗봇과 사내 챗봇으로 구성된다. 대고객의 경우 고객이 문의하는 질의(Inbound)도 있지만, 챗봇이 고객에게 질문하는(Outbound) 서비스라고 보면 된다. 챗봇이 고객에게 질문하는 서비스의 경우 기저질환 환자에게 복약시점 알림 및 확인, 식단 확인 등의 서비스를 구축한 사례가 있다.

최근에는 텍스트 기반과 함께 STT(Speech-To-Text, 음성을 텍스트로 변환) 기술을 접목해 음성 명령어 기반의 서비스도 병행하고 있다. 다만 음성 명령어 기반 서비스는 TPO(Time·Place·Occasion)가 상당히 중요하다. 조용한 사무실로 음성명령기반 서비스를 하기보다는 회의실에서 관련 주제(불량률 확인, 다음 회의 예약 등) 또는 영업미팅을 위한 주제(회의장소 안내, 회의 대상 고객정보 브리핑 등)와 같이 상황별 음성서비스가 더 적합할 수 있다.

사용자가 중간에 챗봇이 개입해 답을 주는지를 인식하는 여부도 중요하다. 사용자는 챗봇이라는 것을 인지했을 경우와 인지하지 않을 경우 질문 패턴이 다르다.

통상 챗봇이라 인지할 경우 약 15글자 이내로 질문하는 경우가 85%~90%에 달한다. 그러나 챗봇이라 인지하지 않을 경우 명시적이지 않고 암묵적 의사전달을 하기 때문에 정말 다양한 경우의 수를 고려해야 한다.

이에 따라 텍스트 대비 높은 학습데이터가 요구된다. 실제 물류업체의 택배기사 어시스턴트(Assistant) 서비스의 경우 학습데이터가 텍스트 대비 20~30배 수준으로 늘어나기도 했다. 또한 지자체 챗봇의 경우도 50글자 이상의 민원성 데이터를 입력하는 상황도 발생했다.

가용 지식 발굴

기업에는 다양한 데이터가 존재하지만, 즉시 인공지능 데이터를 발굴하기 위한 데이터는 극히 적은 상황이다. 이를 위해서는 상담업무 및 내부 대응 업무에 활용 가능한 데이터를 발굴하고 이를 지식화하는 과정이 필요하다.

가용 지식의 중요도 및 보완될 데이터는 사용자 인터뷰를 통해 심층적으로 발굴하는 것이 중요하다. 또한 유사 서비스에 대한 벤치마킹을 통해 최신 트렌드를 반영하는 것도 중요한 요소다.

이를 통해 정리된 주요 지식을 통해 인공지능 서비스를 위한 지식체계를 수립하고, 서비스 기획을 진행한다. 이후 학습데이터를 구축하고 검증하는 단계는 필수적이다. 학습데이터를 구축하는데 있어 사용자가 게시판을 통해 문의하는 질문 형태를 그대로 학습시키는 경우가 있는데, 실제 사용자의 문의 패턴과 달라 학습효과가 저해된다. 이를 위해 사용자가 문의할 수 있는 형태로 학습데이터를 만드는 것이 상당히 중요하다.

RPA 연동

대고객뿐만 아니라 사내 헬프데스크 모두 고객 맞춤형 업무를 위해 최근 RPA를 적용하는 사례가 증가하고 있다. 사내 헬프데스크의 경우 제한된 상담사를 기준으로 문의를 받다 보면 폭증하는 케이스가 있는데, 주로 핵심 시스템 대상의 단순 문의가 많은 비율을 차지한다.

이는 내부시스템의 고도화 또는 공채 채용 기간과 맞물려서 폭증하는 사례가 발생하게 되는데, 단순 문의의 대응을 챗봇으로 대체하면서 단순 처리 부분에 대해 RPA연동을 통해 업무를 수행하면 효과적으로 사내 헬프데스크를 운영할 수 있게 된다.

최근에 오픈한 한국남부발전이 대표적인 케이스이다. 한국남부발전 챗봇 ‘마이 코디(My KODI)’의 기본 사용자 화면 마이코디는 머신러닝과 RPA가 결합된 발전사 최초 업무 자동화 챗봇으로, 출장이나 법인카드 사용 등 단순 반복적인 경비처리 업무를 자동화하는 ‘이지봇(Easy Bot)’과 회계 및 출장, 정산 등 대화형 상담이 가능한 ‘업무상담봇’이 결합, 탑재돼 있다. 이지봇은 전사적자원관리시스템(ERP) 및 전자결재시스템 등과 챗봇을 연결한 서비스로 남부발전 직원들이 가장 많이 사용하는 패턴을 중심으로 출장, 법인카드 사용 신청부터 정산 등 사후처리까지 관련 업무에 대한 자동 입력 및 추천을 통해 원스톱 업무처리 서비스를 제공한다.

퍼스널리티 - 톤 앤 매너 중심

챗봇은 접점에서 고객과 커뮤니케이션을 진행하는 주체로서 사용자에게 일관된 톤으로 정보를 제공하는 것이 무엇보다 중요하다. 와이즈넛은 이를 위해 답변 톤 앤 매너(Tone & Manner)를 기획하는 전문 컨설턴트를 통해 기획업무를 진행하고 있다.

실제 답변 길이 및 구조에 적정성과 함께 챗봇의 도입 단계 및 전문성을 고려해 답변발화를 위한 챗봇의 성격을 규정하고 이를 감안하여 답변을 기획하는 과정을 진행한다. 이는 단순히 일상대화보다도 전문지식 답변에서 더 중요한 요소다.

인공지능 학습데이터는 인공지능서비스의 지능을 부여하는 작업이며, 고객 서비스의 만족도를 높이기 위한 핵심적인 요소이다. 학습데이터는 정량적인 측면보다는 정성적인 수준을 높이기 위한 작업이 우선이며 ▲사용자가 문의할 수 있는 다양한 표현을 학습데이터로 구축하는 것 ▲고객이 원하는 정보를 쉽고 빠르게 획득할 수 있는 서비스기획 ▲일관된 답변 톤을 얻을 수 있는 퍼스털리티(Personality)를 구축하는 것 3가지가 무엇보다 중요하다고 할 수 있다.

와이즈넛은 인공지능 챗봇이 비대면 서비스의 최전선으로서 우리에게 효율 향상이라는 결과를 가져다 줄 수 있게끔 고객들이 성공적인 챗봇 사업과 인공지능 챗봇 생태계의 질서 유지를 위해 인공지능 학습데이터의 중요성을 인식하고 새로운 길을 열어 나갈 것이다.

저작권자 © 테크데일리(TechDaily) 무단전재 및 재배포 금지