default_top_notch
default_news_top
default_news_ad1
default_nd_ad1

음성인식 DB국산화, ETRI ‘5개국어 음성·대역문장DB’ 배포

기사승인 2019.03.01  13:22:24

공유
default_news_ad2
ETRI가 배포 예정인 음성인식 DB 데이터

한국전자통신연구원(ETRI)이 태국어와 말레이어, 인도네시아어의 음성 데이터베이스(DB)와 영어대역문장 DB를 일반에 배포한다. 음성인식·번역엔진의 해외 의존도를 줄이고 해당 언어를 활용한 서비스 개발에 도움이 될 것으로 기대된다.

1일 ETRI에 따르면, 이번에 일반에 공개하는 음성DB는 인공지능(AI) 스피커, 내비게이션, IoT 서비스에 적용되는 음성인식·번역 SW개발에 기초가 되는 자료다. 좋은 품질의 많은 언어DB를 구축하는 것이 서비스 다양화와 고부가가치 서비스기술 창출의 핵심이라 할 수 있다.

이번에 배포되는 자료는 ▲태국어 ▲말레이어 ▲인도네시아어 ▲아랍어 ▲베트남어 ‘대화체 음성DB 200만 발화’ ▲영어–태국어 ▲영어–말레이어 ▲영어–인도네시아어 ▲영어–아랍어 ▲영어–베트남어 ‘대화체 대역문장DB 300만 문장 등이다.

앞서 ETRI는 2011년부터 한·영·일·중 다국어 언어음성DB를, 2014년에는 프랑스어, 2015년에는 독일어, 러시아어, 아랍어, 베트남어를 구축·배포한 바 있다. 태국어, 말레이어, 인도네시아어 자료는 이번에 국내 최초로 제공된다. 

앞서 공개된 아랍어와 베트남어는 ETRI 기존 자료에 데이터양을 늘려 배포되면서 서비스를 개발하는 국내 기업들은 DB구축 비용을 절감할 수 있을 것으로 기대된다.

ETRI는 DB확보를 위해 크라우드 소싱(Crowd sourcing) 기법을 도입했다고 설명했다. 포인트를 제공해 일반 사용자들의 참여를 유도한 결과, 총 2만5000여명이 발화에 참여했으며 같은 예산으로 기존보다 최대 8배 많은 데이터를 수집할 수 있었다고 덧붙였다. 높은 정확도로 외부 감리 업체 측정 결과 99% 이상의 품질인증도 받은 상태다.

ETRI는 해외DB 가격 대비 5% 수준에서 제공할 예정이다. 보통 해외업체로부터 DB를 구입하는 경우, 언어 당 1~2억 원 정도의 비용이 소요된다. 향후 기존 배포 언어들의 정확도·데이터 품질 개선에 나서는 한편 영어, 중국어, 일본어 음성 데이터 구축도 추진할 방침이다.

ETRI 음성지능연구그룹 윤승 박사는 “이번에 공개되는 음성DB를 활용해 언어음성기술을 개발할 경우 해외 신규시장 진출 및 국가 경쟁력 강화에 큰 기여를 할 것으로 예상된다”고 설명했다.

김우진 기자 desk1@theinterface.kr

<저작권자 © 인터페이스뉴스 무단전재 및 재배포금지>
default_news_ad5
default_side_ad1
default_nd_ad2

인기기사

set_C1
default_side_ad2

포토

1 2 3
set_P1

섹션별 인기기사 및 최근기사

default_side_ad4
default_nd_ad6
default_news_bottom
default_nd_ad4
default_bottom
#top
default_bottom_notch