OAK

긴 발화 콜센터 데이터에 적합한 한국어 음성 인식 모델 연구

Metadata Downloads
Abstract
최근 AICC(AI Contact Center) 등에서 콜센터 음성인식 기술이 중요해짐에 따라 높은 인식률의 콜센터 데이터 음성 인식 모델을 필요로 한다. 보통 상담 유형기반의 콜센터 데이터들은 2 분 이상의 긴 대화들로 구성되어 있다. 일반적으로 사용되는 음성 인식 모델을 사용하여 학습할 경우 짧은 발화(Mobile Device, 가전에서의 연속어/명령어) 기반의 음성 인식은 비교적 준수한 성능을 얻을 수 있다. 하지만 긴 발화로 구성된 콜센터 데이터들은 인식률이 떨어지는 현상을 보인다. 이 문제를 해결하고자 본 논문에서는 segmentation[1] 기법 바탕의 콜센터 데이터 분할과 TDNN-OPGRU[2] 구조를 적용한 음성 인식 모델을 통해 콜센터 데이터에 대한 음성 인식률 개선을 확인하였다.
Author(s)
Ma, Seung HeeKwon, Oh HyeonNa, Hyeong JuJeong, Seung HunLee, Jung JyukPark, Hyun JuKim, Hong Kook
Issued Date
2022-06-23
Type
Conference Paper
URI
https://scholar.gist.ac.kr/handle/local/21879
Publisher
한국통신학회
Citation
2022년 한국통신학회 하계종합학술발표회, pp.1821 - 1822
Conference Place
KO
제주도
Appears in Collections:
Department of Electrical Engineering and Computer Science > 2. Conference Papers
공개 및 라이선스
  • 공개 구분공개
파일 목록
  • 관련 파일이 존재하지 않습니다.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.