OAK

심층 신경망 기반 음성향상을 위한 SNR 정보를 이용한 하모닉 기반 후처리 기법

Metadata Downloads
Alternative Title
Harmonic-based Post-processing Using SNR InformationforDNN-based Speech Enhancement
Abstract
본 논문은 깊은 신경망 기반의 음성향상에서 발생하는 과평활화(over-smoothing) 현상을 해결하고자 SNR 정보를 이용한 하모닉 기반의 후처리 기법을 제안한다. 음성신호의 SNR을 추정하고, 이를 이용하여 하모닉의 저점(valley)과 고점(peak)에 주파수 성분 간의 동적 영역(dynamic range)을 증가시켜 추정된 음성신호의 품질과 명료도를 효과적으로 증진시킨다. 본 논문에서는 실험을 통해 제안된 기법과 기존 심층 신경망 기반 음성향상의 후처리기법으로 사용된 전역분산 평등화(global variance equalization, GV) 기법의 성능을 PESQ (perceptual evaluation of speech quality)를 이용하여 비교하였다.
Author(s)
송형찬김민승이은균유정화Shin, Jong Won
Issued Date
2018-06-01
Type
Conference Paper
URI
https://scholar.gist.ac.kr/handle/local/8536
Publisher
한국통신학회
Citation
한국통신학회 하계종합학술발표회, pp.1075 - 1076
Conference Place
KO
Appears in Collections:
Department of Electrical Engineering and Computer Science > 2. Conference Papers
공개 및 라이선스
  • 공개 구분공개
파일 목록
  • 관련 파일이 존재하지 않습니다.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.