심층 신경망 기반 음성향상을 위한 SNR 정보를 이용한 하모닉 기반 후처리 기법
- Alternative Title
- Harmonic-based Post-processing Using SNR InformationforDNN-based Speech Enhancement
- Abstract
- 본 논문은 깊은 신경망 기반의 음성향상에서 발생하는 과평활화(over-smoothing) 현상을 해결하고자 SNR 정보를 이용한 하모닉 기반의 후처리 기법을 제안한다. 음성신호의 SNR을 추정하고, 이를 이용하여 하모닉의 저점(valley)과 고점(peak)에 주파수 성분 간의 동적 영역(dynamic range)을 증가시켜 추정된 음성신호의 품질과 명료도를 효과적으로 증진시킨다. 본 논문에서는 실험을 통해 제안된 기법과 기존 심층 신경망 기반 음성향상의 후처리기법으로 사용된 전역분산 평등화(global variance equalization, GV) 기법의 성능을 PESQ (perceptual evaluation of speech quality)를 이용하여 비교하였다.
- Author(s)
- 송형찬; 김민승; 이은균; 유정화; Shin, Jong Won
- Issued Date
- 2018-06-01
- Type
- Conference Paper
- URI
- https://scholar.gist.ac.kr/handle/local/8536
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.