OAK

다채널 음성 향상을 위한 FASNET-TAC 알고리즘의 개선 방향 고찰

Metadata Downloads
Alternative Title
A Study on the Improvement of FASNET-TAC Algorithm for Multichannel Speech Enhancement
Abstract
본 논문은 다채널 음성 향상을 위한 FASNET-TAC 알고리즘의 개선 방향을 연구 고찰하였다. 기존 FASNET-TAC 알고리즘에서 DPRNN 모듈의 입력 특징에 오라클 VAD 및 TDOA 정보를 추가적으로 concatenation 시켜 줌으로써 음성 향상 성능의 개선 가능성을 확인하고자 하였다. 실험에서 잘 알려진 다채널 음성 향상 데이터 셋인 CHiME4 의 simulated set 에 대해서 음성 향상 성능을 다양한 척도로 비교하였고, 음성 품질 및 명료도 측면에서 기존 알고리즘 대비 성능 향상이 가능함을 확인하였다.
Author(s)
Kim, MinseungKim, HansolPark, JungwonShin, Jong Won
Issued Date
2021-11-17
Type
Conference Paper
URI
https://scholar.gist.ac.kr/handle/local/21972
Publisher
한국통신학회
Citation
한국통신학회 추계종합학술발표회, pp.22 - 23
Conference Place
KO
Appears in Collections:
Department of Electrical Engineering and Computer Science > 2. Conference Papers
공개 및 라이선스
  • 공개 구분공개
파일 목록
  • 관련 파일이 존재하지 않습니다.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.