다채널 음성 향상을 위한 FASNET-TAC 알고리즘의 개선 방향 고찰
- Alternative Title
- A Study on the Improvement of FASNET-TAC Algorithm for Multichannel Speech Enhancement
- Abstract
- 본 논문은 다채널 음성 향상을 위한 FASNET-TAC 알고리즘의 개선 방향을 연구 고찰하였다. 기존 FASNET-TAC 알고리즘에서 DPRNN 모듈의 입력 특징에 오라클 VAD 및 TDOA 정보를 추가적으로 concatenation 시켜 줌으로써 음성 향상 성능의 개선 가능성을 확인하고자 하였다. 실험에서 잘 알려진 다채널 음성 향상 데이터 셋인 CHiME4 의 simulated set 에 대해서 음성 향상 성능을 다양한 척도로 비교하였고, 음성 품질 및 명료도 측면에서 기존 알고리즘 대비 성능 향상이 가능함을 확인하였다.
- Author(s)
- Kim, Minseung; Kim, Hansol; Park, Jungwon; Shin, Jong Won
- Issued Date
- 2021-11-17
- Type
- Conference Paper
- URI
- https://scholar.gist.ac.kr/handle/local/21972
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.