OAK

Wav2vec 특징 기반의 한국어 음성감정인식

Metadata Downloads
Alternative Title
Speech emotion recognition based onwav2vec feature embedding
Abstract
최근self-supervised learning모델의출력을입력특징으로활용해서음성인식, 화자인식, 음성감정인식에높은성능을향상을보인바있다. 본논문은한국어음성감정인식데이터셋에대해self-supervisedlearning모델로써wav2vec 특징을기존의음향적 특징을 비교한다. 한국어 음성감정인식 데이터셋 Korean Emotion Speech Dataset에서 제공하는 성별, 화자, 문장,감정 라벨을 활용하여 t-SNE에 두 가지 특징을 살펴본다. 두 가지 특징에 대해 support vector machine 및 multi-layerperceptron 모델로 감정인식 성능 weighted average(WA)와 unweighted accuracy(UA)를 비교하였을 때, 두 모델에 대해wav2vec 특징이 더 높은 음성감정인식 성능을 보여주었다.
Author(s)
Ahn, YoungdoHan, sangwookLee, Sung JooShin, Jong Won
Issued Date
2021-11-17
Type
Conference Paper
URI
https://scholar.gist.ac.kr/handle/local/21974
Publisher
한국통신학회
Citation
한국통신학회 추계종합학술발표회, pp.11 - 12
Conference Place
KO
Appears in Collections:
Department of Electrical Engineering and Computer Science > 2. Conference Papers
공개 및 라이선스
  • 공개 구분공개
파일 목록
  • 관련 파일이 존재하지 않습니다.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.