Data generation based on CycleGAN for Speech Emotion Recognition
Abstract
다양한 문제에서 데이터 생성을 이용하여 인식률을 향상시키기 위해 GAN을 이용하는 것을 볼 수 있다. 본 논문에서는 IEMOCAP corpus에 대한 인식률을 높이기 위한 방법으로써 CycleGAN을 이용하였다. 무감정(Neutral)을 기준으로 각 감정(분노, 행복, 슬픔)에 대해 훈련된 생성 모델을 이용하여 생성된 데이터를 훈련셋에 추가하였고 SVM 분류기를 이용하여 성능을 분석하였다.