OAK

캡슐 네트워크를 이용한 음성 스펙트로그램에서의 감정 인식

Metadata Downloads
Author(s)
Yoo, JeonghwaKim, HansolYoon, Sang HyuShin, Jong Won
Type
Conference Paper
Citation
한국통신학회 하계종합학술발표회, pp.1223 - 1224
Issued Date
2019-06-01
Abstract
본 논문은 음성 스펙트로그램에서 CNN(convolutional neural networks)의 약점을 보완한 캡슐 네트워크(capsule network)기반의 감정 인식 기법을제안한다. 먼저, 스펙트로그램 정보를 인스턴스화 파라미터(instantiation parameter)를 나타내는 뉴런의 그룹인 벡터(vector) 형태의 캡슐(capsule)로나타낸다. 이 때, 스쿼시 함수(squash function)를 이용하여 캡슐 벡터의 길이는 개체(entity)가 존재할 확률을 나타내게 하고, 캡슐 벡터의 방향(orientation)은 개체의 속성을 나타내도록 한다. 다음으로 하위 층(layer)의 캡슐은 변환 행렬(transformation matrix)을 통해 상위 층의 캡슐의 출력을예측하고, 이 예측이 일치할수록 상위 층의 캡슐이 활성화 된다. 최종적으로 가장 활성화 된 캡슐의 해당하는 감정을 각 문장의 감정으로 판단한다.본 논문에서는 캡슐 네트워크를 이용한 감정 인식 기법이 기존 CNN을 이용한 감정 인식 기법보다 효과적임을 실험을 통해 증명하였다.
Publisher
한국통신학회
Conference Place
KO
URI
https://scholar.gist.ac.kr/handle/local/23017
공개 및 라이선스
  • 공개 구분공개
파일 목록
  • 관련 파일이 존재하지 않습니다.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.