캡슐 네트워크를 이용한 음성 스펙트로그램에서의 감정 인식
- Author(s)
- Yoo, Jeonghwa; Kim, Hansol; Yoon, Sang Hyu; Shin, Jong Won
- Type
- Conference Paper
- Citation
- 한국통신학회 하계종합학술발표회, pp.1223 - 1224
- Issued Date
- 2019-06-01
- Abstract
- 본 논문은 음성 스펙트로그램에서 CNN(convolutional neural networks)의 약점을 보완한 캡슐 네트워크(capsule network)기반의 감정 인식 기법을제안한다. 먼저, 스펙트로그램 정보를 인스턴스화 파라미터(instantiation parameter)를 나타내는 뉴런의 그룹인 벡터(vector) 형태의 캡슐(capsule)로나타낸다. 이 때, 스쿼시 함수(squash function)를 이용하여 캡슐 벡터의 길이는 개체(entity)가 존재할 확률을 나타내게 하고, 캡슐 벡터의 방향(orientation)은 개체의 속성을 나타내도록 한다. 다음으로 하위 층(layer)의 캡슐은 변환 행렬(transformation matrix)을 통해 상위 층의 캡슐의 출력을예측하고, 이 예측이 일치할수록 상위 층의 캡슐이 활성화 된다. 최종적으로 가장 활성화 된 캡슐의 해당하는 감정을 각 문장의 감정으로 판단한다.본 논문에서는 캡슐 네트워크를 이용한 감정 인식 기법이 기존 CNN을 이용한 감정 인식 기법보다 효과적임을 실험을 통해 증명하였다.
- Publisher
- 한국통신학회
- Conference Place
- KO
- URI
- https://scholar.gist.ac.kr/handle/local/23017
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.