Metaheuristic-based Time Series Clustering for Anomaly Detection in Manufacturing Industry
- Abstract
- 오늘날 시계열 클러스터링은 제조 산업에서 매우 중요하다. 한편, 계산 복잡성과 변수 다양성으로 인해 설명 가능한 결과와 우수한 성능을 함께 달성하는 것은 매우 어려운 일이다. 이 어려움을 효과적으로 처리하기 위해 본 논문에서는 기존 클러스터링 접근 방식의 효율성과 논리성을 향상시킬 수 있는 새로운 메타휴리스틱 기반 시계열 클러스터링 방법을 제시한다. 본 논문은 제조 시계열 데이터에 대한 동적 시간 왜곡(DTW)뿐 아니라 모양 기반 거리 측정을 통해 계층 및 분할 클러스터링에서 최적 클러스터 후보를 수집한다. 수집된 후보 클러스터에 ECGA(Extended Compact Genetic Algorithm)와 같은 분포 알고리즘의 추정(EDA)을 강조하는 메타휴리스틱을 적용하여 최소 거리를 지닌 향상된 클러스터 중심 조합을 얻을 수 있다. ECGA는 최적화된 해를 찾는 주기 동안 후보 해가 분포하고 있는 인구 공간에서 가장 덜 복잡하고 가장 밀접하게 관련된 확률 모델 구조를 추론하고 사용한다. ECGA의 이 기능은 최적의 솔루션이 어떻게 달성되었는지에 대해 클러스터링 결과에 대한 이해를 강화한다. 대중에게 공개된 제조 업계의 실제 시계열 데이터를 사용하여 본 논문의 제시 방법을 테스트했으며 기존의 정립된 머신러닝 및 딥러닝 방법과 대비하였을 때 비교할 만한 성능을 보였다. 이에, 본 논문은 시계열 데이터 클러스터링 방법에 메타휴리스틱 기술을 적용하여 이해 가능한 결과와 탁월한 성능을 함께 얻는 것이 가능할 수 있음을 보여준다.|Nowadays time series clustering is of great importance in manufacturing industries. Meanwhile, it is considerably challenging to achieve explainable solution as well as significant performance due to computation complexity and variable diversity. To efficaciously handle the difficulty, this paper presents a novel metaheuristic-based time series clustering method which can improve the effectiveness and logicality of existing clustering approaches. We collect candidate cluster references from hierarchical and partitional clustering through shape-based distance measure as well as dynamic time warping (DTW) on manufacturing time series data. By applying metaheuristics highlighting estimation of distribution algorithms (EDA), such as extended compact genetic algorithm (ECGA), on the collected candidate clusters, advanced cluster centroid combinations with minimal distances can be achieved. ECGA employs the least complicated and the most closely related probabilistic model structure regarding population space during generation cycle. This feature strengthens the comprehension of clustering results in how such optimal solutions were achieved. We tested our method on real-world time series data, open to the public, from manufacturing industry, and showed noticeable performances compared to well-established methods. Accordingly, we demonstrate that obtaining both comprehensible result as well as prominent performance is feasible by employing metaheuristic techniques to time series data clustering methods.
- Author(s)
- Woong Hyun Suh
- Issued Date
- 2022
- Type
- Thesis
- URI
- https://scholar.gist.ac.kr/handle/local/19485
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.