Continual adaptation for miss-coil video anomaly detection at down-coilers in hot strip mills Minsu Kim College of Information and Computing Gwangju Institute of Science and Technology
- Author(s)
- Minsu Kim
- Type
- Thesis
- Degree
- Master
- Department
- 정보컴퓨팅대학 AI융합학과
- Advisor
- Lee, Kyoobin
- Abstract
- In hot strip mills, manual detection of down-coiler miss-coil risks delayed response and prolonged line shutdowns. To address this, we present a real-time video anomaly detection (VAD) approach designed for rare abnormal events, degraded visibility (mist, steam, splash), and distribution shift across coils. We propose a lightweight, adaptive framework that limits storage growth. It targets fixed-view CCTV at down-coilers and has three stages sharing a frozen DINOv2 backbone and a frame-invariant foreground mask; only a small temporal head is trained on normal data. (S1) establishes the stable spatial representation by scoring DINOv2 patch tokens and provides localized evidence; (S2) builds on the same masked patch-mean embeddings with a Long Short-Term Memory (LSTM) sequence model that learns temporal consistency and uses multi- step error as a frame-level anomaly score; and (S3) a continual adaptation stage in which operators review alarms, operator-verified normal spans expand a compact replay buffer, redundancy is pruned by similarity, and the model is updated between coils. Across three sites (ZPR, DC_ESG, DC_MD), frame-level Area Under the Receiver Operating Characteristic Curve (AUROC) improved (e.g., DC_MD 0.9218 to 0.9603). The false positive rate at 95% true positive rate (FPR@95) also decreased from 2.89% to 0.30% on ZPR and from 72.50% to 32.74% on DC_MD, confirming robustness against visibility noise via spatial masking and temporal modeling. The system operates in real time (∼110 FPS; ≈9.0 ms/frame). Under S3, sequential adaptation reduced before- update false positives on the last-normal clip while keeping the test AUROC within 0.011 of the full-update result.|열연 공정에서 다운코일러 미스코일을 수동으로 판별하면 대응이 지연되고 장시간 라인 정지로 이어질 수 있다. 이를 해결하기 위해, 본 연구는 희귀 이상 상황과 시야 열 화(안개·증기·비산수), 코일 간 분포 이동에 대응하는 실시간 비디오 이상 탐지(VAD) 방법을제안한다.제안방식은저장공간증가를억제하는경량적응형구조로,다운코일 러의고정시야 CCTV를대상으로한다.세단계는모두 동결된 DINOv2백본과프레임 불변전경마스크를공유하며,정상데이터로소형시간모듈만학습한다. S1은 DINOv2 패치 토큰을 점수화해 안정적 공간 표현을 확립하고 국소 근거를 제공한다. S2는 동일한 마스크된 패치-평균 임베딩 위에 LSTM 기반 시퀀스 모델을 구성하여 시간적 일관성을 학습하고, 다단계 오차를 프레임 수준 이상 점수로 사용한다. S3에서는 운영자가 알람을 검토하고,운영자확인정상구간으로압축리플레이버퍼를확장하며(유사도기반중복 제거), 코일 사이에 모델을 갱신한다. 세 데이터셋(ZPR, DC_ESG, DC_MD)에서 프레임 단위 AUROC가 전반적으로 향 상되었으며, 예를 들어 DC_MD의 경우 0.9218에서 0.9603으로 개선되었다. 또한 95% TPR에서의오탐률(FPR@95)은 ZPR에서 2.89%에서 0.30%로, DC_MD에서 72.50%에 서 32.74%로 감소하여, 공간 마스킹과 시계열 모델링을 통해 가시성 노이즈에 대해서도 – iii – 강인한 성능을 보임을 확인하였다. 제안 시스템은 약 110 FPS(프레임당 약 9.0 ms)로 실시간 동작한다. 아울러 S3 단계에서 순차적 적응을 수행하면, 마지막 정상 구간에서 업데이트 이전의 오탐을 줄이면서도 테스트 AUROC를 전면 재학습한 경우 대비 0.011 이내로 유지할 수 있었다.
- URI
- https://scholar.gist.ac.kr/handle/local/33702
- Fulltext
- http://gist.dcollection.net/common/orgView/200000944858
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.