OAK

Continual adaptation for miss-coil video anomaly detection at down-coilers in hot strip mills Minsu Kim College of Information and Computing Gwangju Institute of Science and Technology

Metadata Downloads
Author(s)
Minsu Kim
Type
Thesis
Degree
Master
Department
정보컴퓨팅대학 AI융합학과
Advisor
Lee, Kyoobin
Abstract
In hot strip mills, manual detection of down-coiler miss-coil risks delayed response and prolonged line shutdowns. To address this, we present a real-time video anomaly detection (VAD) approach designed for rare abnormal events, degraded visibility (mist, steam, splash), and distribution shift across coils. We propose a lightweight, adaptive framework that limits storage growth. It targets fixed-view CCTV at down-coilers and has three stages sharing a frozen DINOv2 backbone and a frame-invariant foreground mask; only a small temporal head is trained on normal data. (S1) establishes the stable spatial representation by scoring DINOv2 patch tokens and provides localized evidence; (S2) builds on the same masked patch-mean embeddings with a Long Short-Term Memory (LSTM) sequence model that learns temporal consistency and uses multi- step error as a frame-level anomaly score; and (S3) a continual adaptation stage in which operators review alarms, operator-verified normal spans expand a compact replay buffer, redundancy is pruned by similarity, and the model is updated between coils. Across three sites (ZPR, DC_ESG, DC_MD), frame-level Area Under the Receiver Operating Characteristic Curve (AUROC) improved (e.g., DC_MD 0.9218 to 0.9603). The false positive rate at 95% true positive rate (FPR@95) also decreased from 2.89% to 0.30% on ZPR and from 72.50% to 32.74% on DC_MD, confirming robustness against visibility noise via spatial masking and temporal modeling. The system operates in real time (∼110 FPS; ≈9.0 ms/frame). Under S3, sequential adaptation reduced before- update false positives on the last-normal clip while keeping the test AUROC within 0.011 of the full-update result.|열연 공정에서 다운코일러 미스코일을 수동으로 판별하면 대응이 지연되고 장시간 라인 정지로 이어질 수 있다. 이를 해결하기 위해, 본 연구는 희귀 이상 상황과 시야 열 화(안개·증기·비산수), 코일 간 분포 이동에 대응하는 실시간 비디오 이상 탐지(VAD) 방법을제안한다.제안방식은저장공간증가를억제하는경량적응형구조로,다운코일 러의고정시야 CCTV를대상으로한다.세단계는모두 동결된 DINOv2백본과프레임 불변전경마스크를공유하며,정상데이터로소형시간모듈만학습한다. S1은 DINOv2 패치 토큰을 점수화해 안정적 공간 표현을 확립하고 국소 근거를 제공한다. S2는 동일한 마스크된 패치-평균 임베딩 위에 LSTM 기반 시퀀스 모델을 구성하여 시간적 일관성을 학습하고, 다단계 오차를 프레임 수준 이상 점수로 사용한다. S3에서는 운영자가 알람을 검토하고,운영자확인정상구간으로압축리플레이버퍼를확장하며(유사도기반중복 제거), 코일 사이에 모델을 갱신한다. 세 데이터셋(ZPR, DC_ESG, DC_MD)에서 프레임 단위 AUROC가 전반적으로 향 상되었으며, 예를 들어 DC_MD의 경우 0.9218에서 0.9603으로 개선되었다. 또한 95% TPR에서의오탐률(FPR@95)은 ZPR에서 2.89%에서 0.30%로, DC_MD에서 72.50%에 서 32.74%로 감소하여, 공간 마스킹과 시계열 모델링을 통해 가시성 노이즈에 대해서도 – iii – 강인한 성능을 보임을 확인하였다. 제안 시스템은 약 110 FPS(프레임당 약 9.0 ms)로 실시간 동작한다. 아울러 S3 단계에서 순차적 적응을 수행하면, 마지막 정상 구간에서 업데이트 이전의 오탐을 줄이면서도 테스트 AUROC를 전면 재학습한 경우 대비 0.011 이내로 유지할 수 있었다.
URI
https://scholar.gist.ac.kr/handle/local/33702
Fulltext
http://gist.dcollection.net/common/orgView/200000944858
Alternative Author(s)
김민수
Appears in Collections:
Department of AI Convergence > 3. Theses(Master)
공개 및 라이선스
  • 공개 구분공개
파일 목록
  • 관련 파일이 존재하지 않습니다.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.