Enhancing Thermal Infrared Aerial Object Detection via Visible-Driven Translation and Semantic-Aware Augmentation
- Author(s)
- Kim Soo Yeon
- Type
- Thesis
- Degree
- Master
- Department
- 대학원 전기전자컴퓨터공학부
- Advisor
- Jeon, Moongu
- Abstract
- 열화상 영상은 야간과 같이, 낮은 가시성 환경에서 감시 및 정찰 목적의 객체 탐지에서 핵심적인 역할을 하지만, 데이터 부족으로 인해 연구 확장성이 제한되고 있다. 이에따라 최근에는 가시광 영상을 열화상 스타일로 변환하는 접근법이 활발히 연구되고 있다. 기존 연구들은 변환 품질 평가 시 특정 열화상 영상을 절대적 정답으로 간주해 변환 결과의 시각적 유사성만을 기준으로 품질을 판단한다. 이러한 접근은 변환 영상의 시각적 품질 향상에는 효과적일수는 있지만, 실제 객체 탐지 모델의 성능 향상과는 반드시 일치하지 않는다. 본 연구에서는 이러한 한계를 인식하고, 열화상 객체 탐지 성능 향상에 효과적인 전략을 탐색하였다. 변환된 열화상 스타일 데이터로 객체 탐지 모델을 사전학습 할 때, 객체 마스크에 Perlin Noise를 주입하거나 Contour Smoothing을 적용하는 노이즈 주입 기반 데이터 증갑 기법이 매우 효과적이며, 기존 베이스라인 대비 유의미한 성능 개선에 도움을 줄 수 있음을 실험적으로 입증하였다. ©2026 김 수 연 ALL RIGHTS RESERVED|Thermal infrared imagery is essential in low-visibility conditions. However, the scarcity of large-scale datasets significantly limits research scalability. To address this issue, recent studies have explored visible-to-thermal translation methods. Most existing approaches, however, evaluate translation quality by treating a single thermal image as ground truth and measuring only the visual similarity between the translated output and this reference image, which does not necessarily correlate with the perfor- mance of downstream object detection models. In this study, we revisit this limitation and investigate strategies that more effectively enhance thermal infrared aerial ob- ject detection. Our experiments demonstrate that using translated images for detector pretraining—combined with augmentations such as Perlin-noise injection or contour smoothing—can yield meaningful performance improvements. ©2026 SooYeon Kim ALL RIGHTS RESERVED
- URI
- https://scholar.gist.ac.kr/handle/local/33740
- Fulltext
- http://gist.dcollection.net/common/orgView/200000946045
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.