OAK

Enhancing RAG Performance with GA-based Weighted Reranker Optimization

Metadata Downloads
Abstract
This study presents a novel approach for optimizing reranker performance in Retrieval-Augmented Generation (RAG) systems using Genetic Algorithms (GA). Existing RAG systems typically rely on fixed weights or single reranker models, which fail to effectively capture the diverse characteristics of multiple reranker models. To address this limitation, we propose using GA to dynamically optimize the weights of reranker models by assigning optimal weights to each reranker and maximizing their characteristic that can enhance the accuracy of the final document ranking. Experiments conducted with 708 document-query pairs show that the GA-optimized reranker achieved an accuracy rate of 76.69%, significantly outperforming the highest-performing individual reranker, FlashRank (72.88%). This study demonstrates that GA optimization can significantly improve reranking performance in RAG systems and highlights its potential for application in complex domains such as finance. Additionally, the proposed GA-based optimization method effectively combines multiple reranker models to maximize document retrieval and response performance.|본 연구는 유전자 알고리즘(Genetic Algorithm, GA)을 활용하여 Retrieval-Augmented Generation (RAG) 시스템의 리랭커(Reranker)의 성능을 최적화하는 접근 방안을 제시한다. 기존의 RAG 시스템은 주로 고정된 가중치나 단일 리랭커 모델에 의존하여 여러 리랭커 모델의 다양한 특성을 충분히 반영하지 못한다는 한계가 있다. 이를 극복하기 위해 본 연구에서는 GA를 활용하여 각 리랭커 모델의 가중치를 동적으로 최적화하고, 이를 통해 리랭킹 성능을 개선해 최종 문서 순위 결정의 정확도를 높일수 있고자 하였다. 실험은 708개의 문서-질의 쌍을 사용하여 수행되었으며, GA 최적화 리랭커는 76.69\%의 정답률을 기록하며, 개별 리랭커 중 가장 높은 성능을 보인 FlashRank(72.88\%)를 초과하는 성과를 달성하였다. GA는 각 리랭커에 적합한 가중치를 할당하여 리랭커들의 장점을 극대화하며, 최종 문서 순위 결정의 정확도를 크게 향상시켰다. 본 연구는 GA 기반 최적화가 RAG 시스템의 리랭킹 성능을 크게 향상시킬 수 있음을 보여주며, 금융과 같은 복잡한 도메인에 적용할 잠재력을 지닌다는 점을 강조한다. 또한, 제안된 GA 기반의 최적화 방법이 다양한 리랭커 모델을 효과적으로 결합하여 문서 검색 및 응답 성능을 극대화하는 역할을 할 수 있음을 보여준다.
Author(s)
윤수인
Issued Date
2025
Type
Thesis
URI
https://scholar.gist.ac.kr/handle/local/19251
Alternative Author(s)
SOOIN YOON
Department
대학원 AI대학원
Advisor
Ahn, Chang Wook
Table Of Contents
Abstract (English) i
Abstract (Korean) iii
List of Contents v
List of Tables vii
List of Figures viii
List of Algorithms ix
1 Introduction 1
2 Background and Theory 5
2.1 Overview of Retrieval-Augumented Generation Systems 5
2.2 Rerankers in RAG Systems 7
2.3 Metaheuristic Optimization and Genetic Algorithm 9
2.4 Optimization of Reranker Weights 11
3 Experiments 15
3.1 Datasets 16
3.2 Composition of a RAG System 18
3.2.1 Load 18
3.2.2 Split 18
3.2.3 Embeddings 19
3.2.4 Vector Database 19
3.2.5 Retrieval 19
3.2.6 Reranking 20
3.2.7 Prompting 25
3.2.8 LLM & Output 25
3.3 Genetic Algorithm Configuration 27
3.3.1 Document Combined Score 27
3.3.2 Components of Genetic Algorithm (GA) 29
3.4 Evaluation Method 36
3.5 Genetic Algorithm Parameter Settings 37
4 Results 39
4.1 Experimental Results and Analysis 39
4.2 Analysis of Optimized Weights for GA-based Rerankers 42
4.3 Limitations and Future Works 44
5 Conclusion 46
References 47
Degree
Master
Appears in Collections:
Department of AI Convergence > 3. Theses(Master)
공개 및 라이선스
  • 공개 구분공개
파일 목록
  • 관련 파일이 존재하지 않습니다.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.