OAK

Deep Representation Learning of Electronic Health Records for Cardiovascular Disease Patients

Metadata Downloads
Author(s)
Seunga Lee
Type
Thesis
Degree
Master
Department
정보컴퓨팅대학 AI융합학과
Advisor
Kim, Mansu
Abstract
Electronic Health Records (EHRs) contain rich longitudinal clinical data that are vital for the advancement of precision medicine; however, their inherent complexity presents significant analytical challenges. This thesis investigates deep representation learning methodologies for EHR data, with a particular focus on cardiovascular risk modeling. Specifically, it addresses two distinct clinical applications: (1) individualized antiplatelet therapy selection for patients with type 2 diabetes mellitus (T2DM), and (2) temporal risk stratification for repeat percutaneous coronary intervention (PCI) among patients who have undergone initial PCI.

In the first application, phenomapping techniques are employed to guide the selection between cilostazol and aspirin in T2DM patients. Conventional phenomapping methods relying on raw clinical features are insufficient to capture complex patient heterogeneity. To address this, a graph-based phenomapping framework is proposed using GraphSAGE, an inductive graph neural network, to model higher-order clinical relationships and generate expressive patient embeddings. These representations enable improved patient stratification, and survival analyses—including log-rank tests—demonstrate that the learned embeddings reliably identify subgroups with differential responses to cilostazol and aspirin.

The second application introduces DA-RNN-Surv, a dual-attention recurrent neural network (RNN) designed to model longitudinal EHR trajectories for survival prediction. This approach addresses key limitations of traditional models such as Cox and DeepSurv, which rely solely on static baseline covariates. By incorporating temporal and feature-level attention, DA-RNN-Surv captures dynamic clinical risk and provides interpretable predictions. Empirical evaluations demonstrate superior predictive accuracy and clinically meaningful attention patterns, particularly for long-term repeat PCI prediction.

In conclusion, this thesis demonstrates the utility of deep representation learning in enhancing cardiovascular risk modeling from EHR data. The proposed graph-based and temporal attention-based embedding strategies improve both treatment personalization and survival prediction, offering clinically actionable insights to support precision cardiovascular care.|전자건강기록(EHR)은 정밀의료를 실현하는 데 필수적인 종단적 임상 데이터를 포함하고 있으나, 그 복잡성과 비정형성으로 인해 기존의 분석 기법으로는 효과적인 활용에 한계가 있다. 본 논문은 심혈관 질환 위험 예측을 위한 EHR 데이터 기반 심층 표현 학습(deep representation learning) 기법을 탐구하며, 다음의 두 가지 주요 임상 응용 사례를 중심으로 연구를 수행하였다. 첫째는 2형 당뇨병 환자를 위한 항혈소판제 맞춤 치료 전략 수립이며, 둘째는 관상동맥중재술(PCI)을 받은 환자의 재시술 위험을 시계열 기반으로 예측하는 전략 개발이다.

첫 번째 연구에서는 2형 당뇨병 환자에게 최적의 항혈소판제를 선택하기 위한 수단으로서 표현형 매핑(phenomapping) 기법을 적용하였다. 기존 임상 변수에 기반한 표현형 매핑 방식은 환자 간의 복잡한 이질성을 효과적으로 반영하지 못하는 한계가 있다. 이를 극복하기 위해 본 연구에서는 GraphSAGE 기반의 귀납적 그래프 신경망을 활용하여 고차원의 임상 관계를 모델링하고 환자 간 표현 임베딩을 생성하는 새로운 그래프 기반 표현형 매핑 프레임워크를 제안하였다. 그래프 기반 임베딩을 활용한 결과, cilostazol 또는 aspirin 치료 혜택이 큰 환자군을 보다 정확하고 효과적으로 구분할 수 있었으며, 생존 분석과 log-rank 검정을 통해 그 유효성을 검증하였다.

두 번째 연구에서는 기존 생존 분석 모델이 정적인 기준 시점 정보에 의존하여 시술 이후의 임상 궤적을 반영하지 못한다는 한계를 극복하고자 하였다. 이를 위해 반복 신경망(RNN) 기반의 생존 예측 모델인 DA-RNN-Surv를 제안하였다. 본 모델은 다시점 EHR 데이터를 입력으로 받아 시계열 정보를 임베딩하며, 시간 및 변수 수준의 attention 메커니즘을 통해 임상적으로 해석 가능한 예측 결과를 제공한다. 실제 PCI 환자 데이터를 기반으로 한 실험에서, DA-RNN-Surv는 Cox 및 DeepSurv보다 우수한 예측 성능을 보였고, 특히 장기 추적 관찰 기간에서 더 높은 정확도와 임상적 타당성을 입증하였다.

결론적으로, 본 연구는 심층 표현 학습이 EHR 기반 심혈관 위험 예측 모델의 성능과 해석 가능성을 모두 향상시킬 수 있음을 보여준다. 제안된 그래프 기반 및 시계열 attention 기반 임베딩 전략은 치료 개인화 및 생존 예측의 정확성을 높여, 정밀의료 실현을 위한 실질적인 기반을 제공한다.
URI
https://scholar.gist.ac.kr/handle/local/31862
Fulltext
http://gist.dcollection.net/common/orgView/200000902063
Alternative Author(s)
이승아
Appears in Collections:
Department of AI Convergence > 3. Theses(Master)
공개 및 라이선스
  • 공개 구분공개
파일 목록
  • 관련 파일이 존재하지 않습니다.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.