에이아이트릭스 연구팀이 개발한 TIMING 기법 연구 논문이 세계 최고 권위의 인공지능(AI) 학회 중 하나인 ICML 2025에서 Spotlight 논문으로 선정되었습니다.🎉 전체 제출 논문의 단 2.6%만이 Spotlight에 오르는 만큼, 이번 성과는 의료 AI 분야에서 에이아이트릭스의 연구력이 세계적으로 인정받았다는 점에서 큰 의미가 있습니다.
특히, 이번 연구는 에이아이트릭스가 AI 모델의 성능을 높이는 데 그치지 않고 의료 AI가 실제 현장에서 신뢰받기 위해 반드시 필요한 투명성과 신뢰성이라는 근본적인 문제에 깊이 있게 접근하고 있음을 보여주는 사례로서 더욱 의미가 있는데요.
그렇다면 지금부터 TIMING 기법이 탄생하게 된 배경과 연구 과정, 그리고 이를 통해 얻은 성과와 의미를 소개하겠습니다.
👀 왜 설명 가능한 인공지능(XAI)이 중요한가?
의료 현장에서 환자 상태 악화 예측 솔루션 AITRICS-VC(바이탈케어)는 환자의 생체신호(혈압, 심박수, 체온 등)를 분석해 환자의 상태를 예측합니다. 그러나 의료진이 AI의 판단을 신뢰하고 활용하기 위해서는 단순히 '예측 결과'가 아니라 '왜 그런 예측을 했는가'에 대한 근거가 필요합니다. 예측 결과만 제공된다면 의료진은 그 의미를 충분히 해석하기 어렵고, 설명이 뒷받침되어야 의료진이 예측을 신뢰하고 임상 의사결정에 활용할 수 있기 때문입니다.
XAI는 이러한 불확실성을 줄여 의료진이 예측 결과를 해석하고 임상 의사결정 과정에 적극적으로 반영할 수 있도록 돕습니다. 특히, 의료 환경에서는 작은 신호 하나가 환자의 생명을 좌우할 수 있습니다. 어떤 데이터가 위험 신호에 영향을 주었는지, 혹은 안정 요인으로 작용했는지를 명확히 설명하는 것이 필수적입니다.
🔎 기존의 XAI 기법의 한계에서 TIMING의 탄생까지
기존 시계열 XAI 기법은 특정 시점의 신호가 중요하다는 사실은 알려주지만, 그것이 예측을 높이는 요인인지 낮추는 요인인지는 설명하지 못했습니다. 이는 안전성이 중요한 의료 환경에서 치명적인 한계일 수 있는데요.
이러한 문제를 해결하기 위해 에이아이트릭스 연구팀은 먼저 널리 활용되는 대표적인 기법을 다시 살펴보기로 했습니다. 그중 구글에서 개발한 XAI 기법인 'Integrated Gradients (IG)'에 주목했어요. 다양한 데이터 유형에서 성능을 보여온 IG조차 시계열 데이터에서는 성능이 떨어지는 이유를 규명한 것이 연구의 출발점이었습니다.
기존 평가 방법들에서 두 가지 문제를 발견했습니다.
첫째는 기존 시계열 XAI 논문들에서 공통으로 사용하는 평가 방법들이 예측 스코어를 높이는 영향과 낮추는 영향을 서로 상쇄시켜 버린다는 점이었습니다. 예측에 긍정적으로 기여하는 신호(+10점)와 부정적으로 기여하는 신호(-10점)를 단순 합산해 '0점, 중요하지 않다'로 처리하는 것이었어요. 실제로는 두 신호 모두 중요한데, 서로를 상쇄해버리는 바람에 잘못된 결론이 나왔던 것입니다.
둘째는 IG가 시계열 데이터의 특성을 충분히 반영하지 못한다는 점이었습니다. 계산 과정에서 실제 데이터 분포와 동떨어진 Out-of-Distribution(OOD) 샘플이 발생하고, 시간 흐름 속에서 신호들이 서로 얽혀 있는 Temporal Dependency를 고려하지 못했습니다.
이 문제를 해결하기 위해 단계적으로 접근했습니다. 먼저, 기존 평가 방식의 한계를 보완하기 위해 새로운 지표 CPD(Cumulative Prediction Difference)와 CPP(Cumulative Prediction Preservation)를 제안했습니다. CPD는 중요한 시점들을 하나씩 제거하며 예측 변화량을 추적하고, CPP는 덜 중요한 시점들을 제거했을 때 예측이 얼마나 안정적으로 유지되는지를 측정합니다.
그 다음, IG 자체를 시계열 데이터에 맞게 고도화했습니다. 단순히 모든 시점을 동시에 스케일링하지 않고, Segment-based Random Masking 방식을 도입했습니다. 일부 구간은 원본 데이터를 그대로 남겨 시간적 연속성을 유지하면서, 나머지 구간에서는 신호를 차단해 각 시점이 독립적으로 어떤 영향을 주는지를 볼 수 있도록 만들었습니다.
이렇게 변형된 경로에서 각 시점의 영향을 관찰함으로써 시간적 관계가 깨어졌을 때도 특정 시점이 예측에 얼마나 독립적으로 영향을 미치는지를 파악할 수 있고, 동시에 원본 데이터의 부분적 보존으로 OOD 문제로 인한 불안정성도 완화하는 효과를 얻을 수 있었습니다. 결과적으로, TIMING은 시간적 의존성을 고려하면서도 안정적이고 신뢰할 수 있는 설명을 제공하게 됐습니다.
💡 연구 성과와 임상적 의미
TIMING 기법은 MIMIC-III, PAM, Epilepsy 등 실제 임상 데이터를 포함한 6개 데이터셋에서 기존 방법 대비 최대 109.8%의 성능 향상을 보였습니다. 또한 CNN, RNN, Transformer 등 다양한 AI 모델 아키텍처에 적용했을 때도 일관된 개선 효과를 확인했고, 계산 효율성도 우수해서 샘플당 0.04초의 실시간 의료 모니터링에 적합한 처리 속도를 입증했습니다.
무엇보다 TIMING은 단순히 모델의 판단 과정을 보여주는 수준을 넘어, 설명 결과가 임상적 지식과 일관된다는 점에서 의미가 큽니다. 예를 들어, 중환자실 환자의 혈중 젖산 수치가 높을 때 TIMING은 이 수치가 중요하다고만 설명하는 것이 아니라, 그것이 사망 위험을 높이는 요인인지, 혹은 다른 요인에 의해 상쇄되는지를 구체적으로 보여주며 임상적 지식과 일치하는 해석 결과를 보여주었습니다.
🚀 TIMING이 바꿀 의료 AI의 미래
이번 연구는 기존 시계열 XAI 연구들이 공통적으로 사용해 온 평가 지표가 잘못되었음을 논리적으로 짚어내고, 새로운 지표(CPD, CPP)를 통해 이를 바로잡았다는 점에서 큰 의미가 있습니다. 이를 통해 최신 전용 기법보다 오히려 고전적인 Gradient 기반 방법이 더 잘 동작한다는 사실을 밝혀낸 것도 중요한 성과였습니다.
에이아이트릭스 연구팀은 이번 성과를 바탕으로 TIMING을 실제 환자 상태 악화 예측 AI 솔루션 바이탈케어에 적용해, 환자 안전과 임상적 활용도를 한층 높여 나갈 계획입니다.
앞으로도 기술적 우수성과 함께 의료 현장의 실질적 요구를 충족하는 AI를 통해 더 안전하고 신뢰할 수 있는 의료 미래를 만들어가는 에이아이트릭스를 기대해주세요!
📄 관련 논문
· [TIMING: Temporality-Aware Integrated Gradients for Time Series Explanation 논문 보기]
'인사이트' 카테고리의 다른 글
다양한 환경·데이터 속에서도 통하는 AI — MAES 모델의 현장 성능 검증과 결측값 해석 (0) | 2025.08.19 |
---|---|
IMDRF(International Medical Device Regulators Forum) 27th 참관기 (0) | 2025.03.31 |
유럽응급의학회 학술대회 EUSEM Congress 2024 참관기 (27) | 2024.11.21 |
아시아 최대 바이오 기술 전시회 바이오재팬(BioJapan) 2024 참관기 (0) | 2024.11.08 |
European Respiratory Society(ERS) Congress 2024 참관기 (1) | 2024.10.22 |