본문 바로가기

멀티모달

[Multimodal AI] 눈과 귀를 가진 의료 AI: 판독을 넘어 추론으로 진료실 안에서는 생각보다 훨씬 많은 정보가 동시에 움직입니다.의사는 단순히 EMR에 기록된 수치만 읽는 사람이 아니에요. 혈압과 심박수 같은 수치의 흐름을 보고, 엑스레이나 피부 병변 이미지도 확인하고, 환자가 말하는 증상의 강도와 말투까지 함께 살피죠. 왜 그럴까요? 환자의 상태는 하나의 정보만으로 설명되지 않기 때문입니다. 의료 현장은 원래 변수도 많고, 불확실성도 큰 공간이니까요. 그래서 의료 AI 역시 한 가지 데이터만 잘 읽는 수준을 넘어, 서로 다른 정보를 함께 이해할 수 있어야 합니다. 바로 여기서 주목받는 기술이 멀티모달(Multimodal) AI입니다. 💡 Multimodal AI란? 글, 이미지, 음성, 숫자처럼 서로 다른 형태의 정보를 한 번에 이해하고 종합해 판단하는 인공지능입니다.. 더보기
응급실에서 ‘앞선 판단’을 가능하게 하는 AI: Multi-Modal Transformer 기반 예측 모델 응급실(ED)은 환자의 상태가 시시각각 변하고, 단 몇 분의 판단 지연이 생명을 위협할 수 있는 공간입니다. 의료진은 끊임없이 쏟아지는 활력징후 변화, 혈액 검사 결과, 엑스레이 영상, 메모 등 다양한 데이터를 동시에 고려해야 하며, 때로는 정보가 충분히 모이지 않은 상황에서도 중대한 결정을 내려야 합니다. 에이아이트릭스는 이러한 부담을 줄이기 위해, 기관삽관(Intubation), 승압제 투여(Vasopressor), 심폐소생술(CPR), 중환자실 전실(ICU admission)과 같은 응급실에서 치명적이고 중요한 네 가지 중증 이벤트를 최대 12시간 이전에 예측하는 AI 모델을 개발했습니다. 이 모델은 최근 에 게재되며 기술적 완성도를 인정받았습니다. (Choi, Arom, et al. "A nove.. 더보기