본문 바로가기

뉴스

에이아이트릭스, 국제 자연어 처리 학회 ‘NAACL’서 논문 발표

KALA 프레임워크, 전자의무기록(EMR) 기반 질의응답에서 높은 성능 얻을 있어

채택된 논문 탁월한 소수 연구에만 주어지는 구두 발표 세션에도 초청돼

 

인공지능(AI) 기술 전문 기업 에이아이트릭스(AITRICS, 대표이사 김광준, 유진규) 국제 자연어 처리(Natural Language Processing, NLP) 학회 'NAACL 2022(북미 전산 언어학 학회: Annual Conference of the North American Chapter of the Association for Computational Linguistics)' 참가해 새롭게 개발된 언어 모델에 대한 논문을 발표한다고 23 밝혔다.

 

NAACL ACL(Association for Computational Linguistics), EMNLP(Empirical Methods in Natural Language Processing) 함께 자연어 처리 분야에서 최고 수준의 국제학술대회로 꼽힌다. 에이아이트릭스는 미국 워싱턴주 시애틀에서 오는 7 10일부터 7 15일까지 진행되는 NAACL 2022 참가해 ‘KALA: Knowledge-Augmented Language Model Adaptation(지식 증강 언어 모델 적응)’ 논문을 발표할 예정이다.

 

에이아이트릭스가 논문에서 선보인 ‘KALA 프레임워크 의료분야에서 요구되는 전자의무기록(Electronic Medical Record, EMR)에서의 질의응답과 의료 논문에서의 질병 개체명 인식을 포함한 다양한 분야의 자연어 처리 태스크들에서 기존 언어 모델 대비 높은 성능을 보인다.

 

기존 BERT 같은 사전 학습된 언어 모델들(Pre-trained language models, PLMs) 기계 독해나 개체명 인식과 같은 다양한 태스크에서 훌륭한 성능을 보이고 있으나, 의료 분야와 같은 특수한 분야에서는 자연어 처리 성능이 더욱 개선될 필요가 있었다. 이를 해결하기 위해 여러 방법론들이 제시됐지만 여전히 많은 계산 비용을 필요로 한다는 단점이 있었다. 이번 연구에서 에이아이트릭스가 제안한 KALA 프레임워크는 한계를 극복했다. KALA 프레임워크는 지식 그래프를 활용하여 적은 계산 비용으로도 특수한 분야에서의 언어 모델의 성능을 높일 있다는 장점이 있다. 이와 같은 장점을 바탕으로 에이아이트릭스의 논문은 채택된 논문(Accepted papers) 중에서도 탁월한 소수의 연구에만 기회가 주어지는 구두 발표(Oral Presentation) 세션에도 초청됐다.

 

해당 연구는 에이아이트릭스의 강민기 연구원과 카이스트 백진헌 박사 과정, 황성주 에이아이트릭스 AI Division 총괄 카이스트 AI 대학원 교수가 공동연구 했다. 논문 1저자인 에이아이트릭스 강민기 연구원은에이아이트릭스에서 개발한 KALA 프레임워크는 지식 그래프를 활용함으로써 학습되지 않은 전문 분야에서의 개체명(Entity) 언어 모델이 학습한 임베딩 공간에 매핑하는 방식으로, 특수 분야에 대한 언어 모델 적응에서의 계산 효율성을 높일 있다 “NAACL 2022에서 채택된 이번 논문을 세계적인 자연어 처리 학계가 인정했다는 점은 대단히 의미 있는 성과라고 생각한다. 앞으로도 에이아이트릭스는 자연어 처리를 포함한 넓은 분야에서의 다양한 연구개발을 통해 의료 분야에서 미충족 의료 수요를 해결할 있기를 기대한다 말했다.

 

한편, 에이아이트릭스는 최고의 머신러닝 R&D 인력으로 구성된 인공지능 기술 전문 스타트업으로, NeurIPS ICML 다양한 국제 인공지능 학회에서 매년 주목할 만한 우수한 성적을 내며 세계적으로 기술력을 인정받고 있다.