Research Stories

View All

Research Stories

머신러닝으로 임상시험을 혁신하다

머신러닝 및 인공지능 기반 적응적 무작위배정과 통계적 신뢰성의 완벽한 조화

통계학과 박연희 교수

  • 머신러닝으로 임상시험을 혁신하다
Scroll Down

성균관대학교 통계학과 박연희 교수는 머신러닝을 임상시험 설계에 실제로 적용할 수 있는 새로운 통계 방법론(MARGO: Machine Learning-Assisted Adaptive Randomization for Group Sequential Trials Based on Overlap Weights)을 개발하였다. 본 연구는 머신러닝 및 인공지능 기반 의사결정을 임상시험이라는 엄밀한 과학적 환경에 안전하게 도입할 수 있는 실질적인 방법을 처음으로 제시했다는 점에서 주목을 받고 있다.


임상시험 혁신의 꿈과 현실적 장벽

최근 머신러닝과 인공지능 기술은 임상시험에서 환자 맞춤형 치료 배정을 위한 핵심 도구로 각광받고 있다. 특히 임상시험 도중 축적되는 데이터를 실시간으로 분석해 더 효과적인 치료에 환자를 배정하는 '적응적 무작위배정(adaptive randomization)'은 환자 예후를 개선할 수 있는 유망한 접근법이다. 그러나 이 방법을 실제 임상시험에 적용하면 심각한 통계적 문제가 발생할 수 있다. 환자의 특성(바이오마커 등)을 반영해 치료를 배정할 경우 치료군 간 공변량 불균형이 생기고, 이는 치료 효과 추정의 편향과 제1종 오류(type I error) 증가로 이어져 잘못된 결론을 도출할 위험이 있다. 특히 임상시험 도중 조기 종료 여부를 판단하는 그룹 순차 설계(group sequential design) 환경에서는 이 문제가 더욱 심화된다.


머신러닝 + 인과추론: 두 마리 토끼를 잡다

박연희 교수는 이 근본적인 문제를 해결하기 위해 머신러닝 예측 모형과 인과추론 기반 propensity score weighting 기법인overlap weight(OW)를 결합한 MARGO를 제안하였다. MARGO는 환자의 공변량 정보를 활용해 각 치료에 대한 성공 확률을 머신러닝으로 예측하고, 이를 기반으로 더 효과적인 치료에 환자를 배정한다. 동시에 OW 기법을 통해 치료군 간 공변량 불균형을 보정함으로써, 적응적 무작위배정으로 인한 편향과 제1종 오류 증가 문제를 효과적으로 제어한다. 연구에서는 SVM, KNN, Random Forest, MLP 등 4가지 머신러닝 알고리즘을 적용하여 그 효과를 검증하였다.


시뮬레이션으로 검증된 우월한 성능

광범위한 시뮬레이션 연구 결과, MARGO는 기존의 고정 무작위배정 방식 및 기존 적응적 무작위배정 방법들과 비교하여 세 가지 측면에서 모두 우월한 성능을 보였다. 첫째, 더 많은 환자를 효과적인 치료에 배정하였다. 둘째, 전체 제1종 오류율을 목표 수준(0.05) 이하로 안정적으로 유지하였다. 특히 기존 방법들이 제1종 오류율을 최대 0.08~0.18까지 부풀린 시나리오에서도 MARGO는 이를 0.05 이하로 제어하는 데 성공하였다. 셋째, 치료 효과가 실재하는 시나리오에서 높은 검정력을 유지하면서 환자 실패 수를 줄였다. 이는 임상시험의 윤리성과 신뢰성을 동시에 향상시킬 수 있음을 의미한다.


"AI를 사용하는 것"에서 "AI를 신뢰할 수 있게 사용하는 것"으로

이번 연구의 가장 중요한 성과는 머신러닝을 임상시험에 단순히 도입하는 것을 넘어, 그 과정에서 발생하는 근본적인 통계적 문제를 엄밀하게 해결했다는 점이다. MARGO는 향후 다양한 인공지능 모델로 확장 적용될 수 있으며, 정밀의학 기반 임상시험뿐만 아니라 데이터 기반 의사결정이 필요한 다양한 분야에 기여할 것으로 기대한다.


본 연구는 Statistics in Medicine에 2025년 게재되었다.


논문 게재 성과 SKKU RESEARCH STORY

MARGO: Machine Learning-Assisted Adaptive Randomization for Group Sequential Trials Based on Overlap Weights



그림1. 중간분석을 포함한 적응적 무작위배정 설계 프레임워크



그림 2. 시뮬레이션 결과: 제1종 오류율의 목표 수준 이하 통제

COPYRIGHT ⓒ 2017 SUNGKYUNKWAN UNIVERSITY ALL RIGHTS RESERVED. Contact us