Research Stories
초고차원 자료분석 위한 새로운 통계 이론·계산 방법 제시…독창성과 실용성 동시에 인정받아
통계학과 이은령 교수
성균관대학교 통계학과 이은령 교수는 2024년 8월 국제 통계학계의 최고 권위 저널 가운데 하나인 Annals of Statistics에 게재된 논문 “Efficient Functional Lasso Kernel Smoothing for High-Dimensional Additive Regression”의 연구 성과를 인정받아 2025년 제2회 올해의 대한민국 통계연구자상을 수상하였다. 시상식은 2025년 8월 28일 서울 웨스틴조선호텔에서 열린 제14회 국가통계발전포럼에서 진행되었으며, 본 상은 통계청이 국가통계 발전의 기반이 되는 통계학 연구를 장려하고 우수 연구자를 발굴·격려하기 위해 제정한 통계청장상이다.
이번 논문은 변수의 수가 표본 수보다 훨씬 많은 초고차원 데이터 환경에서, 중요한 변수를 효과적으로 선별하면서도 각 변수의 비선형 효과를 정밀하게 추정할 수 있는 새로운 통계 방법론을 제시한 연구이다. 현대 데이터 분석에서는 수많은 변수들 가운데 실제로 의미 있는 신호를 찾아내는 일과, 그 변수들이 반응값에 어떤 방식으로 영향을 미치는지를 유연하게 설명하는 일이 동시에 중요하지만, 이를 함께 만족시키는 방법을 설계하는 것은 매우 어려운 문제로 여겨져 왔다.
이은령 교수 연구팀은 이러한 한계를 극복하기 위해 functional Lasso와 smooth backfitting을 결합한 새로운 커널 기반 방법을 개발하였다. 이 방법은 중요한 변수를 자동으로 선택하는 동시에, 선택된 변수의 효과를 비선형 함수 형태로 정밀하게 추정할 수 있도록 설계되었으며, 계산 효율성과 이론적 타당성도 함께 확보하였다. 또한 편향을 보정한 추론 절차를 함께 제안함으로써 단순한 예측을 넘어 신뢰구간 구성과 유의성 검정까지 가능하게 하였다는 점에서 학문적 의미가 크다.
연구팀은 제안한 방법을 암세포주 유전자 발현자료와 항암제 반응자료에 적용하여 실제 빅데이터 분석에서도 우수한 성능을 확인하였다. 이를 통해 약물 반응과 관련된 중요한 유전자를 효과적으로 식별할 수 있음을 보였으며, 제안한 방법이 바이오정보학과 정밀의료는 물론 금융, 환경, 사회과학 등 다양한 고차원 자료 분석 문제에도 폭넓게 활용될 수 있음을 제시하였다. 이번 수상은 초고차원 자료분석을 위한 새로운 통계 이론과 계산 방법을 함께 제시한 연구의 독창성과 실용성이 동시에 높게 평가받은 성과라 할 수 있다.
▲ fLasso-SBF의 핵심 아이디어를 "입력 → 방법 → 출력" 세 단계로 요약한 도식.