이한정 교수 연구팀, 영어 빅데이터 분석을 통한 영어 문장 구조의 선택 원리 규명
- 인과적 사건 구조 실현의 문맥적 요인 최초 규명

▲(왼쪽부터) 제1저자 김지연 박사과정생, 교신저자 이한정 교수, 공동저자 조예은 박사과정생
영어영문학과 이한정 교수 연구팀이 영어 문장의 인과적 사건 구조 선택에 영향을 미치는 핵심 요인을 규명한 논문을 국제저명학술지 Corpus Linguistics and Linguistic Theory에 게재했다.
이번 연구는 이한정 교수(영어영문학과), 김지연 박사과정생(독어독문학과), 조예은 박사과정생(영어영문학과)로 구성된 ‘언어, 인지와 인공지능’ 연구진이 수행했다. 연구팀은 약 1억 단어로 구성된 영국 국가 코퍼스*(British National Corpus: BNC)로부터 자연어처리(NLP) 도구를 활용해 직접 원인(direct cause)에 의한 사건을 표현한 문장 1만 5천여 개를 추출하고, 이를 기반으로 질적 분석과 기계 학습 기반의 다요인 분석을 병행했다.
* 영국 국가 코퍼스: 영어 연구에서 자주 쓰이는 영어 텍스트 빅데이터
분석 결과, 인과적 사건의 구조 실현에는 원인의 명확성과 의도성이 가장 큰 영향을 미치는 것으로 나타났다. 예컨대 “The protesters broke the window”처럼 행위자가 명시된 구조와 “The window broke” 또는 “The window was broken”처럼 원인이 명시되지 않은 구조는 이러한 요인의 영향을 받아 선택된다. 이외에도 자동문과 수동문 구조 선택에 작용하는 다양한 문맥적 조건들을 밝혀내어, 언어 정보성, 맥락 적절성, 표현의 경제성이 상호작용하는 언어 표현의 원리를 실증적으로 제시했다는 평가를 받고 있다.
이번 연구는 한국연구재단의 지원으로 수행되었으며, 연구팀은 후속 연구로 영어 및 한국어 화자, 인공지능 언어모델을 대상으로 비언어적 지각 요인이 언어 표현에 미치는 영향을 실험적으로 탐색하고 있다. 이한정 교수는 “언어와 인지, 감정, 지각 그리고 문화가 교차하는 영역에서 대규모 언어 모델(GPT 및 BERT)을 기반으로 활용한 새로운 연구를 지속적으로 전개할 것”이라고 밝혔다.
※ 논문명: Semantic and contextual constraints on the causative alternation in English: A multifactorial analysis
※ 게재 학술지: Corpus Linguistics and Linguistic Theory (De Gruyter Brill)
※ 저자: 김지연(제1저자), 이한정(교신저자), 조예은(공동저자)
※ 논문 링크: https://doi.org/10.1515/cllt-2024-0047