Research Stories

16만여건의 민원 텍스트 자동분류 알고리즘 제안

서울특별시 스마트 시티 시스템 구축에 초석

인터랙션사이언스학과 김장현 교수 · 김병준/이겨레/유민주 연구원, 서울디지털재단 박건철 책임

  • 16만여건의 민원 텍스트 자동분류 알고리즘 제안
  • 16만여건의 민원 텍스트 자동분류 알고리즘 제안
Scroll Down

저출산 고령화 사회에 따라 세계 각국의 수도 및 대도시는 더 집중화되고 그에 따른 복잡한 문제가 발생중이다. 도시에 더 많은 사람들이 몰려들면서 민원의 양은 더욱 증가하였지만 이를 대응할만한 인력은 턱없이 부족하다. 


우리 대학 인터랙션사이언스학과 김장현 교수 연구팀(1저자: 김병준, 2저자: 이겨레/유민주 박사과정)은 서울 디지털재단 박건철 책임(2저자)과 함께 2006년부터 2017년까지 10여 년간의 민원 텍스트 16만건을 기계학습을 통해 자동 분류하는 알고리즘을 제안해 CITIES (SSCI, JCR 2019 IF= 4.802, Top #2 in Urban Studies)에 게재하였다. Word2vec과 랜덤 포레스트(Random forest)를 기반으로 교통, 환경, 문화 등 10가지의 민원을 인공지능이 약 70%의 정확도로 분류할 수 있다. 기존의 민원 담당 공무원이 일일이 손으로 분류해야했던 비효율적인 행정 절차가 기계학습을 통해 빠르고 정확하게 효율적인 민원대응으로 탈바꿈 가능하다.


이에 더해 자동 분류한 민원을 시계열 토픽 모델링 (Dynamic topic modeling)으로 분석해 현재 중요한 민원 주제와 앞으로 부상하거나 줄어들 민원 주제를 예측할 수 있는 방법을 제안하였다.


마지막으로 데이터 분석 과정을 github와 책(도시데이터표준분석모델 : 민원분석편)으로 공개해 앞으로 각 지방 자치단체의 스마트 시티 시스템 구축에 도움이 될 수 있도록 하였다.


해당 논문과 분석 과정을 메뉴얼화해서 나온 책은 아래 사이트를 통해 확인할 수 있다.



https://www.sciencedirect.com/science/article/pii/S0264275120312890#f0005

https://github.com/SeoulDigitalFoundation/VoiceOfSeoul_AnalysisGuide

https://sdf.seoul.kr/research-report/1241



그림 1. 지하철 임산부 노약자석 관련 민원 추이



그림 2. 미세먼지와 에너지 절약 관련 민원 추이



COPYRIGHT ⓒ 2017 SUNGKYUNKWAN UNIVERSITY ALL RIGHTS RESERVED. Contact us