Theory-driven Textmining Methodological Frameworks: Computer-assisted Content Analysis of Infectious Disease News Report Using Unsupervised and Semisupervised Topic Modeling

Content (measure theory)
DOI: 10.20997/sr.24.1.4 Publication Date: 2023-03-09T05:18:31Z
ABSTRACT
텍스트마이닝은 컴퓨터보조내용분석 혹은 전산 내용분석으로서 내용분석 과정을 자동화함으로써 대량의 자료를 비교적 저렴한 비용으로 신뢰성있게 처리할 수 있는 조사방법이다. 기존의 텍스트 마이닝을 이용한 연구는 비지도학습 방식의 토픽모델링에만 의존하는 경우가 많아 자료기반의 탐색적 연구에 그쳤다. 이 준지도 기계학습을 이용하여 자료기반과 이론기반 텍스트마이닝을 통합적으로 적용할 방법을 제시했다. 이를 위해 이론기반의 씨앗사전을 두 가지 방식(비지도 토픽모델링과 연결망분석과 해석적 탐색 및 기존에 개발된 사전 활용)을 통해 구성하여 가설검정에 필요한 변수를 구성하는 방법론적 틀을 감염병보도에 대한 이론 기반 텍스트마이닝에 적용하여, (1) 해결지향보도, 의제설정, 틀짓기 등 3종의 이론을 토대로 가설을 설정하고, (2) 준지도학습으로 (3) 결과를 분석한 사례를 토픽모델링의 군집성능이 비지도 성능보다 우수함도 확인하고 텍스트마이닝이 지니는 사회조사의 함의에 대해 논의했다.
SUPPLEMENTAL MATERIAL
Coming soon ....
REFERENCES (0)
CITATIONS (1)