머신러닝 기법을 활용한 자영업자 폐업 예측 모형 연구:서울시 25개 자치구를 중심으로장 제 훈* 요약: 자영업이 국민경제활동에서 차지하는 비중이 크고 자영업자 폐업은 개인 및 국가에 막대한 손해를 야기하고 있다는 점에서 자영업자 폐업을 감소시키는 방안이 절실히 요구되고 있다. 이에 본 연구는 3가지의 머신러닝 기법(의사결정나무, 랜덤포레스트, 서포트 벡터 머신)을 이용하여 서울시 25개 자치구를 중심으로 자영업자 폐업 예측 모형을 제시하였다. 이를 위하여 서울시에서 운영하고 있는 ‘우리마을가게 상권분석 서비스’의 공개된 상권 자료를 활용하였다. 먼저 폐업 예측 성능을 분석한 결과 서비스업은 랜덤포레스트 모형이, 외식업은 서포트 벡터 머신 모형이 가장 높게 나타났다. 이어서 폐업 예측모형에 가장 영향을 미치는 요소는 서비스업의 경우 건물단위 상존인구, 평균영업기간, 임대료 등이, 외식업은 임대료, 가구수, 건물단위 상존인구 등으로 나타났다. 이를 통해 신규 자영업자는 진입하고자 하는 상권의 특성을 파악하여 이에 맞는 생존전략을 구축할 수 있으며, 지자체와 정부에서는 기존 자영업자에 대해 영업전략 컨설팅 및 역량강화 등의 지원정책의 지표로 활용할 수 있을 것이다. 본 연구는 대표적인 머신러닝 기법들을 활용하여, 쉽게 수집할 수 있는 데이터만으로도 자영업자들의 폐업을 예측할 수 있다는 가능성을 보였다는 점에서 의의를 지닌다. 또한 자영업 창업에 직접적이고 정량적인 의사결정 지표를 도출했다는 점에서도 연구의 의의가 있다. 핵심어: 자영업자, 폐업, 예측 모형, 머신러닝 기법, 빅 데이터 □ 접수일: 2020년 12월 19일, 수정일: 2021년 2월 12일, 게재확정일: 2021년 2월 20일* 조선대학교 휴먼융합서비스학부 교수(Professor, Chosun Univ., Email: jehun@chosun.ac.kr)
A Study on the Prediction Model for Self-employed Business Closure Using Machine Learning Techniques:Focusing on 25 Autonomous Districts in SeoulJehun Jang Abstract: Given that self-employment accounts for a large portion of national economic activities and self-employed businesses are causing enormous damage to individuals and the country, measures to reduce self-employed businesses are urgently needed. Therefore, we developed a prediction model for self-employed business closure in 25 autonomous districts in Seoul by using three machine learning methods (decision tree, random forest, and support vector machine). To this end, the open commercial district data of ‘Our Village Shop Commercial Area Analysis Service’ operated by the Seoul Metropolitan Government was utilized. First, as a result of analyzing the predictive performance of business closure, the random forest model was the highest for the service industry and the support vector machine model was the highest for the catering industry. Subsequently, the factors that have the most influencing on the business closure prediction model were the surviving population by building unit, average operating period, and rent in the case of the service industry, and rent, the number of households, and the surviving population by building in the catering business. Through this, new self-employed persons can grasp the characteristics of the commercial district they want to enter and build a survival strategy appropriate for them, and local governments and governments can use them as indicators of support policies such as sales strategy consulting and capacity building for existing self-employed persons. This study is significant in that it has shown the potential to predict the closure of self-employed people by using representative machine learning techniques and by using easily collected data alone. It is also meaningful in that it derived direct and quantitative decision indicators for self-employed businesses. Key Words: Self-employed Business, Closure of Business, Prediction Model, Machine Learning Techniques, Big Data