Journal of Korean Society of Forest Science
Korean Society of Forest Science
Article

머신러닝 기반 대형산불피해지의 산불피해유형 분류 모델 개발

임채준, 조원희, 이영진*https://orcid.org/0000-0002-9319-1533
Chaejun Lim, Wonhee Cho, Youngjin Lee*https://orcid.org/0000-0002-9319-1533
국립공주대학교 산림과학과
Department of Forest Science, Kongju National University, Yesan 32439, Korea
*Corresponding Author E-mail: leeyj@kongju.ac.kr

© Copyright 2024 Korean Society of Forest Science. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Oct 23, 2024; Revised: Dec 05, 2024; Accepted: Dec 17, 2024

Published Online: Dec 31, 2024

요 약

본 연구의 목적은 2023년 4월 2일 충청남도 홍성군 서부면과 결성면 일대에서 발생한 대형산불피해지(1,337.0ha)를 대상으로 산불피해유형 분류 모델을 개발하고자 하였다. 이를 위해 Maximum Likelihood Classification (MLC), Random Forest (RF), Support Vector Machine (SVM)를 활용하여 산불피해유형 분류모델을 구축하였으며, 분류 결과를 토대로 최적의 모델을 제시하였다. 산불피해유형은 수관화, 열해, 지표화로 구분하였으며, 산불피해지를 대상으로 산불피해유형에 대한 현장조사를 실시하고, 이를 기반으로 학습자료를 구축하였다. 본 연구에서는 모델 개발을 위해 Sentinel-2A의 Multi-Spectral Instrument (MSI) 영상을 기반으로 입력자료를 구축하였다. 모델의 검증 및 성능평가는 연구대상지를 기반으로 구축된 10×10m 고해상도의 산불피해등급도를 이용하여, Overall Accuracy (OA)와 Cohen’s Kappa (Kappa)를 추정하고, 산불피해유형별 User Accuracy (UA)와 Producer Accuracy (PA)를 산출하였다. 모델의 전체적인 성능을 평가한 결과 MLC (OA: 73.4%, Kappa: 0.54), RF (OA: 71.9%, Kappa: 0.50), SVM의 비선형 커널함수 (OA: 67.0%, Kappa: 0.45), SVM의 선형 커널함수 (OA: 65.3%, Kappa: 0.43) 순으로 높은 성능을 나타났으며, 산불피해유형별 분류성능은 수관화 (PA: 70~85%, UA: 55~80%), 지표화 (PA: 65~85%, UA: 80~90%) 분류에 비하여 열해 (PA: 20~55%, UA: 30~40%) 분류가 비교적 낮은 성능을 보였다. 이에 따라 본 연구에서 개발한 산불피해유형 분류모델 중 MLC 기반 모델이 가장 우수한 성능을 지닌 것으로 판단되며, 향후 산불피해지를 대상으로 산불피해유형을 분류함과 동시에 산불피해에 따른 온실가스 배출량 추정에 기여할 수 있을 것으로 기대된다.

Abstract

This study aimed to develop a model for the classification of wildfire severity in an area of 1,337 ha in Hongseong-gun, Chungcheongnam-do, that was affected by fires in 2023. Various models were generated using maximum likelihood classification (MLC), random forest (RF), and support vector machine (SVM) methods, and the best one was selected based on classification performance. Wildfire severity was classified into crown fire, heat damage, and surface fire. Field surveys provided essential ground truth data, and imagery derived from a Sentinel-2A Multi-Spectral Instrument was used as input data. Model accuracy was verified by comparing the outputs with an existing 10×10m high-resolution wildfire severity map, using the Overall Accuracy (OA), Cohen’s Kappa (Kappa), User Accuracy (UA), and Producer Accuracy values. Among the tested models, the MLC-based model showed the highest performance (OA: 73.4%, Kappa: 0.54), followed by those based on RF (OA: 71.9%, Kappa: 0.50), non-linear kernel SVM (OA: 67.0%, Kappa: 0.45), and linear kernel SVM (OA: 65.3%, Kappa: 0.43). The models’ classification performance varied by damage type, with lower accuracy being observed for heat damage (PA: 20~55%, UA: 30~40%) compared to crown fire (PA: 70~85%, UA: 55~80%) and surface fire (PA: 65~85%, UA: 80~90%). In conclusion, the MLC-based model showed the best overall performance in classifying wildfire severity. This approach is expected to assist in future efforts aiming to classify wildfire damage and estimate greenhouse gas emissions derived from burned areas.

Keywords: fire hazard; wildfire severity classification; remote sensing; machine learning algorithms

서 론

세계적인 기후위기는 산불의 빈도와 규모 등 산불피해 예측에 대한 불확실성을 크게 증가시키고 있다(Xiao and Zhuang, 2007; Yu et al., 2023). United Nations Environment Program (UNEP)는 전 세계적인 대형산불이 2030년까지 현재보다 약 12%, 2050년까지 약 30%, 2100년까지는 약 42%가량 증가할 것으로 발표하였다(UNEP, 2022). 동아시아 지역 대부분에서 산불에 대한 취약성이 증가하고 있다(Lee and Lee, 2022). 국내에서도 최근 5년(2019~2023년) 동안 연평균 575건의 산불이 발생했으며, 연평균 피해면적은 7,351ha로 집계되었다. 이는 직전 5년(2018~2014년)의 연평균 발생건수 538건, 연평균 피해면적은 661ha에 비해 각각 10%와 1,011% 증가한 수치이다(KFS, 2024). 특히, 산불취약지로 알려진 동해안 이외 지역에서 2,674건의 산불이 발생하였고, 그 피해면적은 11,944ha에 달했다(KFS, 2024). 이를 통해 산불 발생 건수와 피해면적은 기존의 취약지역뿐만 아니라 전국의 산림생태계에 걸쳐 증가하는 것으로 판단된다.

산불에 의한 산림생태계 피해는 장기간에 걸쳐 산림에 축적된 대량의 탄소를 대기 중으로 방출시킨다. 2023년에 전 세계적으로 발생한 산불로 인해 2022년에 비해 탄소 배출량이 약 49% 증가한 것으로 평가한 바 있다(CAMS, 2023). 산불의 유형과 연료량에 대한 평가는 산불을 온실가스 배출원으로 고려하는 데 매우 중요하다 산불은 피해정도에 따라 지표화, 수간화, 수관화 등의 유형으로 구분할 수 있으며, 이에 따라 산림지에서 연소되는 연료의 유형과 생물량도 차이를 보인다(KFRI, 2013). 수관화는 산불에 의해 수관층 연료와 지표층 연료가 모두 연소됨에 따라 산림생태계의 수직적 수평적 구조 전반에 피해를 일으키며, 수간화는 지표층의 연료 연소와 수간층의 연소가 발생하고, 지표화는 지표층 연료를 중심으로 연소되기 때문에 산림생태계의 수평적 구조를 중심으로 피해가 발생한다. 이에 따라 산불유형별 산림생태계의 피해와 연소량은 차이를 보이며, 온실가스 배출량에도 영향을 끼치고 있다(Stephen et al., 1996; Lee et al., 2012; Lee et al., 2023). 그러나 기존의 연구에서는 산불피해지역을 탐지하는 데 있어 피해유형 고려가 제한적이며, 이에 따라 정확한 온실가스 배출량을 산정하는 데 한계를 지니고 있다(Wang et al., 2019; Magro et al., 2021). 따라서, 보다 정확한 온실가스 배출량 산정을 위해서는 산불에 대한 고려가 필수적이며, 이를 위해 세분화된 산불피해유형 분류연구가 필요한 실정이다.

산불피해유형의 분류는 산불이 발생한 이후 피해지의 현장조사를 통해 실시된다. 그러나 이는 대면적 산불 피해지역에 대해 막대한 시간과 비용이 소요되는 한계를 지니고 있다. 이를 보완하기 위해 United States Department of Agriculture (USDA)는 위성영상을 기반으로 산불피해유형을 분석하는 산불피해 현장 평가 지수인 Composite Burn Index (CBI)를 개발하여 효율적인 산불피해유형 분류에 활용하고 있다(Key and Benson, 2006). CBI는 산불피해유형을 extreme (수관전소), high (수관열해), moderate (수관열해와 지표화)가 혼합하는 공간, low (지표화) 등으로 산불피해유형을 분류하는 체계를 지니고 있다. 그러나 국내 산림은 높은 수관밀도로 인해 CBI를 기반으로 실시한 산불피해유형 분류는 매우 큰 불확실성을 지닌 것으로 보고된 바 있다(Shin et al., 2019). 이에 따라 국내에서 위성영상을 이용한 산불피해유형을 분류할 수 있는 방법에 대한 요구가 지속되고 있으며, Kim et al.(2022)는 이에 대한 해결책으로 머신러닝 (Machine Learning, ML)을 활용한 산불피해지역 탐지 기법의 필요성을 제시하였다.

머신러닝은 데이터에서 패턴을 식별하여 다양한 결과를 예측하는 기법으로 집단 간의 복잡한 상호관계를 고려하는 데 우수한 것으로 평가되고 있다(Rogan et al., 2008; Ghimire et al., 2012). 현재 머신러닝은 Information Technology (IT)기술과 과학 등 여러 영역에서 활용되고 있으며, 상당한 영향을 미치고 있다(Jordon and Mitchell, 2015; Hain et al., 2023; Krenn et al., 2023). 최근에는 산불발생지의 피해강도를 추정하는 데 있어 머신러닝을 이용한 연구가 진행되고 있다. Youn and Jeong (2020)은 2019년 강원도 강릉시 산불피해강도 분류에 있어서 Sentinel-2 위성영상을 기반으로 한 Support Vector Machine (SVM) 기법과 United States Geological Survey (USGS)가 제시한 Normalized Burn Ratio (NBR) 분류표에 의한 방법을 비교하였으며, SVM 기법이 82.7%의 전체 정확도, NBR 분류표에 의한 방법이 80.7%의 전체 정확도로 나타났으며, 산불피해강도 분류에 머신러닝 도입의 가능성을 제시하였다. Sim et al.(2020)은 2017년 5월 강원도 삼척, 2019년 4월 강원도 강릉·동해, 2019년 4월 강원도 고성·속초에서 발생한 산불을 대상으로 Sentinel-1과 Sentinel-2 위성영상을 활용해 산불피해강도를 4개 등급으로 분류한 결과, Random Forest (RF) 기법이 82.3%의 전체 정확도, SVM 기법이 78.2%의 전체 정확도, Linear Regression (LR) 기법이 74.7%의 전체 정확도를 나타냈으며, 머신러닝 기법이 산불피해강도 분류에 유용하다고 보고한 바 있다. 그러나 동해안의 주요 산불취약지역을 제외한 곳을 대상으로 수행한 연구는 미비한 실정이며, 이에 따라 다양한 지역을 대상으로 한 산불피해유형 분류 연구가 필요한 실정이다.

본 연구에서는 국내 산불발생 지역을 대상으로 위성영상과 머신러닝 기법을 활용하여 산불피해유형 분류모델을 개발하고자 한다. 이를 위해 1) 2023년 4월 2일 충청남도 홍성군에서 발생한 대형산불피해지를 대상으로 산불유형분류를 수행할 수 있는 현장조사를 실시하고, 2) 산불피해 이후 시점에 대해 인공위성 영상을 수집 및 입력자료화 하였다. 3) 이후 현장조사와 입력자료를 종합하여 머신러닝 기법에 적용 후 산불피해유형 분류모델을 개발하고, 4) 기 구축된 산불피해등급도와 비교 및 검증을 통하여 모델의 성능을 평가하였다. 이를 통해 산불유형분류의 정확성을 향상시키고 체계적인 방법론을 정립할 수 있으며, 산불피해유형 분류 모델로 산출된 피해유형별 연소면적 데이터를 바탕으로 온실가스 배출량 산정을 위한 기초자료를 마련하고자 하였다.

재료 및 방법

1. 연구대상지

2023년 4월 2일 15시 52분부터 4월 4일 16시 41분까지 발생한 충청남도 홍성군 서부면과 결성면 일대에서 발생한 산불피해지(N 36° 31′ 56″-36° 35′ 09″, E 126° 28′ 11″-126° 32′ 09″)를 대상으로 연구를 수행하였다(Figure 1). 산불의 피해면적은 1,337.0ha에 이르는 대형산불로 2023년에 국내에서 가장 큰 피해를 일으킨 산불로 평가되고 있다. 연구대상지의 해발고도는 6~235m (평균 72m)이며, 경사는 0~49° (평균 18°)이다. 임상은 산불 발생 이전인 2022년 1:5000 수치임상도 기준으로 침엽수림 77.5%, 활엽수림 15.7%, 혼효림 6.8%으로 구성하고 있다.

jksfs-113-4-546-g1
Figure 1. (a) Location of South Korea; (b) Location of Chungcheongnam-do; (c) Location of study areas.
Download Original Figure
2. 산불피해유형 분류 모델 개발

산불피해유형 분류 모델 개발을 위해 머신러닝 기법을 활용하였으며, 이를 위해 산불피해지에 대한 위성영상 확보 및 현장조사 기반의 산불피해유형 학습자료를 구축하였다(Figure 2).

jksfs-113-4-546-g2
Figure 2. Conceptual diagram for developing wildfire severity classification model.
Download Original Figure
1) 산불피해유형 분류 모델 개발 머신러닝 알고리즘

본 연구에서는 3가지 유형의 머신러닝 알고리즘(MLC, SVM, RF)을 적용하여 산불피해유형 예측 모델을 개발했다. 아래는 머신러닝 알고리즘에 대한 개략적인 설명이다.

• MLC (Maximum Likelihood Classification)

MLC는 Fisher (1936)에 의해 이론적 기반을 형성하였으며, 산불피해유형 분류에 매우 적합한 기법으로 평가된다(KFRI, 2013). 국내 산림을 대상으로 한 산불피해유형 분류에서 Overall Accuracy (OA) 73.9~81.0%와 Cohen’s Kappa (Kappa) 계수 0.67~0.76의 수치로 준수한 성능을 보인 바 있다(Won et al., 2014b, Shin et al., 2019). MLC는 집단을 구성하는 픽셀값들을 기반으로 각 집단의 확률을 추정하여 미지의 픽셀을 여러 집단 중 하나로 분류하는 방법이다. 각 집단을 구성하는 픽셀들을 이용하여 확률밀도함수를 추출하고, 집단마다 공분산과 평균을 예측한다. 미지의 픽셀은 집단에 따라 예측된 공분산과 평균을 이용해 집단에 포함될 확률을 구하게 되며, 가장 높은 확률을 가진 집단에 배정된다. 미지의 픽셀이 어느 한 집단에 배정될 때 집단과의 거리가 아닌 공간적인 분포에 따른 상대적인 확률을 이용한다. 본 연구에서는 European Space Agency (ESA)에서 제공하는 소프트웨어인 Sentinel application platform(SNAP) 9.0.0에서 제공하는 Maximum Likelihood Classification Tool을 이용하였다(ESA, 2024).

• RF (Random Forest)

RF는 Ho(1995)에 의해 제안된 머신러닝 알고리즘으로, 여러 개의 의사결정나무를 활용하는 앙상블 기법이다. 선형 및 비선형 데이터를 모두 처리할 수 있고 과적합을 방지하는데 효과적인 알고리즘으로 다양한 분야에 적용되고 있다. 최근에는 산림재해 분석에도 활발히 활용되고 있으며(Kang and Park, 2019; Jang et al., 2023), 산불피해유형 분류에서 Overall Accuracy (OA) 76.0~88.1%와 Cohen’s Kappa 계수 0.38~0.85의 양호한 성능을 보인 바 있다(Collisn et al., 2020; Wu et al., 2024). 본 연구에서도 우수한 성능의 산불피해유형 분류 모델을 개발할 수 있을 것으로 판단하였다. RF는 집단에 포함된 속성 변수를 이용하여 n개의 의사결정나무를 형성하게 되는데, 각각의 의사결정나무는 랜덤으로 속성변수가 선택된다. 미분류된 픽셀은 집단에 따른 각 의사결정나무에 적용되어 집단을 도출하고, 가장 높은 투표를 받은 집단에 배정되어 진다. RF의 매개변수에는 ‘n_estimators’, ‘max_depth’, ‘max_features’, ‘min_samples_split’, ‘min_samples_leaf’ 등이 있다. ‘n_estimators’는 RF를 구성하는 의사결정나무의 개수를 결정하고, ‘max_depth’와 ‘max_features’는 각 의사결정나무의 최대 깊이와 분할에 사용되는 최대 특성 개수를 결정한다. ‘min_samples_split’는 노드를 분할하기 위한 최소 샘플 수, ‘min_samples_leaf’는 리프 노드에 필요한 최소 샘플 수를 조절하는 매개변수이다. 본 연구에서는 모델의 설계와 복잡성에 영향을 주는 의사결정나무의 개수, 의사결정나무의 최대 깊이, 의사결정나무의 최대 특성 개수를 활용하였다.

• SVM (Support Vector Machine)

SVM은 Cortes와 Vapnik(1995)에 의해 제안된 기법으로, 학습데이터가 부족한 조건에서 다른 분류 알고리즘보다 우수한 성능을 보이는 것으로 평가되고 있다(Foody and Mathur, 2004). 대형산불피해지는 시간과 비용 측면에서 전체 면적을 조사하기 어려워, 해당 피해지를 대표할 수 있는 일부 지역을 대상으로 조사를 수행한다(Won et al., 2014a). 본 연구에서는 대형산불피해지를 적은량의 학습데이터로 학습해야하는 점을 고려하여 SVM을 활용한 모델 개발과 평가를 시도하였다. 또한, Youn and Jeong (2020)Zikiou et al.(2024) 등은 SVM을 이용하여 산불피해유형 분류 모델을 개발한 바 있으며, Overall Accuracy (OA) 83% 이상의 수준을 보였고, Cohen’s Kappa 계수 0.63 이상의 준수한 성능을 보였다.

SVM은 최적의 초평면(optimal hyper plane)을 기준으로 미지의 픽셀을 집단에 분류한다. 집단을 구성하는 픽셀들 중 가장자리에 있는 픽셀들을 기준으로 경계선을 그은 후, 집단의 경계선간에 가운데에 새로운 선을 생성하여 최적의 초평면(optimal hyper plane)으로 정의한다. 최적의 초평면을 기준으로 각 집단의 경계선에 이르는 거리를 나타내는 마진(margin)은 최대가 되어야 한다. 집단 간의 경계선을 구하는 것은 다양한 방법이 있겠지만, 집단의 경계선 간에는 픽셀이 존재하면 안되고 최대 마진이 되어야 하므로 최적의 초평면은 하나만 존재한다. SVM의 커널함수를 조절하여 데이터 구조에 맞춰 최적의 초평면을 조절할 수 있으며, 비선형구조를 지닌 데이터의 분류에 유리한 것으로 알려져 있다.

본 연구에서는 선형 커널 함수는 ‘Linear’, 비선형 커널 함수는 ‘Radial Basis Function (RBF)’을 비교하여 산불피해유형 분류에 적합한 커널 함수를 구하였다. SVM의 주요 매개변수로는 ‘C’와 ‘Gamma’가 있다. ‘C’는 오분류에 대한 페널티에 조절, ‘Gamma’는 결정 경계의 곡률을 조절하는 매개변수이다.

본 연구에서 활용한 RF와 SVM 알고리즘은 매개변수에 의해 모델 정확도가 달라진다(Ghayour et al., 2021). 이에 본 연구에서는 적절한 매개변수를 탐색하기 위해 Python 기반의 ‘Scikit-Learn’ 라이브러리를 이용하였으며, 해당 라이브러리에서 제공하는 ‘Grid Search’와 ‘K-Fold’ 모듈을 활용하였다. ‘Grid Search’와 ‘K-Fold’를 이용하면 학습과 테스트 과정을 반복하여 선정된 매개변수 조합의 정확도를 도출해낼 수 있으며, 이 중 가장 높은 정확도를 나타내는 매개변수 조합을 선택할 수 있다(Müller and Guido, 2016). ‘Grid Search’는 사용자가 설정한 다양한 범위의 매개변수를 조합하고 각각의 정확도를 산출할 수 있다(Müller and Guido, 2016). ‘Grid Search’의 적용 범위는 각 매개변수에 대해 넓은 범위를 설정한 후, ‘Train Set’에서 산출된 ‘Train Score’와 ‘Test Set’에서 산출된 ‘Test Score’의 차이가 좁아지는 범위를 기준으로 최적의 범위를 선정하였다(López et al., 2022). 이에 따라 RF에서 적용된 ‘Grid Search’의 범위는 의사결정나무의 개수는 50, 55, 60, 65, 70으로, 의사결정나무의 최대 깊이는 9, 10, 11, 12, 13으로 설정하였고, 의사결정나무의 분할에 사용할 특성의 최대 개수는 기본값으로 설정하여 모델의 매개변수를 구성하였다(Müller and Guido, 2016). 이를 통해 총 25개의 매개변수 조합을 구성하였다. SVM에서 적용된 ‘Grid Search’의 범위는 커널함수의 유형은 선형 커널 함수와 비선형 커널 함수로 구분되며, 오분류에 대한 페널티 조절은 동일하게 1, 5, 10, 15, 20이 설정하였다. 비선형 커널 함수는 별도로 결정 경계의 곡률을 0.00001, 0.0005, 0.0001, 0.005, 0.01로 설정하였다. 이를 통해 선형 커널함수는 5개의 조합, 비선형 커널함수는 25개의 조합으로 구성하였다. ‘K-Fold’는 학습데이터를 ‘K’개로 분할한 후, 분할된 데이터 중 하나를 제외한 나머지 데이터를 학습하고 제외된 하나의 데이터를 테스트하는 과정을 ‘K’번 반복하는 기법이다. 본 연구에서는 ‘10-Fold’ 교차 검증을 적용하였으며, 전체 데이터셋을 10개의 동일한 크기로 나눈 후, 각 Fold를 한 번씩 테스트 세트로 사용하고 나머지 9개의 Fold를 학습 세트로 사용하는 방식이다. 이 과정을 총 10번 반복하여 각 Fold가 테스트 세트로 한 번씩 사용된다. 머신러닝 알고리즘별로 적용된 ‘Grid Search’의 매개변수 조합을 이용하여 ‘10-Fold’ 교차 검증 수행하고, 평균 정확도가 가장 높은 조합을 선정하였다.

3. 입력자료
1) 현장조사

머신러닝 알고리즘은 입력자료의 품질에 크게 의존하므로(Zikiou et al., 2024), 현장조사를 통해 산불피해유형에 따른 표본점을 취득하였다. 산불피해유형은 수관밀도가 높은 국내의 산림 구조에 맞춰 수관화 피해지, 열해 피해지, 지표화 피해지로 총 3단계로 구분하였다. 산불피해유형에 따른 특징을 기반으로 해당 등급만이 존재하는 20× 20m 정방향 표준지를 설정하고자 하였으며, 각 유형별로 20개의 표준지를 설치하여 총 60개의 표준지를 조사하였다(Figure 3). 또한, 산불피해유형에 따른 특징이 보존된 산불피해지의 자료를 취득하기 위해 산불이 진화되고 3개월 이내에 조사를 완료하였으며, 피해지 전역을 고려할 수 있도록 표준지를 고르게 분포시켰다(Figure 4).

jksfs-113-4-546-g3
Figure 3. Examples of wildfire severity classes from field survey.
Download Original Figure
jksfs-113-4-546-g4
Figure 4. Location of field survey plots in Hongseong wildfire burned areas.
Download Original Figure

2) Training Dataset

본 연구에서는 ESA에서 운영하는 Sentinel-2A 위성영상을 활용하였으며, 해당 영상은 MSI (Multi Spectral Instrument)로써 가시광선과 단파 적외선을 포함한 총 13개의 분광밴드를 제공한다(ESA, 2023). 본 연구에서는 산불이 진화된 시점(2023년 4월 4일) 이후 대상지에 구름 영향이 없는 가장 근접한 시점(2023년 4월 12일)의 영상을 분석에 사용하였다. 이 과정에서 대기 조건(수분, 에어로졸 등)에 의한 왜곡을 최소화하기 대기보정이 적용된 Level-2A 수준의 영상을 수집하고 활용하였다. Level-2A 영상은 Sen2Cor 알고리즘을 통해 구름 제거, 에어로졸 모델링, 각 밴드별 반사율 변환 등의 대기보정 절차를 거져 대기 조건에 의한 영향을 최소화한다(ESA, 2018). 이를 통해 구름과 대기의 영향을 효과적으로 줄이며, 실제 지표 반사율을 정확히 추정할 수 있다(Cho and Kim, 2019). Level-2A 밴드는 Band 10을 제외한 총 12개로 구성되어 있으며, 각 밴드는 서로 다른 파장대를 지니며 식생, 수분 함량 등 각기 다른 생태환경의 지표특성을 반영할 수 있다(USDA, 2006). Band 10은 지표면 정보를 포함하지 않아 영상처리에서 제외되므로(ESA, 2018), Band 1, 2, 3, 4, 5, 6, 7, 8, 8a, 9, 11, 12를 모델 학습에 이용하였다(Table 1).

Table 1. The characteristics of Sentinel-2A data used in this study from ESA.
Band number Central wavelength(nm) Bandwidth(nm) Spatial Resolution(m)
1 442.7 21 60
2 492.4 66 10
3 559.8 36 10
4 664.6 31 10
5 704.1 15 20
6 740.5 15 20
7 782.8 20 20
8 832.8 106 10
8a 864.7 21 20
9 945.1 20 60
11 1613.7 91 20
12 2202.4 175 20
Download Excel Table

Sentinel-2 Level-2A 영상처리된 밴드의 반사율과 현장조사로 취득한 산불피해유형별 표본지를 중첩시켰다. 각 밴드별 산불피해유형에 따른 반사율에서 차이가 있는 밴드만을 사용하기 위해 Kruskal-Wallis 검정을 수행하였으며, 모든 밴드는 5% 유의수준에서 통계적으로 차이를 나타냈다(p<0.05). 이에 따라, 산불피해유형 간 유의한 차이가 확인된 12개 밴드의 반사율을 활용하여 ‘Training Dataset’를 구축하였다(Table 2). ‘Training Dataset’은 모델 학습에 필요한 ‘Train Set’와 모델 평가에 필요한 ‘Test Set’를 각각 70%, 30%으로 구성하여 활용하였다.

Table 2. Mean and standard deviation of spectral reflectance according to wildfire severity classes applied in training dataset.
Band 1 Band 2 Band 3 Band 4 Band 5 Band 6
Crown Fire Mean(%) 14.2 14.4 15.3 16.5 17.4 18.1
S.D.(%) 0.3 0.4 0.5 0.7 1.0 1.3
Heat Damage Mean(%) 14.4 15.0 16.6 18.4 19.9 22.0
S.D.(%) 0.5 0.7 1.0 1.3 1.7 2.7
Surface Fire Mean(%) 14.9 15.4 17.4 18.9 21.0 24.2
S.D.(%) 0.9 1.1 1.6 2.5 2.3 3.1
Band 7 Band 8 Band 8a Band 9 Band 11 Band 12
Crown Fire Mean(%) 19.0 19.5 20.0 22.4 24.8 24.6
S.D.(%) 1.6 1.6 1.8 2.9 1.3 1.3
Heat Damage Mean(%) 23.4 25.8 25.1 24.8 26.8 24.0
S.D.(%) 3.2 3.9 3.6 2.7 2.0 2.9
Surface Fire Mean(%) 25.5 27.3 27.1 26.2 29.2 25.7
S.D.(%) 3.3 4.1 3.4 3.2 3.8 4.4

Note : S.D. is Standard Deviation

Download Excel Table
3) 모델 검증

본 연구에서 구축된 모델은 ‘Verification Dataset’를 이용해 검증 및 분석을 진행하였다. ‘Verification Dataset’는 국립산림과학원에서 Sentinel-2A를 이용해 산불 발생 전·후를 분석하여 제작된 10×10m 고해상도의 산불피해등급도를 이용하였다(NIFoS, 2023; Table 3).

Table 3. Areas of wildfire severity classes applied in verification dataset.
Wildfire severity Crown fire(ha) Heat damage(ha) Surface fire(ha)
Verification Areas 299.8 257.7 836.0
Download Excel Table

모델의 검증 및 평가는 ‘Verification Dataset’를 기반으로 제작된 오차행렬을 통해 검증하였으며, 성능지표로는 Overall Accuracy (OA)와 Cohen’s Kappa (Kappa), 각 유형별 User Accuracy (UA)와 Producer Accuracy (PA)를 활용하였다.

OA는 총 픽셀 수에서 올바르게 예측된 픽셀 수를 백분율로 나타내는 것이며, Kappa 계수는 우연적으로 일치된 픽셀을 고려하여 행렬의 전반적인 정확도를 측정하는 척도이다(식 1, 2). Kappa 계수는 값에 따라 6단계로 0.81~1.0은 ‘almost perfect (거의 완벽한)’, 0.61~0.80은 ‘substantial (상당한)’, 0.41~0.60은 ‘moderate (중간의)’, 0.21~0.40 ‘fair (조금 큰)’, 0.0~0.20은 ‘slight (약간)’, 0.0 이하는 ‘poor (부족한)’으로 구분된다(Landis and Koch, 1977). UA는 사용자의 시점에서 해당 강도로 예측된 픽셀 수에서 검증자료의 해당강도와 일치하는 픽셀 수를 백분율로 나타내며, PA는 분석자의 시점에서 해당 강도로 분류된 검증자료의 픽셀 수에서 해당 강도로 예측된 픽셀 수를 백분율로 나타낸다(IIASA, 1998; 식 3, 4).

 Overall Accuracy  = i = 0 q n i i n
(1)
 Cohen's Kappa  = p o p e 1 p e
(2)
 User Accuracy  i = n i i n i +
(3)
 Producer Accuracy  i = n i i n + i
(4)

이 식에서 은 총픽셀수를 의미하며, 는 특정 산불피해강도의 등급에서 검증자료의 해당 등급과 예측된 해당 등급이 일치하는 픽셀 수를 의미한다. 와 는 해당 산불피해등급에 따른 열과 행의 픽셀 수를 의미한다. 는 분류된 산불피해등급의 수를 의미한다. 는 검증자료와 예측된 자료의 일치율이며, 는 우연에 의한 예상 일치율을 나타낸다.

결과 및 고찰

1. 모델 개발

매개변수 설정을 하지 않는 MLC를 제외한 머신러닝 알고리즘은 ‘Grid Search’와 ‘10-Fold’을 적용하였으며, 이에 따른 가장 높은 정확도를 나타낸 매개변수 조합은 아래와 같다.

RF의 경우에는 의사결정나무의 개수 55, 각 의사결정나무의 최대 깊이 12로 훈련하였을 때 66.0%의 가장 높은 ‘Train Accuracy’를 나타냈으며, 이 조합으로 ‘Test Set’을 학습시킨 결과 73.6%의 ‘Test Accuracy’를 나타냈다. SVM의 선형 커널함수 ‘Linear’는 오분류에 대한 페널티 조절을 5로 훈련하여 86.4%의 가장 높은 ‘Train Accuracy’를 보였으며, 이 조합으로 ‘Test Set’를 학습시킨 결과 80.6%의 ‘Test Accuracy’를 나타냈다. SVM의 비선형 커널함수 ‘RBF’는 오분류에 대한 페널티 조절은 1, 결정 경계의 곡률은 0.00001로 훈련하여 89.2%의 가장 높은 ‘Train Accuracy’를 보였으며, 이 조합으로 ‘Test Set’를 학습시킨 결과 83.3%의 ‘Test Accuracy’를 나타냈다.

머신러닝 알고리즘마다 최적화된 매개변수 조합을 적용한 모델의 ‘Test Accuracy’를 비교하여 일반화 성능을 평가한 결과, SVM의 비선형 커널 함수 ‘RBF’가 가장 우수했으며, 이어서 SVM의 선형 커널 함수 ‘Linear’와 RF 순으로 높은 일반화 성능을 보였다. 또한, 각 모델의 ‘Train Accuracy’와 ‘Test Accuracy’의 차이가 약 8% 이내를 보여 일정 부분 과적합의 가능성이 제기된다(Bishop, 2006).

2. 분류 결과

구축된 머신러닝 알고리즘에 따른 모델들은 산불피해지의 전체 면적에 적용하여 산불피해등급도와 산불피해유형에 따른 면적을 추정하였다(Figure 5, Table 4).

jksfs-113-4-546-g5
Figure 5. Hongseong wildfire severity classification map applied by machine learning algorithm models. (a) MLC model; (b) RF model; (c) SVM Linear kernel function ’Linear’ model; (d) SVM Non-linear kernel function ’RBF’ model.
Download Original Figure
Table 4. Areas of wildfire severity classes applied in machine learning models and change ratio applied in verification dataset.
Model Wildfire severity
Crown fire(ha) Heat damage(ha) Surface fire(ha)
MLC 288.4(-3.8%) 342.4(+32.9%) 762.8(-8.8%)
RF 399.6(+33.3%) 169.7(-34.2%) 824.2(-1.4%)
SVM(Linear) 405.9(+35.4%) 357.1(+38.6%) 630.5(-24.6%)
SVM(RBF) 267.7(-10.91%) 431.8(+67.6%) 694.0(-17.0%)
Download Excel Table

구축된 모델들을 ‘Verification Dataset’과 비교한 결과, MLC는 수관화 피해지(-3.8%)와 지표화 피해지(-8.8%)에서 과소추정되고, 열해 피해지(+32.9%)에서는 과대추정되었다. RF는 수관화 피해지(+33.3%)는 과대추정되고, 열해 피해지(-34.2%)와 지표화 피해지(-1.4%)에서 과소추정되었다. SVM의 선형 커널함수 ‘Linear’의 경우 수관화 피해지(+35.4%)와 열해 피해지(+38.6%)는 과대추정되고 지표화 피해지(-24.6%)는 과소추정되었으며, SVM의 비선형 커널함수 ‘RBF’는 열해 피해지(+67.6%)에서 과대추정되고 수관화 피해지(-10.91%)와 지표화 피해지(-17.0%)에서 과소추정되었다. 수관화 피해지와 열해 피해지에서는 모델마다 과소추정, 과대추정이 나타난 반면, 지표화 피해지는 모든 모델에서 과소추정이 나타난 양상을 보였다. 또한, 열해 피해지에서 오분류가 가장 많이 발생하였다.

모델의 총 성능을 비교하면 OA의 경우 MLC는 73.4%, RF는 71.9%, SVM의 선형 커널함수 ‘Linear’는 65.3%, SVM의 비선형 커널함수 ‘RBF’는 67.0%를 나타냈으며, Kappa 계수의 경우 MLC는 0.54, RF는 0.50, SVM의 선형 커널함수 ‘Linear’는 0.43, SVM의 비선형 커널함수 ‘RBF’는 0.45로 모든 모델이 ‘moderate (중간의)’의 동일한 단계에 속했다. OA와 Kappa계수는 MLC, RF, SVM의 비선형 커널함수 ‘RBF’, SVM의 선형 커널함수 ‘Linear’ 순으로 높은 정확도를 나타냈다(Table 5).

Table 5. Confusion matrix and classification accuracy applied in machine learning models. Values of the confusion matrix are ratios relative to the total number of pixels. (OA: Overall accuracy, Kappa : Cohen’s Kappa).
Model MLC Wildfire severity classes Reference Data
Crown Fire(%) Heat Damage(%) Surface Fire(%)
Prediction Crown Fire 15.0 3.7 2.0
Heat Damage 4.9 10.0 9.6
Surface Fire 1.5 4.8 48.4
OA(%): 73.4 Kappa: 0.54
RF Wildfire severity classes Reference Data
Crown Fire(%) Heat Damage(%) Surface Fire(%)
Prediction Crown Fire 16.2 4.9 8.0
Heat Damage 3.5 9.5 12.6
Surface Fire 1.8 4.0 39.5
OA(%): 71.9 Kappa: 0.50
SVM
(Linear)
Wildfire severity classes Reference Data
Crown Fire(%) Heat Damage(%) Surface Fire(%)
Prediction Crown Fire 15.0 3.2 1.0
Heat Damage 4.4 9.8 16.8
Surface Fire 2.1 5.5 42.2
OA(%): 65.3 Kappa: 0.43
SVM
(RBF)
Wildfire severity classes Reference Data
Crown Fire(%) Heat Damage(%) Surface Fire(%)
Prediction Crown Fire 17.7 6.8 4.2
Heat Damage 2.1 4.2 5.8
Surface Fire 1.7 7.5 50.0
OA(%): 67.0 Kappa: 0.45
Download Excel Table

본 연구에서 구축된 모델들의 성능을 더욱 구체적으로 평가하기 위해 머신러닝 알고리즘별로 구축된 모델과 선행연구와 비교하여 성능 차이를 분석하였다.

먼저, 본 연구에서 MLC는 OA 73.4%, Kappa 계수 0.54로 비교적 만족스러운 성능을 보였다. MLC를 활용한 산불유형분류 연구로는 Won et al.(2014b), Shin et al.(2019) 등이 있다. Won et al.(2014b)은 OA 73.9%, Kappa 계수 0.67의 성능을 나타냈으며, Shin et al.(2019)은 OA 81.0%, Kappa 계수 0.76의 성능을 나타냈다. 본 연구에서 개발한 MLC 기반 산불피해유형 분류 모델은 두 선행연구와 비교했을 때 OA는 0.5~7.6%, Kappa 계수는 0.13~0.22 가량 낮은 수치를 나타냈다. Won et al.(2014b)에서는 5m 공간해상도를 가진 Rapideye를 사용하였으며, Shin et al.(2019)은 2m 공간해상도를 가진 KOMPSAT-3A를 사용하였다. 반면, 본 연구에서는 10m 공간해상도를 가진 Sentinel-2A를 사용했음에도 불구하고 기존 선행연구와 비교할 때 준수한 성능을 보인 것으로 판단된다. 따라서, 본 연구에서 수행한 방법에 고해상도의 위성영상을 활용한다면 산불피해유형 분류모델 개선이 가능할 수 있을 것으로 판단된다.

다음으로, 본 연구에서 RF는 OA 71.9%, Kappa 계수 0.50의 성능을 보였다. RF를 활용한 산불유형분류 연구로는 Collisn et al.(2020), Wu et al.(2024) 등이 있다. Collisn et al.(2020)은 OA 88.1%, Kappa 계수 0.85의 성능을 나타냈으며, Wu et al.(2024)은 OA 76.0%, Kappa 계수 0.38의 성능을 나타냈다. 본 연구에서 개발한 RF 기반 산불피해유형 분류 모델은 Collisn et al.(2020)에 비해 OA는 16.2%, Kappa 계수는 0.35 낮았으며, Wu et al.(2024)와 비교하면 OA는 4.1% 낮은 반면, Kappa 계수는 0.12 높은 수치를 나타냈다. Collisn et al.(2020)은 본 연구보다 공간해상도가 높은 30m의 Landsat의 위성영상을 활용했으나, Normalized Differenced Vegetation Index (NDVI), Normalised Difference Water Index (NDWI), Modified Soil Adjusted Vegetation Index (MSAVI) 등 다양한 분광지수를 학습데이터로 사용하여 성능 차이가 발생한 것으로 판단된다. Wu et al.(2024)은 본 연구와 같은 Sentinel-2A를 활용하였으나, 산불과 연관성이 있는 Normalized Burned Ratio (NBR)을 학습데이터로 사용하여 성능 차이가 나타난 것으로 판단된다. 산불피해유형 분류 모델의 학습데이터로 분광지수를 활용하는 것이 성능 향상에 긍정적인 영향을 미칠 것으로 판단된다.

마지막으로, 본 연구에서 SVM의 평균적인 성능은 OA 66.1%, Kappa 계수 0.44를 보였다. SVM을 활용한 산불피해유형 분류 연구는 Youn and Jeong(2020), Zikiou et al.(2024) 등이 있다. Youn and Jeong(2020)은 OA 82.7%, Kappa 계수 0.63의 성능을 나타냈으며, Zikiou et al.(2024)은 OA 87.3%, Kappa 계수 0.91의 성능을 나타냈다. 본 연구에서 개발한 SVM 기반 산불피해유형 분류 모델은 두 선행연구와 비교했을 때 OA는 16.6~21.2%, Kappa 계수는 0.19~0.47 가량 낮은 수치를 나타냈다. Youn and Jeong(2020)은 본 연구와 같은 Sentinel-2A를 활용하였으나, 산불피해 전과 후를 고려한 differenced NBR (dNBR)을 학습데이터로 사용하여 성능이 본 연구보다 향상된 것으로 판단된다. Zikiou et al.(2024)에서도 본 연구와 같은 Sentinel-2A를 활용하였지만, 학습데이터로 산불과 연관성이 있는 NDVI, NBR 등을 학습데이터로 사용하여 성능 차이가 나타난 것으로 판단된다. 산불피해 전과 후를 반영한 산불과 연관성이 있는 분광지수를 학습데이터로 구성하는 것은 모델의 성능 향상에 기여할 수 있을 것으로 판단된다. 또한, SVM은 비선형 커널함수 ‘RBF’는 OA 67.0%, Kappa 계수 0.45로 나타났고, 선형 커널함수 ‘Linear’는 OA 65.3%, Kappa 계수 0.43로 나타났다. SVM의 비선형 커널함수인 ‘RBF’는 선형 커널함수인 ‘Linear’ 보다 높은 정확도를 보였으며, 이는 다수의 선행연구와 일치하는 경향이다(Yekkehkhany et al., 2014; Müller and Guido, 2016; Feizizadeh et al., 2017).

본 연구에서 RF는 SVM보다 ‘Train Accuracy(RF: 66.0%, SVM(Linear): 86.4%, SVM(RBF): 89.2%)’와 ‘Test Accuracy(RF: 73.6%, SVM(Linear): 80.6%, SVM(RBF): 83.3%)’는 상대적으로 낮았으나, OA(Overall Accuracy, RF: 71.9%, SVM(Linear): 65.3%, SVM(RBF): 67.0%)와 Kappa 계수(RF: 0.50, SVM(Linear): 0.43, SVM(RBF): 0.45)는 더 높았다. 이를 통해 RF가 SVM보다 전반적으로 더 준수한 성능을 보였음을 확인할 수 있다. RF는 SVM보다 데이터의 노이즈와 불균형에 대한 저항력이 뛰어난 특성이 반영된 결과로 판단된다(Liu et al., 2013). 또한, RF의 ‘Train Accuracy’에 비해 ‘Test Accuracy’가 상대적으로 높은 점은 RF가 데이터 패턴을 과도하게 학습하지 않고 일반화된 규칙을 형성해 안정적인 성능을 유지했음을 나타낸다. 그러나, ‘Test Accuracy’가 상대적으로 높은 결과는 RF가 ‘Test data’의 특성을 우연히 잘 반영했을 가능성도 있으며, 이는 ‘Test data’에 과적합된 결과일 수도 있다. RF는 랜덤성을 활용해 ‘Train data’의 특정 패턴에 과도하게 의존하지 않는 구조를 통해 과적합을 방지할 수 있지만, ‘Train data’와 ‘Test data’ 간의 분포 차이나 샘플링 편향이 성능에 영향을 미쳤을 가능성도 고려해야 한다(Breiman, 2001). 반면, SVM은 ‘Train Accuracy’에 비해 ‘Test Accuracy’가 상대적으로 낮고, 총 성능에서 하락하는 경향을 보였다. 이는 SVM이 일부 과적합을 나타낸 가능성이 있을 것으로 판단된다. 따라서, RF가 SVM보다 더 나은 성능을 보였다고 평가할 수 있다.

최근, Artificial Intelligence (AI) 기술의 발전으로 딥러닝 및 Boosting 기법을 포함한 고성능 분류기들이 등장함에 따라, 더욱 정교하고 정확한 분류 결과를 얻을 수 있는 가능성이 열리고 있다(Lee et al., 2022). 특히, Boosting 기법은 여러 약한 분류기를 결합하여 강력한 예측 모델을 생성할 수 있어 다양한 분야에서 활용되고 있으며, 최근 산불피해유형 분류 연구에서도 우수한 성능을 보였다는 결과가 보고되었다(Al-Bashiti and Naser, 2022; Wu et al., 2024). 향후 연구에서는 이러한 최신 기법들을 적용하여 더 높은 정확도와 더 세밀한 분류 결과를 얻을 수 있을 것으로 기대된다. RF와 SVM이 여전히 주요한 분류모델로 활용되고 있지만, 딥러닝이나 Boosting 기법과 같은 고급 알고리즘들이 산불피해유형 분류에서 기존 모델의 한계를 극복하는 데 중요한 역할을 할 것이다.

산불피해유형에 따른 성능을 분석한 결과, UA와 PA는 수관화 피해지에서 각각 67.1% (±8.8)와 75.8% (±4.3)를 보였으며, 지표화 피해지는 86.2% (±1.7)와 75.0% (±7.2)를 보였다. 반면 열해 피해지는 36.1% (±3.3)와 45.4% (±13.0)의 비교적 불량한 정확도를 보였다(Table 6).

Table 6. User accuracy (UA) and Producer accuracy (PA) according to wildfire severity classes applied in machine learning models.
Wildfire Severtiy classes Models UA(%) PA(%)
Crown Fire MLC 72.7 69.9
RF 61.7 82.2
SVM(Linear) 55.7 75.5
SVM(RBF) 78.1 69.7
Heat Damage MLC 40.7 54.1
RF 34.7 22.9
SVM(Linear) 37.3 51.6
SVM(RBF) 31.6 53.0
Surface Fire MLC 88.4 80.6
RF 84.5 83.3
SVM(Linear) 87.3 65.8
SVM(RBF) 84.8 70.4
Download Excel Table

이는 열해 피해지의 약 63.9%가 오분류되었으며, 검증데이터와 비교했을 때 약 45.4%는 올바르게 분류된 것으로 해석할 수 있다. 열해 피해지로 예측된 픽셀 중 실제 수관화 피해지는 약 16.3%, 지표화 피해지는 약 49.6%로 나타났으며, 과소추정된 실제 지표화 피해지에서는 약 6.3%가 수관화 피해지로, 약 18.7%가 열해 피해지로 오분류되었다(Table 5). 이를 통해 수관화 피해지와 열해 피해지 간의 오분류보다 열해 피해지와 지표화 피해지 간의 오분류가 빈번하게 발생했음을 알 수 있다. 이러한 현상은 밴드의 반사율 차이에서 기인한 것으로 분석된다. 구체적으로, 수관화와 열해 피해지 간 반사율 차이에 비해 열해와 지표화 피해지 간 반사율 차이가 덜 뚜렷하게 나타난 것이 주요 원인으로 파악된다. 각 밴드별로 산불피해유형 간 구체적인 차이를 확인하기 위해 Dunn t 검정을 실시하였다. 그 결과, 밴드 1, 3, 6, 7, 8a, 11은 수관화, 열해, 지표화간의 차이가 5% 유의수준에서 통계적으로 유의하게 나타났다. 반면, 밴드 2, 4, 5, 8, 9, 12는 수관화와 열해 간 차이는 유의했으나, 열해와 지표화 간 차이는 유의하지 않은 것으로 나타났다(Figure 6). 열해와 지표화 간 반사율 차이가 명확하지 않은 밴드들로 인해 두 피해유형 간의 오분류가 많이 발생한 것으로 판단된다. 국내 산림은 높은 임분밀도를 가지고 있어 열해와 지표화 피해지 내에서 열해목과 일부 수관층이 살아있는 수목이 혼재된 복잡한 구조를 형성한다. 이러한 구조는 반사율 특성을 더욱 복잡하게 만들어 열해와 지표화 피해유형 간의 정확한 분류를 어렵게 하는 원인으로 작용했을 가능성이 높다(Won et al., 2014a; Shin et al., 2019). 열해와 지표화 간의 분류 정확도 향상은 모델 성능 개선의 중요한 요소이다. 이를 위해 고해상도 위성영상을 활용한 정밀한 피해지 정보와 두 피해지를 명확히 구분할 수 있는 밴드 조합을 활용한 충분한 학습데이터를 확보하는 것이 필요할 것으로 판단된다.

jksfs-113-4-546-g6
Figure 6. Spectral reflectance of each band for different wildfire severity classes applied in the training dataset. Bars and letters indicate the standard deviations of spectral reflectance and the statistical differences in spectral reflectance of each band for different wildfire severity classes
Download Original Figure

결 론

산불피해지의 피해유형 분류는 산불로 인해 배출되는 온실가스 배출량 산정 및 복구 전략 수립에서 중요한 요인이다. 이에 본 연구에서는 2023년 발생한 홍성 산불피해지를 대상으로 Sentinel-2A 위성영상을 활용하여 MLC, RF, SVM 머신러닝 알고리즘 기반의 산불피해유형 분류 모델을 개발하고, 이를 통해 산불피해유형 분류 방안을 제시하고자 한다. 개발한 모델들을 산불피해지 전체에 적용해 산불피해등급도를 작성한 결과, 수관화 피해지는 MLC와 SVM의 비선형 커널함수 ‘RBF’은 과소추정하였으며, RF와 SVM의 선형 커널함수 ‘Linear’는 과대추정하였다. 열해 피해지는 RF는 과소추정하였으며, MLC, SVM의 선형 커널함수 ‘Linear’와 SVM의 비선형 커널함수 ‘RBF’는 과대추정하였다. 지표화 피해지에서는 모든 모델이 과소추정하였다. 개발한 모델들의 총 성능은 MLC, RF, SVM 순으로 높았으며, 65.3~74.3% 사이의 OA와 0.43~0.54의 Kappa 계수를 나타냈다. SVM은 선형 커널함수 ‘Linear’에 비해 비선형 커널함수 ‘RBF’가 더 우수한 성능을 나타냈다. 수관화와 지표화 피해지 탐지는 비교적 양호했으나, 열해 피해지 탐지 성능은 상대적으로 낮게 나타냈다. 특히, 열해 피해지와 지표화 피해지 간 오분류가 다소 발생하였으며, 이는 반사율 특성이 명확히 구분되지 않은 밴드들에서 기인한 것으로 나타났다. 이러한 결과는 국내 산림의 높은 임분밀도가 열해와 지표화 피해지 간 복잡한 구조를 형성했기 때문으로 판단된다. 본 연구에서 개발한 머신러닝 알고리즘은 Kappa 계수 0.41~0.60으로 ‘moderate (중간의)’ 성능을 보였으며, 열해와 지표화 피해지 간 오분류를 개선하기 위해 더 명확히 구분할 수 있는 밴드 조합 활용이 필요하다. 또한, 고해상도 위성영상을 활용한 학습데이터의 품질 개선과 딥러닝, Boosting 기법 등 고성능 분류기의 적용을 통해 모델 성능을 더욱 향상시킬 수 있을 것으로 기대한다. 본 연구에서 제시된 산불피해유형 분류 모델은 향후 산불로 인한 피해를 정확히 분류하고, 이를 통해 각 피해 유형별 면적 추정 및 온실가스 배출량 추정에 중요한 기여를 할 수 있을 것으로 예상한다. 이를 바탕으로 향후 산불 피해 분석과 복구 전략 수립에 있어 실용적인 도구로 활용될 수 있을 것이다.

감사의 글

본 연구는 산림청(한국임업진흥원) 산림산업 현장 맞춤형 인재양성 사업 ‘RS-2024-00402624’의 지원에 의하여 수행되었습니다.

References

1.

Al-Bashiti, M. K. and Naser, M. Z. 2022. Machine learning for wildfire classification: Exploring blackbox, eXplainable, symbolic, and SMOTE methods. Natural Hazards Research 2(3): 154-165.

2.

Bishop, C. M. 2006. Pattern recognition and machine learning. Springer Nature. Berlin. Germany. pp. 1-66.

3.

Breiman, L. 2001. Random forests. Machine learning 45: 5-32.

4.

CAMS (Copernicus Atmosphere Monitoring Service). 2023. 2023: A year of intense global wildfire activity. https://atmosphere.copernicus.eu/2023-year-intense-global-wildfire-activity. (2023. 12. 12).

5.

Cho, K.J. and Kim, Y.I. 2019. Simulation of Sentinel-2 Product Using Airborne Hyperspectral Image and Analysis of TOA and BOA Reflectance for Evaluation of Sen2cor Atmosphere Correction: Focused on Agricultural Land. Korean Journal of Remote Sensing 35(2): 251-263.

6.

Collins, L., McCarthy, G., Mellor, A., Newell, G. and Smith, L. 2020. Training data requirements for fire severity mapping using Landsat imagery and random forest. Remote Sensing of Environment 245: 111839.

7.

Cortes, C. and Vapnik, V. 1995. Support-vector network. Machine Learning 20: 273-297.

8.

ESA (European Space Agency). 2018. Sen2Cor Configuration and User Manual. Paris. France: ESA.

9.

ESA (European Space Agency). 2023. Level-1 Algorithm Theoretical Bases Document. Paris. France: ESA.

12.

Feizizadeh, B., Roodposhti, M.S. and Blaschke, T. 2017. Comparing GIS-based support vector machine kernel functions for landslide susceptibility mapping. Arabian Journal of Geosciences 10: 1-13.

13.

Fisher, R.A. 1936. The use of multiple measurements in taxonomic problems. Annals of eugenics 7(2): 179-188.

14.

Foody, G.M. and Mathur, A. 2004. A relative evaluation of multiclass image classification by support vector machines. IEEE Transactions on Geoscience and Remote Sensing 42(6): 1335-1343.

15.

Ghayour, L., Neshat, A., Paryani, S., Shahabi, H., Shirzadi, A., Chen, W., Al-Ansari, N., Geertsema, M., Pourmehdi Amiri, M., Gholamnia, M., Dou, J., Ahmad, A. 2021. Performance evaluation of sentinel-2 and landsat 8 OLI data for land cover/use classification using a comparison between machine learning algorithms. Remote Sensing 13(7): 1349.

16.

Ghimire, B., Rogan, J., Galiano, V.R., Panday, P. and Neeti, N. 2012. An evaluation of bagging, boosting, and random forests for land-cover classification in Cape Cod, Massachusetts, USA. GIScience & Remote Sensing 49(5): 623-643.

17.

Hain, D., Jurowetzki, R., Lee, S. and Zhou, Y., 2023. Machine learning and artificial intelligence for science, technology, innovation mapping and forecasting: Review, synthesis, and applications.Scientometrics128(3): 1465-1472.

18.

Ho, T.K. 1995. Random decision forests. In Proceedings of 3rd International Conference on Document Analysis and Recognition 1: 278-282.

19.

IIASA (International Institute for Applied Systems Analysis). 1998. A review of assessing the accuracy of classifications of remotely sensed data and of methods including remote sensing data in forest inventory. Wien, Austria: IIASA.

20.

IPCC (Intergovermental Panel on Climate Change). 2006. 2006 IPCC Guildelines for National Greenhouse Gas Inventories. Geneva, Swiss: IPCC.

21.

IPCC (Intergovernmental Panel on Climate Change). 2023. Sixth Assessment Report (AR6) – Climate Change 2023: Synthesis Report. Geneva, Swiss: IPCC.

22.

Jang, J.M., Kim, J.C., Kim, H.J. and Kim, K.T. 2023. Predicting forest fires using machine learning considering human factors. Journal of Korea Society of Industrial Information Systems 28(5): 109-126.

23.

Jordan, M.I. and Mitchell, T.M. 2015. Machine learning: Trends, Perspectives, and prospects. https://www.scienc24.e.org/doi/10.1126/science.aaa8415. (2015. 7. 17).

25.

Kang, K.H. and Park, H.J. 2019. Study on the effect of training data sampling strategy on the accuracy of the landslide susceptibility analysis using random forest method. Economic and Environmental Geology 52(2): 199-212.

26.

Key, C.H. and Benson, N.C. 2006. Landscape Assessment (LA). USDA Forest Service, Rocky Mountain Research Station, Colorado, U.S.A. pp. 1-55.

27.

KFRI (Korea Forest Research Institute). 2013. A study on damage characteristics and development of burn severity evaluation methods. Seoul, Korea: KFRI.

28.

KFS (Korea Forest Service). 2024. 2023 Annual Report on Forest Fire Statistics. Daejeon, Korea: KFS.

29.

Kim, B.C., Lee, K.I., Park, S.Y. and Im, J.H. 2022. Forest burned area detection using Landsat 8/9 and Sentinel-2 A/B imagery with various indices: A case study of Uljin. Korean Journal of Remote Sensing 38: 765–779.

30.

Kim, B.M. 2021. A study on the optimal classification method for forest fire burn severity based on remote sensing. Ph.D. Dissertation. Daegu. Kyungpook National University. pp. 7-38.

31.

Krenn, M., Landgraf, J., Foesel, T. and Marquardt, F. 2023. Artificial intelligence and machine learning for quantum technologies. Physical Review A 107(1): 010101.

32.

Landis, J.R. and Koch. G.G. 1977. The measurement of observer agreement for categorical data. Biometrics 33(1): 159-174.

33.

Lee, B., Kim, B., Woo, C., Jung, G., Kwon, G. and Park, J. 2022. Forest Burn Severity Mapping Using Multispectral Unmanned Aerial Vehicle Images and Light Detection and Ranging (LiDAR) Data: Comparison of Maximum Likelihood, Spectral Angle Mapper, and U-Net Classifiers. Sensors & Materials 34(12): 4599-4614.

34.

Lee, B.D., Ho, J.Y., Kyo, S.K. and Kyung, H.K. 2012. Estimation of Biomass Loss and Greenhouse Gases Emissions from Surface Layer Burned by Forest Fire. Journal of Korean Forest and Society 101(2): 286-290.

35.

Lee, J.Y. and Lee, D.Y. 2022. Variability and Changes of Wildfire Potential over East Asia from 1981 to 2020. Journal of the Korean earth science society 43(1): 30-40.

36.

Lee, S.R. 2018. An Analysis of Forest Fire Occurrence by Climate Change and Projection of Forest Fire Risk. M.S. Thesis. Seoul. Korea University. pp. 34-37.

37.

Lee, Y.E., Han, S.H., Woo, C.S., Kwon, C.G. and Kim S.Y. 2023. Estimation of carbon dioxide emission from a fires with burn severity. Crisisonomy 19(6): 89-100.

38.

Liu, M., Wang, M., Wang, J. and Li, D. 2013. Comparison of random forest, support vector machine and back propagation neural network for electronic tongue data classification: Application to the recognition of orange beverage and Chinese vinegar. Sensors and Actuators B: Chemical 177: 970-980.

39.

Magro, C., Nunes, L., Gonçalves, O.C., Neng, N.R., Nogueira, J.M., Rego, F.C. and Vieira, P. 2021. Atmospheric Trends of CO and CH4 from Extreme Wildfires in Portugal Using Sentinel-5P TROPOMI Level-2 Data. Fire 4(2): 25.

40.

Montesinos López, O.A., Montesinos López, A. and Crossa, J., 2022. Multivariate statistical machine learning methods for genomic prediction.Springer Nature. Berlin. Germany. pp. 109-140.

41.

Müller, A.C. and Guido, S. 2016. Introduction to machine learning with Python: a guide for data scientists. O’Reilly Media. California, U.S.A. pp. 70-103.

42.

NIFoS (National Institute of Forest Science). 2023. Reporting on wildfire damage analysis using satellite imagery. Seoul, Korea: NIFoS.

43.

Rogan, J., Franklin, J., Stow, D., Miller, J., Woodcock, C. and Roberts, D. 2008. Mapping land-cover modifications over large areas: A comparison of machine learning algorithms. Remote Sensing of Environment 112(5): 2272-2283.

44.

Shin, J.I., Seo, W.W., Woo, C.S. and Lee, K.S. 2019. Analysis of availability of high-resolution satellite and UAV multispectral images for forest burn severity classification. Korean Journal of Remote Sensing 35(6-2): 1095-1106.

45.

Sim, S.M., Kim, W.H., Lee, J.S., Kang, Y.J., Im, J.H., Kwon, C.G. and Kim, S.Y. 2020. Wildfire severity mapping using Sentinel satellite data based on machine learning approaches. Korean Journal of Remote Sensing 36(5-3): 1109-1123.

46.

Stephen, J.P., Patricia, L.A. and Richard, D.L. 1996. Introduction to Wildfire. Wiley, California, U.S.A.

47.

UNEP (United Nations Environment Programme). 2022. Spreading Like Wildfire. Nairobi, Kenya: UNEP.

48.

USDA (United States Department of Agriculture). 2006. FIREMON: Fire Effects Monitoring and Inventory System. Washington D.C., U.S.A: USDA.

49.

Wang, W., Zhang, Q., Luo, J., Zhao, R. and Zhang, Y. 2019. Estimation of Forest Fire Emission in Southwest China from 2013 to 2017. Atmosphere 11(1): 15.

50.

Won, M.S., Kim, K.H. and Lee, S.W. 2014a. Analysis of burn severity in large-fire Area using SPOT5 images and field survey data. Korean Journal of Agricultural and Forest Meteorology 16(2): 114-124.

51.

Won, M.S., Kim, Y.S. and Kim, K.H. 2014b. Estimation on greenhouse gases(GHGs) emission of large forest fire area in 2013. Journal of the Korean Association of Geographic Information Studies 17(30): 54-67.

52.

Wu, M., Huang, Q., Sui, T., Peng, B. and Yu, M. 2024. A Remote Sensing Spectral Index Guided Bitemporal Residual Attention Network for Wildfire Burn Severity Mapping. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 17: 17187-17206.

53.

Xiao, J. and Zhuang, Q. 2007. Drought effects on large fire activity in Canadian and Alaskan forests.Environmental Research Letters2(4): 044003.

54.

Yekkehkhany, B., Safari, A., Homayouni, S. and Hasanlou, M. 2014. A comparison study of different kernel functions for SVM-based classification of multi-temporal polarimetry SAR Data. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences 40: 281-285.

55.

Youn, H.J. and Jeong, J.C. 2020. Classification of forest fire damage grade using machine learning and Sentinel-2. The Korea Spatial Planning Review 106: 107-117.

56.

Yu., G., Feng, Y., Wang, J. and Wright, D.B. 2023. Performance of fire danger indices and their utility in predicting future wildfire danger over the conterminous United States. Earth’s Future 11(11): 1-16.

57.

Zikiou, N., Rushmeier, H., Capel, M.I., Kandakji, T., Rios, N. and Lahdir, M. 2024. Remote Sensing and Machine Learning for Accurate Fire Severity Mapping in Northern Algeria.Remote Sensing16(9): 1517.