基于机器学习的区域滑坡灾害预警模型研究

刘艳辉 方然可 苏永超 肖锐铧

刘艳辉,方然可,苏永超,等. 2021. 基于机器学习的区域滑坡灾害预警模型研究[J]. 工程地质学报, 29(1): 116-124. doi: 10.13544/j.cnki.jeg.2020-533
引用本文: 刘艳辉,方然可,苏永超,等. 2021. 基于机器学习的区域滑坡灾害预警模型研究[J]. 工程地质学报, 29(1): 116-124. doi: 10.13544/j.cnki.jeg.2020-533
Liu Yanhui, Fang Ranke, Su Yongchao, et al. 2021. Machine learning based model for warning of regional landslide disasters[J]. Journal of Engineering Geology, 29(1): 116-124. doi: 10.13544/j.cnki.jeg.2020-533
Citation: Liu Yanhui, Fang Ranke, Su Yongchao, et al. 2021. Machine learning based model for warning of regional landslide disasters[J]. Journal of Engineering Geology, 29(1): 116-124. doi: 10.13544/j.cnki.jeg.2020-533

基于机器学习的区域滑坡灾害预警模型研究

doi: 10.13544/j.cnki.jeg.2020-533
基金项目: 

国家自然科学基金 42077440

国家自然科学基金 41202217

国家重点研发计划 2018YFC1505503

详细信息
    作者简介:

    刘艳辉(1978-),女,博士,教授级高级工程师,主要从事地质灾害预警与防治、工程地质等方面的研究工作. E-mail: liuyh@cigem.cn

  • 中图分类号: P642.22

MACHINE LEARNING BASED MODEL FOR WARNING OF REGIONAL LANDSLIDE DISASTERS

Funds: 

the National Natural Science Foundation of China 42077440

the National Natural Science Foundation of China 41202217

National Key R&D Program 2018YFC1505503

  • 摘要: 中国滑坡灾害严重,区域滑坡灾害预警是防灾减灾的重要手段之一,预警模型是开展区域滑坡灾害预警的关键问题。本文系统开展了基于机器学习的区域滑坡灾害预警模型研究,并以四川省青川县为例,基于近10年地质与气象数据,构建了青川县区域滑坡灾害预警模型并开展实例校验。研究得出如下结论:(1)提出了基于机器学习的区域滑坡灾害预警模型的构建方法,主要包括训练样本集构建、样本学习训练与优化建模、模型保存与预警输出等几个关键步骤。(2)提出了区域滑坡训练样本集的构建方法,即以正样本为基础,在时空约束条件下随机采样获取负样本,最终获得完整的训练样本集。(3)样本学习训练中,以训练样本集的80%作为训练集,20%作为测试集,进行5折交叉验证,采用精确度、ROC曲线和AUC值校验模型准确度和模型泛化能力。采用贝叶斯优化算法进行模型优化。(4)实际预警中,调用训练好的预警模型输出滑坡灾害可能发生的概率。依据概率大小,分级确定预警等级。分级依据为:当输出概率P≥40%且P<60%时,发布黄色预警;当输出概率P≥60%且P<80%时,发布橙色预警;当输出概率P≥80%时,发布红色预警。(5)以青川县为例,构建了青川县区域滑坡训练样本集,采用6种机器学习算法进行模型训练,结果显示随机森林算法表现最好,其准确率最高(0.963),模型无过拟合现象,模型泛化能力最好(AUC=0.986);其次为逻辑回归算法;再次为人工神经网络算法和决策树算法。选取2018年6月26日的青川县日常预警业务进行实例校验。结果显示:当日17处滑坡灾害点中,100%的灾害点全部落入预警区范围内,其中:70.6%的滑坡落在红色预警区内,17.6%的滑坡落在橙色预警区内,11.8%的滑坡落在黄色预警区内。
  • 图  1  训练样本集构建流程图

    Figure  1.  Diagram of the training sample set construction

    图  2  空间叠加分析示意图

    Figure  2.  Sketch map of spatial overlay analysis

    图  3  基于正样本的负样本空间采样示意图(据缪亚敏(2016)修改)

    Figure  3.  Sketch map of negative sample space sampling based on positive samples

    图  4  青川县训练样本集

    Figure  4.  Training sample set in Qingchuan County

    图  5  随机森林模型学习曲线和ROC曲线

    Figure  5.  Learning curve and ROC curve of RF model

    图  6  青川县区域滑坡预警模拟运行结果

    Figure  6.  Landslides early warning result with RF model, in Qingchuan County

    表  1  预警空间精度划分(中国地质灾害防治工程行业协会,2018)

    Table  1.   Early warning space precision division

    预警分级 推荐预警精度
    国家级 1:500 000—1:1 000 000
    省级 1:100 000—1:500 000
    市级 1:50 000—1:100 000
    县级 1:10 000—1:50 000
    专题预警区 1:2 000—1:10 000
    下载: 导出CSV

    表  2  常用机器学习分类算法与适用性对比分析

    Table  2.   Comparative analysis of common machine learning classification algorithms and their applicability

    常用算法 主要原理 优点 缺点
    逻辑回归 根据现有数据对分类边界线建立回归公式(最佳拟合参数集),以此进行分类 ①计算量小,速度快;②有很好的概率解释;③便利地更新模型 ①容易欠拟合,准确度有限;②只能处理两分类问题,且必须线性可分
    最近邻 通过测量不同特征值之间距离的方法进行分类 ①适于多分类问题;②准确度高;③对异常点不敏感 ①计算量大,可理解性差;②对训练数据依赖度大,样本不平衡的时候,对稀有类别的预测准确率低
    决策树 根据数据属性采用树状结构建立决策模型 ①易于说明和解释,擅长处理特征间相互作用;②适合分析离散数据;③小规模数据集有效 ①处理连续变量不好;②不支持在线学习,当有新样本时需要重建决策树;③容易过拟合
    人工神经网络 模拟生物神经网络,是一类模式匹配算法,是机器学习的一个庞大分支,有几百种不同的算法 ①分类准确度高;②学习能力强 ①需要大量的参数;②不能观察学习过程,结果难以解释;③学习时间长
    支持向量机 寻找最佳超平面,可以将数据分成两部分,每部分数据都属于同一个类别 ①可解决非线性的分类;②分类思想简单 ①内存消耗大,对大规模训练样本难以实施;②解决多分类问题存在困难;③难于解释,运行和优化复杂
    随机森林 集成算法。用随机的方式建立一个森林,森林由很多独立决策树组成,最后综合得到最优分类结果 ①可充分应用有限样本;②具备多样性和准确性的优势 在某些噪音较大的问题上会过拟合
    下载: 导出CSV

    表  3  预警等级划分

    Table  3.   Early warning level division

    预警等级 滑坡发生风险 输出概率P
    红色预警 风险很高 P≥80%
    橙色预警 风险高 60%≤P<80%
    黄色预警 风险较高 40%≤P<60%
    下载: 导出CSV

    表  4  训练样本输入特征及参数

    Table  4.   Input characteristics and parameters of training samples

    序号 输入特征 输入特征参数
    1 坡度 ①0°~10°;②10°~20°;③20°~30°;④30°~40°;⑤≥40°
    2 坡向 ①0°~90°;②90°~180°;③180°~270°;④270°~360°
    3 高程 ①0~800;②800~1200;③1200~1600;④1600~2000;⑤≥2000(单位:m)
    4 地貌类型 ①中低山;②中山;③高中山
    5 地层岩性 ①松散堆积层;②软弱-半坚硬薄-中层状岩组;③半坚硬-坚硬薄-中层状岩组;④坚硬-半坚硬中-厚层状岩组
    6 距断裂距离 ①0~500;②500~1000;③1000~1500;④1500~2000;⑤≥2000(单位:m)
    7 年均雨量 ①0~500;②500~800;③800~1000;④1000~1200;⑤≥1200(单位:mm)
    8 距房屋距离 ①0~200;②≥200(单位:m)
    9 距道路距离 ①0~200;②≥200(单位:m)
    10 距沟谷距离 ①0~200;②≥200(单位:m)
    11 网格单元历史灾点数 网格单元历史灾点个数(单位:个)
    12 当日雨量 日雨量实际值(单位:mm)
    13 前1日雨量 日雨量实际值(单位:mm)
    14 前2日雨量 日雨量实际值(单位:mm)
    27 前15日雨量 日雨量实际值(单位:mm)
    下载: 导出CSV

    表  5  青川县机器学习预警模型评价对比

    Table  5.   Comparison and evaluation of six machine learning models

    机器学习模型 准确率
    Accuracy
    模型泛化能力
    AUC
    随机森林 0.963 0.986
    最近邻模型 0.932 0.955
    决策树 0.937 0.933
    支持向量机 0.932 0.969
    逻辑回归 0.940 0.979
    人工神经网络 0.937 0.954
    下载: 导出CSV
  • Au S W C. 1998. Rain-induced slop instability in Hong Kong[J]. Engineering Geology, 51(1): 1-36. doi: 10.1016/S0013-7952(98)00038-6
    Cannon S H, Ellen S D. 1985. Rainfall conditions for abundant debris avalanches, San Francisco Bay region, California[J]. California Geology, 38(12): 267-272.
    Chen W, Pourghasemi H R, Zhao Z. 2017. A GIS-based comparative study of Dempster-Shafer, logistic regression and artificial neural network models for landslide susceptibility mapping[J]. Geocarto International, 32(4): 367-385. doi: 10.1080/10106049.2016.1140824
    Chen W, Xie X, Wang J, et al. 2017. A comparative study of logistic model tree, random forest, and classification and regression tree models for spatial prediction of landslide susceptibility[J]. Catena 151 : 147-160. doi: 10.1016/j.catena.2016.11.032
    China Geological Disaster Prevention Engineering Association. 2018. Standard of geo-hazards early warning based on meteorological factor(T/CAGHP 039-2018)[S]. Wuhan: China University of Geosciences Press.
    Fausto Guzzetti, et al. 2020. Geographical landslide early warning systems[J]. Earth-Science Reviews, 200: 102973. doi: 10.1016/j.earscirev.2019.102973
    Foster C, Pennington C V L, Culshaw M G, et al. 2011. The national landslide database of Great Britain: development, evolution and applications[J]. Environmental Earth Sciences, 66 : 941-953. doi: 10.1007/s12665-011-1304-5
    Hong H, Pourghasemi H R, Pourtaghi Z S. 2016. Landslide susceptibility assessment in Lianhua County(China): a comparison between a random forest data mining technique and bivariate and multivariate statistical models[J]. Geomorphology, 259 : 105-118. doi: 10.1016/j.geomorph.2016.02.012
    Hou S S, Li A, Han B, et al. 2014. An approach of geo-hazard warning system in Ya'an, Sichuan and its analysis[J]. The Chinese Journal of Geological Hazard and Control, 25(4): 134-138. http://en.cnki.com.cn/Article_en/CJFDTOTAL-ZGDH201404026.htm
    Iverson R M. 2000. Landslide triggering by rain infiltration[J]. Water Resources Research, 36(7): 1897-1910. doi: 10.1029/2000WR900090
    Li C J, Ma T H, Zhu X S, et al. 2008. Forecasting of landslides trigged by rainfall: theory, method and application[M]. Beijing: Geological Publishing House.
    Li S D, Bai Y H, Jiang Y, et al. 2017. Explicit statistic meteorological early-warning model of geological hazards in Xinjiang, China based on the genesis theory of endogenic and exogenic couping[J]. Journal of Earth Sciences and Environment, 39(2): 286-300. http://en.cnki.com.cn/Article_en/CJFDTotal-XAGX201702015.htm
    Liu C Z, Liu Y H, Wen M S, et al. 2009. Method and application of regional warning for geo-hazards in China[M]. Beijing: Geological Publishing House.
    Liu C Z, Liu Y H. 2007. Early warning theory for regional geo-hazards and design of explicit statistical system[J]. Hydrogeology & Engineering Geology, 34(6): 109-115, 125. doi: 10.1016/S1872-2032(07)60018-3
    Liu C Z, Wen M S, Liu Y H, et al. 2017. Study of geo-hazards in Wenchuan earthquake zone[M]. Beijing: Geology Publishing House.
    Liu C Z, Wen M S, Tang C. 2004. Meteorological early warning of geo-hazards in China based on raining forecast[J]. Geological Bulletin of China, 23(4): 303-309. doi: 10.1016/S0960-0779(03)00420-X
    Liu C Z, Liu Y H, Wen M S, et al. 2015. Early warning for regional geo-hazards during 2003-2012, China[J]. The Chinese Journal of Geological Hazard and Control, 26(1): 1-8. http://en.cnki.com.cn/Article_en/CJFDTOTAL-ZGDH201501001.htm
    Liu Y H, Liu C Z, Lian J F, et al. 2008. Method of regional early warning of geohazards based on the explicit statistical theory[J]. Geology in China, 35(2): 344-350. doi: 10.1007/s00343-008-0023-6
    Liu Y H, Liu C Z, Wen M S, et al. 2015. Study of early warning models for regional geo-hazards in China[J]. Journal of Engineering Geology, 23(4): 738-746. http://en.cnki.com.cn/Article_en/CJFDTOTAL-GCDZ201504028.htm
    Liu Y H, Su Y C. 2019. Early-warning model of regional geological disasters based on meteorological factor in Qingchuan County, Sichuan Province[J]. Journal of Engineering Geology, 27(1): 134-143. http://en.cnki.com.cn/Article_en/CJFDTotal-GCDZ201901014.htm
    Liu Y H, Zhang Z X, Su Y C. 2018. Case study of vulnerability evaluation for geo-hazards bearing capacity of a region[J]. Journal of Engineering Geology, 26(5): 1121-1130. http://en.cnki.com.cn/Article_en/CJFDTotal-GCDZ201805002.htm
    Liu Y L, Yin K L, Liu B, et al. 2010. Application of logistic regression and artificial neural networks in spatial assessment of landslide hazards[J]. Hydrogeology & Engineering Geology, 37(5): 92-96. doi: 10.1021/jp207652h
    Miao Y M. 2016. A new apporoach to generating absence samples for landslide susceptibility assessment[D]. Nanjing: Nanjing Normal University.
    Pennington C V L, Freeborough K, Dashwood C, et al. 2015. The national landslide database of Great Britain: acquisition, communication and the role of social media[J]. Geomorphology, 249 : 44-51. doi: 10.1016/j.geomorph.2015.03.013
    Peter Harrington. 2013. Machine learning exercise[M]. Li R, Li P, Qu Y D, et al. translation. Beijing: People's Posts and Telecom munications Press.
    Pietro A. 2004. A warning system for rainfall-induced shallow failures[J]. Engineering Geology, 73 : 247-265. doi: 10.1016/j.enggeo.2004.01.007
    Ponziani F, Berni N, Stelluti M, et al. 2013. LANDWARN: an operative early warning system for landslides forecasting based on rainfall thresholds and soil moisture[M]//Margottini C, Canuti P, Sassa K. Landslide Science and Practice. Springer. Berlin: Heidelberg: 627-634.
    Snoek J, Larochelle H, Adams R P. 2012. Practical Bayesian Optimization of Machine Learning Algorithms[C]//proceedings of the International Conference of the 25th on Neural Information Processing Systems, 2: 2951-2959.
    Sun D L. 2019. mapping landslide susceptibility based on machine learning and forecast warning of landslide induced by rainfall[D]. Shanghai: East China Normal University.
    Tien Bui D, Tuan T A, Hoang N D, et al. 2017. Spatial prediction of rainfall-induced landslides for the Lao Cai area(Vietnam) using a hybrid intelligent approach of least squares support vector machines inference model and artificial bee colony optimization[J]. Landslides, 14(2): 447-458. doi: 10.1007/s10346-016-0711-9
    Tien Bui D, Tuan T A, Klempe H, et al. 2016. Spatial prediction models for shallow landslide hazards: a comparative assessment of the efficacy of support vector machines, artificial neural networks, kernel logistic regression, and logistic model tree[J]. Landslides, 13(2): 361-378. doi: 10.1007/s10346-015-0557-6
    Trigila A, Iadanza C, Esposito C, et al. 2015. Comparison of logistic regression and random forests techniques for shallow landslide susceptibility assessment in Giampilieri(NE Sicily, Italy)[J]. Geomorphology, 249 : 119-136. doi: 10.1016/j.geomorph.2015.06.001
    Wang Y L. 2005. Study of the early-warning and prediction of landslide hazards and countermeasures in the southern Shanxi province[J]. Journal of Geological Hazards and Environment Preservation, 16(4): 345-349. http://en.cnki.com.cn/Article_en/CJFDTOTAL-DZHB200504002.htm
    Wei P X, Li X J. 2015. The meteorologic early warning research of sudden geo-hazard in Guangdong province[J]. The Chinese Journal of Geological Hazard and Control, 26(1): 138-144. http://en.cnki.com.cn/Article_en/CJFDTOTAL-ZGDH201501029.htm
    Wen M S, Liu Y H, Su Y C, et al. 2016. Geo-hazards investigation report of Qingzhujiang River region, Sichuan[R]. Beijing: China Institute of Geo-Environmental Monitoring.
    Xu C, Xu X W. 2012. Logistic regression model and its validation for hazard mapping of landslides triggered by Yushu earthquake[J]. Journal of Engineering Geology, 20(3): 326-333. http://en.cnki.com.cn/Article_en/CJFDTOTAL-GCDZ201203006.htm
    Zhou Z H. 2010. Machine learning[M]. Beijing: Tsinghai University Press.
    侯圣山, 李昂, 韩冰, 等. 2014. 四川雅安地质灾害预警预报及分析[J]. 中国地质灾害与防治学报, 25(4): 134-138. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGDH201404026.htm
    李守定, 白亚恒, 姜越, 等. 2017. 基于内外动力耦合成因理论的新疆地质灾害气象预警显式统计模型[J]. 地球科学与环境学报, 39(2): 286-300. doi: 10.3969/j.issn.1672-6561.2017.02.013
    李长江, 麻土华, 朱兴盛. 2008. 降雨型滑坡预报的理论、方法及应用[M].北京: 地质出版社.
    刘传正, 刘艳辉, 温铭生, 等. 2009. 中国地质灾害区域预警方法与应用[M]. 北京: 地质出版社.
    刘传正, 刘艳辉, 温铭生, 等. 2015. 中国地质灾害气象预警实践: 2003-2012[J]. 中国地质灾害与防治学报, 26(1): 1-8. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGDH201501001.htm
    刘传正, 刘艳辉. 2007. 地质灾害区域预警原理与显式预警系统设计研究[J]. 水文地质工程地质, 34(6): 109-115, 125. doi: 10.3969/j.issn.1000-3665.2007.06.026
    刘传正, 温铭生, 刘艳辉, 等. 2017. 汶川地震区地质灾害成生规律研究[M]. 北京: 地质出版社.
    刘传正, 温铭生, 唐灿. 2004. 中国地质灾害气象预警初步研究[J]. 地质通报, 23(4): 303-309. doi: 10.3969/j.issn.1671-2552.2004.04.001
    刘艳辉, 刘传正, 连建发, 等. 2008. 基于显式统计原理的地质灾害区域预警方法初步研究[J]. 中国地质, 35(2): 344-350. doi: 10.3969/j.issn.1000-3657.2008.02.020
    刘艳辉, 刘传正, 温铭生, 等. 2015. 中国地质灾害气象预警模型研究[J]. 工程地质学报, 23(4): 738-746. doi: 10.13544/j.cnki.jeg.2015.04.023
    刘艳辉, 苏永超. 2019. 四川青川县区域地质灾害气象风险预警模型研究[J]. 工程地质学报, 27(1): 134-143. doi: 10.13544/j.cnki.jeg.2018-403
    刘艳辉, 张振兴, 苏永超. 2018. 地质灾害承灾载体脆弱性评价方法研究[J]. 工程地质学报, 26(5): 1121-1130. doi: 10.13544/j.cnki.jeg.2017-560
    刘艺梁, 殷坤龙, 刘斌. 2010. 逻辑回归和人工神经网络模型在滑坡灾害空间预测中的应用[J]. 水文地质工程地质, 37(5): 92-96. doi: 10.3969/j.issn.1000-3665.2010.05.017
    缪亚敏. 2016. 滑坡危险度评价中的负样本采样方法研究[D]. 南京: 南京师范大学.
    Peter Harrington. 2013. 机器学习实战[M]. 李锐, 李鹏, 曲亚东, 等译. 北京: 人民邮电出版社.
    孙德亮. 2019. 基于机器学习的滑坡易发性区划与降雨诱发滑坡预报预警研究[D]. 上海: 华东师范大学.
    王雁林. 2005. 陕南地区滑坡灾害气象预警预报及其防范对策探析[J]. 地质灾害与环境保护, 16(4): 345-349. doi: 10.3969/j.issn.1006-4362.2005.04.003
    魏平新, 李秀娟. 2015. 广东省突发性地质灾害气象预警实践[J]. 中国地质灾害与防治学报, 26(1): 138-144. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGDH201501029.htm
    温铭生, 刘艳辉, 苏永超, 等. 2016. 四川青竹江流域地质灾害调查报告[R].北京: 中国地质环境监测院.
    许冲, 徐锡伟. 2012. 逻辑回归模型在玉树地震滑坡危险性评价中的应用与检验[J]. 工程地质学报, 20(3): 326-333. doi: 10.3969/j.issn.1004-9665.2012.03.004
    中国地质灾害防治工程行业协会. 2018. 地质灾害区域气象风险预警标准(试行)(T/CAGHP 039-2018)[S].武汉: 中国地质大学出版社.
    周志华. 2016. 机器学习[M]. 北京: 清华大学出版社.
    自然资源部地质灾害技术指导中心. 2019. 全国地质灾害通报(2019年)[R]: 北京: 自然资源部地质灾害技术指导中心.
  • 加载中
图(6) / 表(5)
计量
  • 文章访问数:  439
  • HTML全文浏览量:  208
  • PDF下载量:  126
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-09-28
  • 修回日期:  2021-01-27
  • 刊出日期:  2021-02-01

目录

    /

    返回文章
    返回