开展土地开发的水文生态效应评估的基础是要获取精确的土壤水分基本物理性质。现有的数据集无论在空间分辨率还是参数的准确性方面均存在较大不足。近期,天山北坡土地开发调查与生态环境效应评估项目基于前期获取的饱和导水率、土壤水分特征曲线数据,结合逐步多元线性回归、随机森林、支持向量机、人工神经网络、梯度增强决策树、K最近邻等多种机器学习方法,对天山北坡0-2 m土壤饱和导水率Ks、饱和含水量qs、残余含水量qr、van Genuchten模型参数α和n等进行了预测,进一步通过这些参数计算了田间持水量、永久萎蔫点、植物有效水含量及土壤大孔隙度等指标,最终研制出一套天山北坡1 km空间分辨率0-2 m土层土壤水分基本物理性质数据集。研究发现,在单一模型中,随机森林在预测土壤水分基本物理性质的过程中表现最好。随后,为了提高预测精度,进一步对表现较好的机器学习模型进行集成。结果显示,集成后的模型性能得到了显著提升。与已有土壤水分基本物理性质数据集相比,新的数据集表现出与实测值之间更小的误差。该数据集的研制为准确评估天山北坡土地开发的水文生态效应提供了数据基础。
不同模型预测饱和含水量效果散点图。RF: 随机森林;KNN: K最近邻;ANN: 人工神经网络;SVM: 支持向量机;MLR: 逐步多元线性回归;GBDT: 梯度增强决策树;Averaging: 平均法集成模型;Stacking: 堆叠法集成模型。
天山北坡表层土壤水分基本物理性质数据集。Ks: 饱和导水率;θs:饱和含水量;θr:残余含水量;α,n:van Genuchten模型参数;SP:土壤大孔隙;FC:田间持水量;WP:永久萎蔫点;AWC:植物有效水含量。
不同数据库饱和含水量与实测值之间误差对比