研究报告

  • 王黎明,吴香华,赵天良,程国胜,张祥志,汤莉莉,贾梦唯,陈煜升.基于距离相关系数和支持向量机回归的PM2.5浓度滚动统计预报方案[J].环境科学学报,2017,37(4):1268-1276

  • 基于距离相关系数和支持向量机回归的PM2.5浓度滚动统计预报方案
  • A scheme for rolling statistical forecasting of PM2.5 concentrations based on distance correlation coefficient and support vector regression
  • 基金项目:国家科技支撑计划项目(No.2014BAC22B04);国家自然科学青年基金(No.41505118);国家自然科学基金联合重大研究计划项目(No.91544109);国家环境保护公益性行业科研专项项目(No.201509001)
  • 作者
  • 单位
  • 王黎明
  • 南京信息工程大学数学与统计学院, 南京 210044
  • 吴香华
  • 南京信息工程大学数学与统计学院, 南京 210044
  • 赵天良
  • 南京信息工程大学气象灾害预报预警与评估协同创新中心, 中国气象局气溶胶-云-降水重点实验室, 南京 210044
  • 程国胜
  • 南京信息工程大学数学与统计学院, 南京 210044
  • 张祥志
  • 江苏省环境监测中心, 南京 210036
  • 汤莉莉
  • 江苏省环境监测中心, 南京 210036
  • 贾梦唯
  • 南京信息工程大学气象灾害预报预警与评估协同创新中心, 中国气象局气溶胶-云-降水重点实验室, 南京 210044
  • 陈煜升
  • 南京信息工程大学气象灾害预报预警与评估协同创新中心, 中国气象局气溶胶-云-降水重点实验室, 南京 210044
  • 摘要:针对目前空气质量统计预报方法存在的主要缺陷,本文提出了距离相关系数和支持向量机回归相结合的统计预报方案DC-SVR.利用淮安市2013年1—12月PM2.5观测资料和常规气象观测资料,首先在选入预报当日气象要素的基础上,增加选取前期污染物和气象要素作为预报因子,再采用距离相关系数分季节从预报因子中筛选出重要预报因子,最后采用支持向量机回归对PM2.5浓度值进行逐日滚动统计预报.研究发现,淮安地区气温和气压对PM2.5的距离相关性要高于其他气象要素,夏秋季PM2.5与气象要素的距离相关性较春冬季好.基于距离相关系数和支持向量机回归建立DC-SVR模型,PM2.5的试预报值和实测值的全年相关系数高达0.76,平均偏差仅为1.13 μg·m-3,平均绝对误差为23.47 μg·m-3.通过与支持向量机回归、人工神经网络的统计预报效果对比,DC-SVR模型有效降低预报因子维数且能自适应选取最佳参数,预报精度显著优于其他3种统计预报方案,可为业务化预报提供参考.
  • Abstract:In this study, a statistical forecasting scheme (DC-SVR) combining distance correlation coefficient (DC) and support vector regression (SVR) is proposed to improve the current air quality statistical forecast.By employing the observations of PM2.5 and meteorological variables in Huaian, Jiangsu province, China from January to December 2013, the important predictors are seasonally selected by the DC from a set of predictors including air pollutant concentrations and meteorological elements on and before the forecasting day, and then SVR is applied to predict PM2.5 concentrations by rolling statistical air quality forecasting. The DC-results show that PM2.5 concentrations have higher correlations with surface air temperature and pressure compared to other meteorological elements. PM2.5 concentrations are more closely correlated with these two meteorological factors in summer and autumn than in spring and winter. The DC-SVR forecast test in 2013 presents a high correlation coefficient of 0.76 between the predicted and observed PM2.5 concentrations with a mean bias of 1.13 μg·m-3 and a mean absolute error of 23.47 μg·m-3. The prediction precision was higher compared to the methods of support vector regression and artificial neural networks. This DC-SVR scheme is capable of reducing the dimensionality of predictors and adaptively selecting the best parameters, and could potentially be used in the operational air quality forecast.

  • 摘要点击次数: 5224 全文下载次数: 3469