规范变换与误差修正结合的环境系统的前向网络和投影寻踪预测模型

引用本文

李祚泳, 汪嘉杨, 徐源蔚. 2019. 规范变换与误差修正结合的环境系统的前向网络和投影寻踪预测模型[J]. 环境科学学报, 39(6): 2053-2070.

Li Z Y, Wang J Y, Xu Y W. 2019. Forward network and projection pursuit for environmental system prediction based on combination of standard transformation and error correction[J]. Acta Scientiae Circumstantiae, 39(6): 2053-2070.

规范变换与误差修正结合的环境系统的前向网络和投影寻踪预测模型

[PDF全文]

李祚泳 , 汪嘉杨 , 徐源蔚

成都信息工程大学资源环境学院, 成都 610225

收稿日期: 2018-04-15; 修回日期: 2018-08-15; 录用日期: 2018-08-15

基金项目: 国家自然科学基金（No.51679155）

作者简介: 李祚泳(1944—),男,教授,E-mail: lizuoyong@cuit.edu.cn

通讯作者（责任作者）: 李祚泳

摘要: 为了建立适用于环境系统的结构简洁、形式统一、程序规范、应用普适的神经网络和投影寻踪回归预测模型，针对传统的神经网络和投影寻踪回归用于多因子、大样本预测建模，存在模型结构复杂、学习效率低的局限，提出设置环境系统预测量及其影响因子参照值和规范变换式的原则和方法，使规范变换后的影响因子皆"等效"于同一个规范影响因子，从而将多因子的的预测建模简化为等效规范因子的预测建模，使模型结构得到极大地简化，提高了学习效率；此外，为了提高预测模型的预测精度，还提出了对预测样本的模型输出值的误差修正公式.在对环境系统的预测量及其影响因子进行规范变换的基础上，将m个规范影响因子的每个建模样本组成m个"等效"训练样本，应用免疫进化算法优化模型参数，分别建立适用于环境系统的2个或3个规范影响因子的前向神经网络和投影寻踪回归两类预测模型；并依据误差理论，对误差修正公式修正后的模型预测精度的提高进行了严格的数学论证.将基于规范变换与相似样本误差修正相结合的两类预测模型，用于某市5个点位的SO₂浓度预测，并与6种传统预测模型和方法的预测结果进行了比较.结果表明：对同一个预测样本，同类模型的两种不同结构的的预测值及其相对误差都几乎完全相同或彼此相差甚小；此外，两种不同结构的两类预测模型用于5个样本预测，其相对误差绝对值的平均值分别为2.59%、2.67%；2.18%、2.62%，均远小于传统BP神经网络模型的25.72%、传统PPR模型的14.20%、传统SVR模型的22.13%、模糊识别模型的21.57%、组合算子模型的18.36%和多元回归模型的25.31%；而两类模型预测的最大的相对误差绝对值分别为4.11%和3.57%，更加远远小于传统的6种预测模型的37.18%、56.07%、27.40%、32.14%、38.38%和60.26%.实例分析结果证实了误差修正公式对提高模型预测精度具有切实可行性.基于规范变换与误差修正相结合的前向神经网络和投影寻踪回归两类预测模型不仅避免了"维数灾难"，提高了学习效率和模型的预测精确度，而且具有简洁、普适、规范、统一和稳定的特点，对其他预测建模也有借鉴作用.

关键词: 环境系统规范变换预测模型前向神经网络投影寻踪回归

Forward network and projection pursuit for environmental system prediction based on combination of standard transformation and error correction

LI Zuoyong, WANG Jiayang, XU Yuanwei

College of Resources and Environment, Chengdu University of Information Technology, Chengdu 610225

Received 15 April 2018; received in revised from 15 August 2018; accepted 15 August 2018

Abstract: The purpose of this study was to establish prediction models of neural network and projection pursuit regression for environmental system, which have the charactertctics of simple structure, unified form, standardized procedures and universal application. The predictive models of traditional neural network and projection pursuit regression, which are used in multi-factor and large sample numbers, have limits of complex model structure, low learning efficiency. Therefore, the design principles and methods of reference values and the standard transformation formula used predicting variable and its influencing factors were proposed. The normalized influence factors were equivalent to the same normative influence factor. Thus, the predictive modeling of multiple factors is simplified as the predictive modeling of the "equivalent" norm factor, which greatly simplifies the model structure and improves the learning efficiency. In addition, in order to improve the prediction accuracy of the prediction model, the error correction formula for the model output value of the prediction sample was also proposed. On the basis of standard transformations for the predictive variable and its influencing factors of environment system, each modeling sample with m canonical influence factors were formed m "equivalent" training samples. Then, the immune evolutionary algorithm was used to optimize the model parameters, two different structures of prediction models of forward neural network and projection pursuit regression for environment system prediction were built:the case of 2-2-1 structure, which was used to any 2 normative impact factors and the case of 3-2-1 structure was, which was used to any 3 normative impact factors. Furthermore, based on the error theory, a rigorous mathematical demonstration was made for the improvement of the prediction accuracy of the model by the error correction formula. Two kinds of prediction models based on standard transformation and similar sample error correction were applied to predict the SO₂ concentration of 5 spots in a city. Results were compared with the prediction results of six traditional prediction models and methods. The results show that for the same forecast sample, the predicted values and relative errors of two different structures of the same model (forward neural networks or projection pursuit regression) were almost identical or very small. In addition, two kinds of prediction models with two different structures were used for the prediction of 5 samples, and the means of relative error absolute values were 2.59%, 2.67% and 2.18%, 2.62%, respectively. They were far less than the results of 22.13%, 25.72%, 14.20%, 21.57%, 18.36% and 25.31% of the prediction models of traditional BP neural network(BP), traditional projection pursuit regression(PPR), traditional support vector machine(SVM), fuzzy recognition, combination operator and multiple regression respectively. The maximum relative error absolute values of samples of the two prediction models were 4.11% and 3.57%, respectively. They were smaller than the results of 56.07%, 27.40%, 37.18%, 32.14%, 38.38% and 60.26% of six traditional forecasting models. The example analysis results confirm that the error correction formula is feasible for improving the prediction accuracy of the model. Two prediction models of forward neural network and projection pursuit regression based on the combination of standard transformation and error correction can avoid the "dimension disaster", improve the learning efficiency and model prediction accuracy. They have the characteristics of simplicity, universality, standardization, unity and stability. They can also be used for reference in other forecasting models.

Keywords: environmental system canonical transformation prediction model forward neural network projection pursuit regression

1 引言(Introduction)

长期以来, 人们经过认真思索, 达成共识：即人类不仅要重视环境的现状, 更应关注环境的未来.为此, 国内外学者提出了许多用于环境系统预测的模型和方法, 如多元线性回归分析(Comrie, 2013; 黄思等, 2015)、分段线性的最近邻表示算法(王保良等, 2016)、非线性灰色伯努利算法(NGBM)(Chen, 2008)、Fuzzy分析((Chen et al., 2005)、灰色分析(肖鸣等, 2017)、灰色马尔柯夫趋势分析(邹志红等, 2009)、时序分析(Diaz Robles et al., 2008)、小波分析(Lange et al., 2007.)、集对分析(金菊良等, 2009)、可变集分析(Chen et al., 2013)等确定性或不确定性分析预测模型, 以及投影寻踪回归(projection pursuit regression, PPR)(Qi et al., 2008)、多种神经网络(neural network, NN) (Grivas et al., 2006; Ghose et al., 2010; Paschalidou et al., 2011; 杨云等, 2016; 孙宝磊等, 2017)和支持向量机(support vector machines, SVM)(Ortiz Garcia et al., 2010; 笪英云等, 2015; Park et al., 2015; Moazami et al., 2016; Shaban et al., 2016)等智能优化预测模型.在多种预测模型中, 最常用的是神经网络、投影寻踪回归和回归支持向量机等预测模型.

传统的回归支持向量机(support vector regression, SVR)预测模型在防止过拟合、克服局部极值及不受高维、非线性和小样本数的限制等方面具有明显优势(Noori et al., 2012), 但对多因子、大样本数的预测问题, 不仅模型结构和计算的复杂性迅速增大, 而且收敛速度慢、求解精度低, 尤其不能建立适用于不同样本数和因子数的普适、规范和统一的模型(李祚泳等, 2018).为此, 笔者提出将规范变换与相似样本误差修正法相结合的回归支持向量机预测模型, 简化了SVR预测模型的结构, 提高了模型学习效率和模型求解精度(李祚泳等, 2018).传统的神经网络和投影寻踪回归预测模型虽然各有其优点, 但对多因子、大样本数的预测建模, 皆存在学习效率低、泛化能力差、求解精度低、模型结构复杂和计算难度皆较大等问题(Wang et al, 2004), 即存在“维数灾难”.传统的神经网络和投影寻踪回归预测模型同样不能建立适用于不同样本数和因子数的形式统一、结构普适、程序规范的预测模型, 从而使它们的应用受到极大的限制.传统的预测模型还普遍存在模型的稳定性较差和预测精度不高.

与将规范变换和相似样本误差修正法相结合用于回归支持向量机预测建模类似, 若对环境系统预测变量及其影响因子进行规范变换, 使规范变换后的所有影响因子皆“等效”于同一个规范影响因子, 将多因子的高维复杂预测建模问题简化为仅是对等效规范因子的简单低维预测建模问题; 此外, 用相似样本的误差修正法对预测样本的模型输出进行误差修正, 以提高两种预测模型对样本(尤其是过拟合样本和异常样本)的预测精度.二者结合用于某市SO₂预测的效果检验表明：模型不仅避免了“维数灾难”, 提高了学习效率和预测精度, 而且编程和计算比传统的PPR、BP网络和NV-SVR预测模型都简便.对5个样本预测的相对误差绝对值的平均值和最大的相对误差绝对值都远小于传统的PPR、BP网络、SVR、模糊识别、参数化组合算子、多元回归预测模型的预测结果, 对提高过拟合样本和异常样本的预测效果尤其显著.

2 预测量及其影响因子的规范变换(Canonical transformations of predictive variables and their influencing factors)

传统的预测模型的预测变量及其影响因子通常采用的归一化或标准化变换皆是各自独立的线性变换, 因而变换前、后影响因子的个数及数据变化特性皆不会发生改变.若对预测变量及其影响因子采用如式(1)和式(2)所示的规范变换(李祚泳等, 2018), 此规范变换要求变换后的样本预测变量及各影响因子的最小规范值x′_jm(或y_jm′)和最大规范值x_jM′(或y_jM′)分别被限定在[0.15, 0.30]和[0.40, 0.55]较小范围内, 并能使规范变换后的不同影响因子规范值皆呈近似相同的变化规律.因而该变换的特点是：变换后用规范值表示的各因子之间不再彼此独立, 而有相互关联.因此, 规范变换后的所有影响因子可视为“等效”于同一个规范影响因子, 从而将多因子的高维复杂预测建模问题简化为仅是对“等效”规范因子的简单2维或3维的预测建模问题, 使传统的预测模型结构得到极大简化.因子“等效”的含义是指规范变换后的所有因子的规范值(数据)不仅分布规律、变化特性呈近似正态分布, 而且它们的分布参数(数学期望和方差)差异很小, 十分接近.因而, 用规范值表示的每个因子对预测变量的影响大小近似相同, 即完全“等效”.

(1)

(2)

式中, c_j为因子或预测变量实际值; c_j₀为设置的因子或预测变量的参照值; c_jb为设定的因子或预测变量的阈值; X_j和x_j′分别为因子或预测变量的变换值和规范值; k代表全体样本个数; n_j为如式(3)所示的因子或预测变量的幂指数.式(1)右边1~4行适用于正向类因子或预测变量的变换; 5~8行适用于逆向类因子或预测变量的变换.

(3)

式中, t_j为因子或预测量实际值的最大值与最小值之比值, 如式(4)所示.

(4)

变换式(1)中的参数c_jb、n_j和c_j₀的确定过程如下：

第一步, 确定因子j是否需要设置c_jb.有以下两种情况的正向、逆向因子, 需要设置c_jb：1)原始数据中有c_j≤ 0的因子, 其目的是使所有样本的该因子值全变为正值, 即有c_j-c_jb>0 (对正向型因子)或c_jb-c_j>0 (对逆向型因子); 2)用式(4)右边第1行的判定条件计算得到的t_j < 2的因子, 其目的是使再用式(4)右边第2行的判定条件计算得到该因子的t_j>2.对c_jb取值的限制条件为：对正向型因子, c_jb < min{c_j}; 对逆向型因子, c_jb > max{c_j}.

第二步, 确定n_j：由式(4)计算出t_j, 再根据式(3)确定n_j的取值.

第三步, 确定因子的c_j₀：首先, 在[0.15, 0.30]区间中值的邻域内, 随意设置因子最小规范值x′_j_m(比如令x′_j_m= 0.20), 将第二步已确定的n_j及设置的x′_j_m和min{c_j}(或还有c_jb)代入式(1)和(2)中, 进行逆运算, 求解出c_j₀; 再将求得的c_j₀、n_j和max{c_j}(或还有c_jb)值代入式(1)和(2)中, 计算得到最大规范值x′_j_M.若x′_j_M在[0.40, 0.55]内, 则c_j₀即为确定的参照值; 否则, 需对c_j₀作微调, 再重复上述过程, 直到最小规范值x′_j_m和最大规范值x′_j_M能分别在被限定的较小范围内即可.现举例说明如下：

例1某市1994—2000各年住户用气普及率(c_j)的调查统计数据为：56.17、52.10、46.40、49.20、53.02、55.20、59.14.

1) 确定该因子是否需要设置c_jb：由于该因子t_j= 59.14/ 46.40=1.27 < 2, 故需要设置c_jb.又因该因子与该市空气清洁指数成正相关(正向型因子), 因此, 变换式(1)应设计为：

X_j= ((c_j-c_jb)/ c_j₀)^n_j, 而且应有c_jb < 46.40.若设c_jb= 40.

2) 确定n_j：在c_jb= 40情况下, 最大值和最小值分别变为59.14-40=19.14和46.4-40=6.4, 从而t_j= 19.14/ 6.40=2.99>2, 由式(3)右边第1个判别条件确定n_j=2;

3) 确定c_j₀：在(0.15, 0.30)内, 若设置与因子最小数据(c_j_m=46.40)相应的最小规范值为x′_j_m= 0.20, 则将c_j_m=46.40、c_jb= 40、n_j=2和x′_j_m= 0.20代入规范变换式(1)和(2)中进行逆运算, 计算得到c_j₀=2.35.

4) 验证当c_j₀=2.35时, 与因子最大数据(c_j_M=59.14)相应的最大规范值为x′_j_M是否在限制范围内：将c_jM=59.14、c_jb= 40、n_j=2和c_j₀=2.35代入规范变换式(1)和(2)中进行运算, 计算得到最大规范值为x_jM′= 0.4195, 因为0.40 < 0.4195 < 0.55, 故设置c_j₀=2.35是合理、可行的.

3 基于规范变换的两种预测模型(Two prediction models based on canonical transformation) 3.1 规范变换的前向神经网络预测模型

为使规范变换的前向神经网络(forward neural network of normalized value, NV-FNN)模型的功能更强大和加速收敛, 采用双极性sigmoid函数作为隐层节点的激活函数; 此外, 为使模型结构既简化, 又能保持较强的非线性映射能力, 采用对隐节点输出的线性求和计算.满足此两个条件的NV-FNN预测模型如式(5)所示(李祚泳等, 2015).

(5)

式中, y为样本的模型输出; H为隐层节点数目; f_h为样本在隐节点h的输出; v_hl为隐节点h与输出节点l的连接权值, 通常取l=1, 故l可略去; x′为样本的输入矢量, 其中, w_hj为输入节点j与隐节点h的连接权值, x_ji′为由式(1)和式(2)计算得到样本i的影响因子j的规范值, 亦即NV-FNN模型的输入; m为影响因子数目, 也是输入节点数目.

由于规范变换后的m个因子完全“等效”, 因此, 只需构建两种最简结构的2-2-1(2个输入节点、2个隐节点和1个输出节点)或3-2-1(3个输入节点、2个隐节点和1个输出节点)的前向网络预测模型的表示式, 如式(6)和式(7)所示.由于式(6)和式(7)对所有m个“等效”规范因子皆适用, 因而, 此2种最简结构的预测模型不仅克服了“维数灾难”, 而且具有普适性、规范性和统一性.

(6)

(7)

式中, v_h(h=1, 2)和w_hj(h=1, 2; j=1, 2, 3)皆为需要用优化算法(比如免疫进化算法)优化确定的网络连接权值.

3.2 规范变换的投影寻踪回归预测模型的矩阵表示

投影寻踪是一种依据“审视数据——计算机模拟——预报”探索性数据分析的预测建模思想(EDA)和计算技术.投影寻踪回归(projection pursuit regression, PPR)实质是用N个岭函数G_m(Z_m)的“和”去逼近回归函数, 其特点是：它无论对线性还是非线性、正态还是偏态、独立还是相关、低维还是高维分布数据皆适用.规范变换的投影寻踪回归(projection pursuit regression of normalized value, NV-PPR)分析模型也是用N个岭函数G_m(Z_m)的“和”去逼近回归函数y, 它可写成如式(8)所示的参数矩阵乘积表示式(李祚泳等, 2007).

(8)

式中, 为m维自变量(即因子)规范值组成的列矩阵(列向量)(m行1列); “T”表示矩阵转置; α是由N个m维投影方向矢量构成的矩阵(N行m列), 它的每一行是m维投影方向矢量组成的行矩阵(行向量), 需满足1; G_uα·x′为第u个岭函数(u=1, 2, …, N), 它就是α矩阵的第u行与m个自变量(因子)组成的列矩阵x′的乘积表示式; ;β_u为第u个岭函数的权重系数; N为岭函数的个数, 它为等于或大于2的正整数.岭函数的“个数”类似于前向神经网络(FNN)或者BP神经网络模型隐层(中间层)的隐节点的“个数”.因此, N个岭函数的和也就是由N行m列的矩阵α与m行1列的列矩阵x′的乘积矩阵.由于岭函数的个数N需随样本的影响因子数目的增加而增加, 因而当因子较多时, 需要优化的参数矩阵元随N的增加而激剧增长, 即出现通常所说的“维数灾难”.这也许就是传统的PPR多因子预测模型不仅编程复杂、学习效率低、收敛速度慢, 而且预测精度往往不高的原因之一.传统的PPR预测模型岭函数的个数N采用尝试法(试奏法)或用优化方法确定; 而基于因子规范变换的PPR预测模型由于任意多个因子皆用一个等效规范因子替代, 因子数目极大减少, 故只需构造N=2个岭函数就足够了, 不需要用其他方法确定, 从而使NV-PPR预测模型不仅编程简单、学习效率高, 而且预测精度也高, 避免了“维数灾难”.

与NV-FNN预测建模完全类似, 只需分别构建适用于2个规范因子的具有2个岭函数和1个输出变量的2-2-1结构的NV-PPR(2)模型, 和3个规范因子的具有2个岭函数和1个输出变量的3-2-1结构的NV-PPR(3)模型, 如式(9)和式(10)所示; 化简二式, 分别得式(11)和式(12).式(9)~式(12)的预测模型也不仅克服了“维数灾难”, 而且也具有普适性、规范性和统一性.

(9)

(10)

(11)

(12)

式中, A= β₁α₁₁+β₂α₂₁ B= β₁α₁₂+β₂α₂₂ C=β₁α₁₃+β₂α₂₃

式中, x_jj′′的第一个字母下标j代表的就是式(8)中的下标j(j=1, 2, …, m); 而第二个数字下标j′ (j′=1, 2, 3)则表示：对由m个规范因子构成的每个建模(或检测)样本, 若将其m个规范因子按序排列, 并首尾相连.当第一个字母下标j代表的因子取定后, 从它开始依顺序取连续3个因子规范值, 记为x′_j₁、x′_j₂、x′_j₃.对NV-PPR(2)模型, 以它们中的相邻2个因子组合成1个训练样本; 对NV-PPR(3)模型, 以它们中的相邻3个因子组合成1个训练(或检测)样本.但无论是NV-PPR(2)模型或NV-PPR(3)模型, 每个建模样本都要依顺序构造出m个训练(或检测)样本, 而全部n个建模样本共构造出m×n个训练(或检测)样本.β_u(u =1, 2)和α_uj(u=1, 2;j=1, 2, 3)分别为需要用优化算法优化确定的岭函数的权重系数和投影方向单位矢量的各个分量.

3.3 预测模型的优化目标函数式

为了优化NV-FNN和NV-PPR预测模型中的参数v_h(h=1, 2)、w_hj(h=1, 2;j=1, 2, 3)和β_u(u=1, 2)、α_uj(u=1, 2;j=1, 2, 3), 设计如式(13)所示的优化目标函数式(李祚泳, 2018).

(13)

式中, y_ij为由NV-FNN模型式(6)、式(7)或NV-PPR模型(9)、式(10)计算得到的第i(i=1, 2, …, n)个建模样本组成的第j个训练样本的模型输出值.对有m个规范因子的n个样本的预测建模而言, 由于每个建模样本需要组成的训练样本数与因子数都同是m个, 因此, 训练样本数亦可用j(j=1, 2, …, m)表示, 而n个建模样本共组成m×n个训练样本.y_i′为建模样本i组成的任意一个训练样本的模型期望输出值.第i个建模样本组成的m个训练样本的模型期望输出值皆相同, 即为该样本预测量y_i的规范值y_i′.

3.4 预测样本模型输出的误差修正式

为使预测样本尤其是过拟合样本和异常预测样本(或检测样本)的预测(或检测)值更接近实际值, 多数情况下, 需对预测(或检测)样本的模型输出值进行误差修正.此处提出的误差修正的基本思想为：依据相似原因产生相似结果的原则, 从建模样本集中, 找出与预测(或检测)样本的模型计算输出值最接近的一个或多个模型计算输出值相似的样本, 并认为这些相似样本的模型计算输出值及拟合相对误差应分别与该预测(或检测)样本的模型计算输出值和估计相对误差成比例, 因而满足如式(14)所示的比例基本定理公式, 从而计算得到预测样本的模型输出值y_x′的估计相对误差r_x′, 再由估计相对误差r_x′计算预测样本修正后的模型输出值y_xx′, 如式(15)所示(李祚泳等, 2018).

(14)

(15)

式中, y_x′和y_xx′分别为预测(或检测)样本修正前和修正后的模型计算输出值; r_x′为计算得到预测(或检测)样本模型输出的估计相对误差的绝对值; y_s′和r_s′分别为在建模样本集中, 与预测(或检测)样本的模型输出值y_x′最接近的一个或多个相似样本的模型拟合输出值及拟合相对误差的绝对值.

对模型计算输出值误差修正公式(15)的两种情况的采用说明如下：由于预测(或检测)样本的模型计算输出值y_x′与相似样本的模型计算输出值y_s′很接近, 而相似样本的模型计算输出的理想(目标)值应为该相似样本的实际值y_s的规范值y_s₀′, 因此, 通常情况下, 依据它们之间的相互大小关系来选用：1)若y_x′~y_s′, 且y_x′> y_s₀′和y_s′> y_s₀′, 则因y_x′和y_s′都大于理想值y_s₀′, 故需用公式y_xx′= y_x′/ (1+ r_x′)修正, 使修正后的预测样本模型输出值y_xr′减小; 2)若y_x′~y_s′, 且y_x′ < y_s₀′和y_s′ < y_s₀′, 则因y_x′和y_s′都小于理想值y_s₀′, 故应用公式y_xx′= y_x′/ (1- r_x′)修正, 使修正后的预测样本模型输出值y_xx′增大.3)若y_x′~y_s′~ y_s₀′, 且r_s′很小(比如r_s′ < 0.5%), 若只有此一个相似样本, 表示三者差异很小, 误差可以忽略不计, 可不作误差修正; 当有多个相似样本, 而其他相似样本的误差r_s′又不可忽略时, 此相似样本的r_s′虽然很小, 则需兼顾其他相似样本的误差修正情况, 选择其中一个公式修正.4)若y_x′~y_s′, 且r_s′较大(比如r_s′>15%), 说明此相似样本可能是“过拟合”样本或异常样本, 当只有此一个相似样本：若用式y_xx′= y_x′/ (1- r_x′)计算出的y_xx′较大, 比如y_xx′>0.55(上限值), 而用式y_xx′= y_x′/ (1+ r_x′)计算出的y_xx′值在[0.20, 0.45]范围内, 则用后者公式修正; 反之, 若用式y_xx′= y_x′/ (1+ r_x′)计算出的y_xx′较小, 比如低于y_xx′ < 0.20(下限值), 而用式y_xx′= y_x′/ (1- r_x′)计算出的y_xx′值在[0.30, 0.55]范围内, 则用后者公式修正; 当还有其他相似样本, 则也需兼顾其他相似样本的误差修正情况, 选择其中一个公式修正.5)有多个相似样本时, 一般是将他们修正后的输出值的均值作为最终的输出修正值.

3.5 两种预测模型的建模实现过程

两种预测建模的具体实现过程如下：

① 依据规范变换式的设计原则和方法, 设置预测变量及其影响因子的规范变换式(1)和(2), 并计算出因子和预测变量的规范值;

② 分别将因子和预测变量的规范值代入两种模型的公式(6)、(7)或式(9)、(10)和目标函数式(13), 应用优化方法对公式中的参数进行优化;

③ 用优化好的公式, 计算两种模型的建模样本的模型拟合输出值及其拟合相对误差绝对值和检测(预测)样本的模型输出值;

④ 为提高预测样本尤其是过拟合样本和异常预测样本的预测精度, 用相似样本误差修正公式(式(14)和(15))对预测样本模型输出值进行误差修正;

⑤ 最后由修正后的预测样本的模型输出值, 用规范变换式的逆运算, 计算出样本预测值.

4 预测模型的检验(The test of prediction model)

预测模型的检验包括对模型的可靠性检验和对模型的精确度检验.

4.1 预测模型的可靠性分析

由于任何预测模型都是构筑在若干模型参数基础上的, 这些参数又是依据模型影响因子及其预测变量的输入、输出数据来确定的.而获得的输入、输出数据具有的误差必然导致预测模型的参数估计存在一定的不确定性, 这些参数的不确定性对模型预测结果的可靠性和稳定性当然会有一定的影响.其影响程度即是模型的可靠性, 它可以通过模型的输出对于输入的响应程度(即灵敏度)分析来确定(郑彤等, 2003).依据系统灵敏度定义, 预测模型输出y的相对误差Δy/y和影响因子的相对误差Δc_j/c_j之间具有如式(16)所示的关系式.

(16)

式中, S_y为NV-FNN和NV-PPR模型的输出y对影响因子c_j的灵敏度.

① NV-FNN预测模型的可靠性分析

若变换式(1)中的逆向影响因子的n_j用负数表示, 则式(1)可统一用正向影响因子形式表示.将式(1)代入式(2), 得

(17)

求上式x′_j对c_j的微分, 得

(18)

上式两边同除以x′_j, 得

(19)

由双极性函数的输出式

(20)

可得

(21)

(22)

比较式(16)和式(22), 可得NV-FNN模型的输出y对影响因子c_j的灵敏度为：

(23)

② NV-PPR预测模型的可靠性分析

完全类似, 两种结构的NV-PPR预测模型输出式(11)和(12)可统一表示为式(24).

(24)

由式(1)、式(2)和式(24), 可得

(25)

比较式(16)和式(25), 得

(26)

变换式(1)中的n_j只取n_j=±2、±1、±0.5.由于用式(1)和(2)计算得到的各因子和预测变量的最小规范值的下限为0.15, 最大规范值的上限为0.55.因此, 任何因子的其余规范值必然满足0.55>x_j′>0.15.由式(23)和式(26)可知：当且仅当n_j=±2和0.2>x_j′>0.15时, 才会出现计算得到的NV-FNN和NV-PPR模型的灵敏度S_y >1, ;其余情况, 皆满足S_y ≤1, 即低灵敏度模型.若因子实际值的相对误差为Δc_j/c_j, 由式(16)知, (Δy/y)≤(Δc_j/c_j).可见, NV-FNN和NV-PPR模型计算得到的输出值y的相对误差Δy/y一般不被放大, 反而被缩小.因此, NV-FNN和NV-PPR预测模型的输出是稳定、可靠的.

由式(16)知：每个影响因子的不确定性相对误差Δc_j/c_j会导致模型预测值y的相对误差Δy_j/y_j(j =1, 2, …, m), 又依据误差传播理论, m个因子具有的相对误差Δc_j/c_j(j=1, 2, …, m)导致预测模型输出y总的相对误差Δy/y应为各因子导致的相对误差Δy_j/y_j(j =1, 2, …, m)绝对值之和, 如式(27)所示.

(27)

可见, 当影响因子m较多时, 传统的FNN和PPR预测模型由于模型结构复杂, 需要优化确定的参数多, 其不确定性对模型预测结果的影响也就很大, 因而预测精度低、误差大也就是必然; 而基于规范变换的NV-FNN、NV-PPR预测模型, 由于所有m个规范影响因子等效于一个规范影响因子, 模型结构简化, 优化的参数大大减少, 减少了模型预测的相对误差, 将模型结构对预测精度的影响降低到最小程度, 提高了模型的预测精度.比如, 若每个影响因子的相对误差Δc_j/c_j都相同, 则m个规范影响因子的规范变换的预测模型输出的相对误差Δy/y仅为传统的FNN和PPR预测模型输出的相对误差的1/m.

4.2 预测模型的精确度F值统计检验

精确度是指模型的计算结果与实际数据之间的吻合程度.常用的模型的精确度F值统计检验通过比较两组数据的方差, 以确定他们的精密度是否有显著性差异, F统计量计算式如式(28)所示.

(28)

式中, U和Q分别为样本的回归平方和及残差平方和; m为影响因子数, n为样本数.选择显著水平α=0.005~0.10, 查阅F分布表中自由度n₁=m, n₂=n-m-1时的临界值F_0.005~0.10.若由式(28)计算出的F>F_0.005~0.10, 则模型精度得到验证.

4.3 预测模型精确度的理论分析 4.3.1 误差修正公式对模型输出的相对误差的影响

以式(15)的第1个误差修正公式为例, 分析其对预测样本模型输出精度的影响.将式(14)代入式(15)的第1个公式, 得

(29)

定义：预测样本X与其相似的样本S之间的相似度(亦可称相似比)为

(30)

若y_x′ < y_s′, 则; 若y_x′>y_s′, 则K=.因此K∈[0, 1], 对相似样本而言, 通常K∈[0.90, 1]内.若y_x′ < y_s′, 将代入式(29), 化简得

(31)

在K为一定值情况下, 将式(31)中的y′_xx对r_s′微分得

(32)

将式(32)分别除以式(31)的两边, 化简得

(33)

因为

(34)

式(34)代入式(33), 化简得

(35)

式中, 为用误差修正公式修正后的预测样本模型输出计算值(估计)的相对误差, 简记为r′_xx= .为了叙述方便, 以下简称“修正后的样本模型输出的相对误差”.

从式(35)可见, 修正后的样本模型输出的相对误差r′_xx仅由相似样本的模型输出的拟合相对误差r_s′和预测样本与相似样本之间的相似度K唯一确定.由式(35)计算得到有不同相似度K和不同相似样本的相对误差r_s′情况下, 修正后的样本模型输出的相对误差(绝对值)如表 1所示.

表 1 不同K和不同r_s′情况下修正后的预测样本模型输出的相对误差 Table 1 Relative errors of modified prediction model output under different K and different r_s′ conditions

r_s′	K=0.90	K=0.91	K=0.92	K=0.93	K=0.94	K=0.95	K=0.96	K=0.97	K=0.98	K=0.99	K=1.00
r_s′	r_xx′	r_xx′	r_xx′	r_xx′	r_xx′	r_xx′	r_xx′	r_xx′	r_xx′	r_xx′	r_xx′
1%	0.10%	0.09%	0.08%	0.07%	0.06%	0.05%	0.05%	0.04%	0.03%	0.02%	0.01%
3%	0.33%	0.30%	0.28%	0.26%	0.24%	0.21%	0.19%	0.16%	0.14%	0.11%	0.08%
5%	0.60%	0.56%	0.53%	0.50%	0.46%	0.42%	0.39%	0.35%	0.31%	0.27%	0.23%
7%	0.91%	0.87%	0.82%	0.78%	0.73%	0.68%	0.63%	0.58%	0.53%	0.48%	0.43%
9%	1.26%	1.20%	1.15%	1.10%	1.07%	0.98%	0.93%	0.87%	0.81%	0.74%	0.68%
10%	1.44%	1.38%	1.33%	1.27%	1.21%	1.15%	1.09%	1.02%	0.96%	0.89%	0.83%
12%	1.83%	1.77%	1.71%	1.64%	1.57%	1.50%	1.44%	1.37%	1.30%	1.22%	1.15%
15%	2.46%	2.39%	2.32%	2.25%	2.18%	2.10%	2.02%	1.95%	1.87%	1.78%	1.70%
17%	2.91%	2.84%	2.77%	2.69%	2.61%	2.53%	2.45%	2.37%	2.28%	2.20%	2.11%
20%	3.62%	3.54%	3.47%	3.39%	3.30%	3.22%	3.14%	3.05%	2.96%	2.87%	2.78%
22%	4.11%	4.03%	3.95%	3.87%	3.79%	3.70%	3.62%	3.53%	3.44%	3.35%	3.25%
25%	4.87%	4.79%	4.71%	4.63%	4.55%	4.46%	4.37%	4.28%	4.19%	4.10%	4.00%
27%	5.39%	5.31%	5.23%	5.15%	5.07%	4.98%	4.89%	4.80%	4.71%	4.62%	4.52%
30%	6.19%	6.12%	6.04%	5.95%	5.87%	5.78%	5.69%	5.60%	5.51%	5.42%	5.33%
32%	6.74%	6.66%	6.58%	6.50%	6.41%	6.33%	6.24%	6.15%	6.06%	5.97%	5.88%
35%	7.56%	7.48%	7.41%	7.33%	7.25%	7.16%	7.08%	6.99%	6.90%	6.81%	6.72%
37%	8.12%	8.04%	7.97%	7.89%	7.81%	7.73%	7.64%	7.56%	7.47%	7.38%	7.29%
40%	8.95%	8.88%	8.81%	8.74%	8.66%	8.58%	8.50%	8.42%	8.33%	8.25%	8.16%
45%	10.36%	10.30%	10.23%	10.16%	10.09%	10.02%	9.94%	9.87%	9.79%	9.71%	9.63%
50%	11.77%	11.71%	11.65%	11.59%	11.53%	11.46%	11.40%	11.33%	11.26%	11.18%	11.11%

对式(35)的相对误差r′_xx讨论如下：

1) 当预测样本与相似样本完全相似时, K=1, 式(35)简化为：

(36)

2) 式(35)右边r_s′前的表示式可改写为：

(37)

式中, 第1个因子满足; 第2个因子亦满足.因而它们的乘积亦满足, 因此,一定有r′_xx<r_s′

结论：用误差公式修正后的预测样本模型输出的相对误差一定会小于未用误差公式修正的相似样本的模型输出的相对误差.

3) r′_xx随r_s′的变化

在相似比K为某一定值情况下, 将式(35)中的r′_xx对r_s′求偏导数, 并化简得

(38)

由于0 < K≤1, 因此, 式(38)右边总满足大于0, 故r′_xx是r_s′的增函数, 即r′_xx随r_s′的增大而增大.但随着r_s′的增大, 其导数值逐渐变小, 即r′_xx增大的速度逐渐减慢; 反之亦然.这同表 1中K为某一定值时的r′_xx随r_s′的变化规律完全一致.

4) r′_xx随K的变化

类似, 在r_s′为某一定值情况下, 将式(35)中的r′_xx对K求偏导数, 并化简得

(39)

式中, 分子随K增大而减少; 分母随K增大而增大, 因此r′_xx是K的减函数, 即修正后的样本模型输出的相对误差r′_xx随相似度K的增大而逐渐减小, 反之亦然.这同表 1中当r_s′为某一定值时, r′_xx随K的变化规律也是完全一致的.

4.3.2 误差修正后的样本模型预测值的相对误差及预测精度分析

对式(1)和式(2)进行逆变换, 得到如式(40)所示的指数变换式.

(40)

式中, c_j和x′_j的意义同式(1)和式(2);a=c_jo, b=.

设不用误差公式修正和采用误差公式修正后的预测样本模型输出计算值分别为y_x′和y′_xx, 将它们分别代入式(40), 得

(41)

(42)

式中, _x和_xx分别为不用误差公式修正和用误差修正公式修正后, 计算得到的样本实际预测值.

将式(41)和式(42)的_x和_xx分别对y_x′和y′_xx求微分, 可得

(43)

(44)

将式(43)和式(44)两边分别除以式(41)和式(42)两边, 得

(45)

(46)

由y_x′=Ky_s′, 得Δy_x′=KΔy_s′, 又因Δy_s′=r_s′y_s′, 因而有

(47)

将式(47)代入式(45), 得

(48)

将式(34)代入式(32)化简, 得

(49)

将式(49)代入式(46), 并取绝对值(为运算简称, 省去绝对值符号, 以下同), 得

(50)

式(50)的物理意义为：用误差修正公式修正后的样本模型输出值y′_xx代入逆规范变换式(42), 计算得到的预测样本实际预测值_xx的相对误差与相似样本的模型输出值y_s′及其拟合相对误差r_s′、相似度K和修正后的样本模型输出值y′_xx之间的关系式.

对式(50)讨论如下：

记, 则式(50)还可化为：

(51)

式中, 因为y_x′~y_s′, 故y_xx′~y_s0′.因此, (y_xx′~y_s′)/y_s′可近似用r_s′ =(y_s0′~y_s′)/y_s′替代.

1) 当K为某一定值时, _xx随r_s′的变化

将式(51)中的_xx对r_s′求偏导数, 并化简, 得

(52)

因式(52)右边恒大于0, 故_xx是r_s′的增函数, 即修正后计算得到的预测样本的实际预测值的相对误差_xx随相似样本模型输出计算值的相对误差r_s′的增大而增大, 但因导数值随r_s′的增大而逐渐减小; 因此, _xx的增大量逐渐变小, 反之亦然.

2) 当r_s′为某一定值时, _xx随K的变化

将式(51)中的_xx对相似度K求偏导数, 并化简, 得

(53)

由于式(53)右边恒大于0, 因此, _xx亦是K的增函数, 即修正后计算得到的预测样本实际预测值的相对误差_xx亦随相似度K的增大而增大.同样, 因导数值随K的增大而逐渐减小, 因而其增大量亦逐渐变小; 反之亦然.

3) 用误差修正公式修正和不用误差修正公式修正计算得到的两种实际预测值的相对误差的大小比较

用式(50)的两边除以式(48)两边, 化简得

(54)

由式(54)计算得到有不同相似度K和不同相似样本的相对误差r_s′情况下, 两种相对误差的比值B(或B^-1)如表 2所示.因为和0 < , 故它们的乘积亦满足·, 即两种相对误差的比值0 < B < 1.

表 2 不同K和不同r_s′情况下修正和未作修正的样本的两种预测值的相对误差的比值(B=R_xx/R_x and B^-1) Table 2 The ratio of the two relative errors of the actual predicted values of the corrected and not revised prediction samples under different K and different r_s′conditions. (B=R_xx/R_x and B^-1)

r_s′	K=0.90	K=0.92	K=0.94	K=0.96	K=0.97	K=0.98	K=0.99	K=1.00
r_s′	B / B^-1	B / B^-1	B / B^-1	B / B^-1	B / B^-1	B / B^-1	B / B^-1	B / B^-1
1%	0.0089/113	0.0090/110	0.0092/108	0.0094/106	0.0095/105	0.0096/104	0.0097/103	0.0098/102
3%	0.0256/39.0	0.0261/38.	0.0267/37	0.0272/37	0.0275/36	0.0277/36	0.0280/36	0.0283/35
5%	0.0412/24	0.0420/24	0.0429/23	0.0437/23	0.0441/23	0.0445/22	0.0449/22	0.0454/22
7%	0.0558/18	0.0568/18	0.0579/17	0.0590/17	0.0595/17	0.0600/16	0.0606/16	0.0611/16
10%	0.0758/13	0.0772/13	0.0785/13	0.0799/13	0.0806/12	0.0813/12	0.0820/12	0.0862/12
12%	0.0880/11	0.0895/11	0.0911/11	0.0926/11	0.0934/10	0.0942/10	0.06949/10	0.0957/10
15%	0.1048/9.5	0.1066/9.4	0.1083/9.2	0.1100/9.1	0.1109/9.0	0.1117/9.0	0.1126/8.9	0.1134/8.8
17%	0.1150/8.7	0.1170/8.6	0.1188/8.4	0.1206/8.3	0.1215/8.2	0.1224/8.2	0.1233/8.1	0.1241/8.0
20%	0.1293/7.7	0.1313/7.6	0.1332/7.5	0.1351/7.4	0.1361/7.4	0.1370/7.3	0.1380/7.2	0.1389/7.2
22%	0.1380/7.3	0.1400/7.1	0.1420/7.0	0.1440/7.0	0.1449/6.9	0.1459/6.9	0.1469/6.8	0.1478/6.7
25%	0.1499/6.7	0.1520/6.6	0.1540/6.5	0.1561/6.4	0.1570/6.4	0.1581/6.3	0.1590/6.3	0.1600/6.3
27%	0.1573/6.3	0.1594/6.3	0.1614/6.2	0.1635/6.1	0.1645/6.1	0.1655/6.0	0.1664/6.0	0.1674/6.0
30%	0.1674/6.0	0.1695/5.9	0.1716/5.8	0.1736/5.8	0.1746/5.7	0.1756/5.7	0.1766/5.7	0.1775/5.6
35%	0.1822/5.5	0.1842/5.4	0.1863/5.4	0.1882/5.3	0.1892/5.3	0.1902/5.3	0.1911/5.2	0.1920/5.2
40%	0.1946/5.2	0.1966/5.1	0.1986/5.0	0.2005/5.0	0.2013/5.0	0.2013/4.9	0.2032/4.9	0.2041/4.9
50%	0.2140/4.7	0.2158/4.6	0.2175/4.6	0.2191/4.6	0.2199/4.6	0.2207/4.5	0.2215/4.5	0.2222/4.5
60%	0.2277/4.4	0.2292/4.4	0.2306/4.3	0.2319/4.3	0.2325/4.3	0.2332/4.3	0.2338/4.3	0.2344/4.3
70%	0.2371/4.2	0.2383/4.2	0.2394/4.2	0.2404/4.2	0.2409/4.2	0.2413/4.1	0.2418/4.1	0.2422/4.1
80%	0.2434/4.1	0.2442/4.1	0.2450/4.1	0.2457/4.1	0.2460/4.1	0.2463/4.1	0.2466/4.1	0.2469/4.1
90%	0.2472/4.0	0.2478/4.0	0.2483/4.0	0.2487/4.0	0.2489/4.0	0.2490/4.0	0.2492/4.0	0.2493/4.0
100%	0.2493/4.0	0.2496/4.0	0.2498/4.0	0.2499/4.0	0.2499/4.0	0.2500/4.0	0.2500/4.0	0.2500/4.0

结论：用误差修正公式修正后的预测样本的模型输出值计算得到的样本实际预测值的相对误差, 一定小于未用误差公式修正的模型输出值计算得到的实际预测值的相对误差, 即.

对式(54)讨论如下：

a. K为某一定值时, 两种实际预测值的相对误差比值B随r_s′的变化

将式(54)中的B对r_s′求偏导数, 化简得

(55)

通常情况下, 0 < K≤1, 0 < r_s′ < 1, 其乘积0 < Kr_s′ < 1, 故式(55)右边大于0, 因此, B是r_s′的增函数, 即B随r_s′的增大而增大(而其逆B^-1则表示修正后的预测精度比不修正的预测精度高的倍数); 反之亦然.同样, 随着r_s′的增加, 式(55)右边的导数值减小, 即随着r_s′的增大, 2种相对误差的比值B的增加值逐渐减小.

b.当r_s′为某一定值时, B随K的变化

将式(54)中的B对K求偏导数, 化简得

(56)

式(56)与式(55)完全类同, 因其右边大于0, 故B是K的增函数(自然B^-1是K的减函数), 即B随K的增大而增大, 但随着K增大, B的增大量逐渐减小.B(或B^-1)随r_s′和K的变化规律与表 2中的变化规律完全一致.但由于表 2中的r_s′的变化范围Δr_s′=0.01~1.00, 远大于K值的变化范围ΔK=0.90~1.00.因此, 在r_s′为一定值情况下, 不同K值时的比值B(或B^-1)差异很小; 在r_s′为较大值时, 不同K值时的B(或B^-1)几乎完全相同, 见表 2.

结论：修正后的预测样本的实际预测值的相对误差与未作修正的预测样本的实际预测值的相对误差的比值B随相似样本的相似度K和相似样本的相对误差r_s′的增大而增大, 而其模型预测精度比不修正的模型预测精度提高的倍数B^-1则随K和r_s′的增大而逐渐减小, 但B(或B^-1)随K的变化远不及随r_s′的变化大; 反之亦然.

5 NV-FNN和NV-PPR模型用于某城市SO₂浓度预测(Predictions of SO₂ concentration in a city based on NV-FNN and NV-PPR models) 5.1 SO₂及其影响因子的参照值和规范变换式的设置

某城市SO₂浓度值(c_y)及其工业耗煤(c₁)、人口密度(c₂)、交通密度(c₃)、饮食服务点(c₄)4个影响因子的实际数据, 如表 3所示(刘永等.2004).传统的多种预测模型和方法对此实例预测的效果均不理想, 相对误差较大.依据变换式(1)设计原则及c_j₀和n_j的选择方法, 设置如式(57)所示的变换式, 由式(57)和式(2)计算出各影响因子的规范值x_i′及SO₂的规范值y_i′, 皆如表 3所示.

(57)

式中, c₁、c₂、c₃、、c₄和c_y的参照值c_j0分别设置为：0.00008、0.0004、0.01、0.05和0.00002.

5.2 预测模型训练样本的组成

由于规范变换后的m个因子完全“等效”, 因此, 将规范变换后各个建模样本的第1个、第2个规范因子组成预测模型(NV-FNN或NV-PPR)的第1个训练样本; 再将第2个、第3个规范因子组成预测模型的第2个训练样本; 依次递推, 直至将第m个和第1个规范因子组成预测模型的第m个训练样本.完全类似, 将各建模样本的第1个、第2个、第3个规范因子组成预测模型的第1个训练样本; 再将第2个、第3个、第4个规范因子组成预测模型的第2个训练样本, 依次递推, 直至将第m个、第1个和第2个规范因子组成预测模型的第m个训练样本.两种情况皆是由每个建模样本组成m个训练样本, n个建模样本共组成m×n个训练样本, 分别用于训练NV-FNN和NV-PPR各自的两种简单结构的预测模型.

表 3 某城市SO₂浓度的实际值和规范值以及4个影响因子的实际数据和规范值 Table 3 The actual values and standard values of SO₂ concentration and 4 influencing factors respectively in a city

序号	影响因子实际数据				影响因子规范值				SO₂
序号	c_i₁	c_i₂	c_i₃	c_i₄	x_i₁′	x_i₂′	x_i₃′	x_i₄′	实际值c_yi	规范值y_i′
1	0.028	0.093	12.9	24	0.2929	0.2724	0.3581	0.3087	0.008	0.2996
2	0.102	0.051	8.3	12	0.3575	0.2424	0.3361	0.2740	0.012	0.3198
3	0.004	0.043	12	22	0.1956	0.2339	0.3545	0.3043	0.023	0.3524
4	0.64	0.053	3	8	0.4494	0.2443	0.2852	0.2538	0.02	0.3454
5	0.432	0.185	31.2	41	0.4297	0.3068	0.4023	0.3355	0.062	0.4020
6	0.12	0.203	33.8	39	0.3657	0.3115	0.4063	0.3330	0.041	0.3813
7	0.43	0.194	50.8	22	0.4295	0.3092	0.4267	0.3043	0.071	0.4087
8	0.099	1.379	9.4	6	0.3560	0.4073	0.3423	0.2394	0.012	0.3198
9	0.084	0.039	35.7	23	0.3478	0.2290	0.4090	0.3066	0.007	0.2929
10	0.673	0.208	15.1	7	0.4519	0.3127	0.3660	0.2471	0.062	0.4020
11	2.319	0.245	9.1	12	0.5137	0.3209	0.3407	0.2740	0.092	0.4217
12	0.933	0.619	17.3	64	0.4682	0.3672	0.3728	0.3577	0.044	0.3848
13	0.217	6.732	46.8	276	0.3953	0.4865	0.4226	0.4308	0.12	0.4350
14	0.704	1.164	16.1	40	0.4541	0.3988	0.3692	0.3342	0.009	0.3055
15	0.017	1.233	25.8	38	0.2679	0.4017	0.3928	0.3317	0.014	0.3276
16	0.144	5.544	42.5	260	0.3748	0.4768	0.4177	0.4278	0.12	0.4350
17	0.12	0.203	33.8	39	0.3657	0.3115	0.4063	0.3330	0.041	0.3813
18	0.144	0.152	10.7	5	0.3748	0.2970	0.3488	0.2303	0.024	0.3545
19	0.503	1.255	7.1	57	0.4373	0.4026	0.3283	0.3519	0.056	0.3969
20	0.08	1.632	8.3	54	0.3454	0.4157	0.3361	0.3492	0.028	0.3622
21	0.12	1.422	6.8	135	0.3657	0.4088	0.3261	0.3951	0.024	0.3545
22	0.078	1.268	7.3	140	0.3441	0.4031	0.3297	0.3969	0.014	0.3276
23	0.045	0.247	6.4	80	0.3166	0.3213	0.3231	0.3689	0.03	0.3657
24	0.121	0.224	6.7	29	0.3661	0.3164	0.3254	0.3182	0.021	0.3478
25	0.245	0.451	19.3	68	0.4013	0.3514	0.3783	0.3608	0.012	0.3198
26^*	0.044	0.087	20.7	48	0.3155	0.2691	0.3818	0.3433	0.028	0.3622
27^*	0.323	1.271	32	77	0.4152	0.4032	0.4035	0.3670	0.045	0.3859
28^*	1.566	2.255	36.7	96	0.4941	0.4319	0.4104	0.3780	0.073	0.4101
29^*	2.312	0.439	39.8	74	0.5136	0.3500	0.4145	0.3650	0.078	0.4134
30^*	1.403	0.33	48.1	77	0.4886	0.3358	0.4239	0.3670	0.099	0.4254
注：“”表示预测样本, c_i₁单位为10⁴ t · km^-2, c_i₂为10⁴人· km^-2, c_i₃为辆· km^-2, c_i₄为个· km^-2, c_y*为mg · m^-3.

5.3 某城市SO₂的NV-FNN模型的计算输出

选取样本序号1~25的数据作为建模样本, 样本序号26^*~30^*的数据作为模型检测样本.分别由表 3中的各建模样本的4个影响因子规范值x_i′与相应的SO₂规范值y_i′, 按上述训练样本的组成法构成4个训练样本, 并将建模样本1~25组成的100个训练样本规范值分别带入NV-FNN(2)(式(6))和NV-FNN(3)(式(7))模型, 用免疫进化算法(倪长健等, 2003).对连接权值w_hi和v_h反复迭代优化.该算法的优点是：不仅可有效避免不成熟收敛, 以更高的精度和较快的速度逼近全局最优解, 而且算法原理简单, 编程简便.当优化目标函数式(13)分别满足和时, 停止迭代, 得到优化好的NV-FNN(2)和NV-FNN(3)模型的权值矩阵w_hj和v_h (h=1, 2; j=1, 2)或w_hj和v_h (h=1, 2; j=1, 2, 3).从而得到NV-FNN(2)和NV-FNN(3)模型的输出式, 分别如式(58)和(59)所示.

(58)

(59)

由式(58)和式(59)计算得到NV-FNN两种结构的建模样本1~25的模型拟合输出值及其拟合相对误差绝对值、检测(预测)样本26^*~30^*的模型计算输出值, 见表 4.

表 4 某城市SO₂两种预测模型输出值及其相对误差绝对值 Table 4 The output values and relative error absolute values of the two class prediction models of SO₂ in a city

序号	NV-FNN(2)		NV-FNN(3)		NV-PPR(2)		NV-PPR(3)
序号	y_i(2)	r_i(2)	y_i(3)	r_i(3)	y_i(2)	r_i(2)	y_i(3)	r_i(3)
1	0.3119	4.12%	0.3141	4.84%	0.3105	3.65%	0.3120	4.14%
2	0.3065	4.16%	0.3087	3.48%	0.3049	4.66%	0.3064	4.21%
3	0.2763	21.58%	0.2790	20.83%	0.2743	22.17%	0.2756	21.80%
4	0.3118	9.72%	0.3140	9.08%	0.3106	10.06%	0.3121	9.63%
5	0.3706	7.80%	0.3715	7.59%	0.3715	7.57%	0.3733	7.13%
6	0.3567	6.44%	0.3580	6.11%	0.3570	6.38%	0.3587	5.93%
7	0.3695	9.60%	0.3704	9.39%	0.3704	9.39%	0.3721	8.96%
8	0.3392	6.04%	0.3410	6.60%	0.3389	5.97%	0.3406	6.47%
9	0.3266	11.50%	0.3285	12.15%	0.3257	11.20%	0.3272	11.72%
10	0.3472	13.61%	0.3487	13.25%	0.3472	13.63%	0.3488	13.22%
11	0.3642	13.63%	0.3654	13.35%	0.3652	13.39%	0.3670	12.98%
12	0.3923	1.95%	0.3926	2.03%	0.3946	2.55%	0.3965	3.03%
13	0.4322	0.64%	0.4309	0.93%	0.4373	0.53%	0.4394	1.01%
14	0.3900	27.68%	0.3904	27.81%	0.3922	28.39%	0.3941	29.00%
15	0.3511	7.19%	0.3526	7.65%	0.351	7.26%	0.3530	7.76%
16	0.4233	2.69%	0.4224	2.89%	0.4277	1.68%	0.4297	1.21%
17	0.3567	6.44%	0.3580	6.11%	0.3570	6.38%	0.3587	5.93%
18	0.3165	10.72%	0.3186	10.14%	0.3152	11.08%	0.3167	10.66%
19	0.3814	3.90%	0.3821	/3.73%	0.3831	3.48%	0.3849	3.02%
20	0.3639	0.46%	0.3650	0.77%	0.3645	0.63%	0.3662	1.11%
21	0.3757	5.98%	0.3765	6.20%	0.3769	6.32%	0.3787	6.83%
22	0.3705	13.11%	0.3714	13.38%	0.3714	13.39%	0.3732	13.93%
23	0.3358	8.17%	0.3375	7.69%	0.3351	8.35%	0.3367	7.91%
24	0.3349	3.72%	0.3366	3.22%	0.3342	3.92%	0.3358	3.47%
25	0.3748	17.18%	0.3756	17.43%	0.3759	17.54%	0.3777	18.10%
26^*	0.3308		0.3327		0.3301		0.3316
27^*	0.3979		0.3980		0.4004		0.4023
28^*	0.4272		0.4262		0.4320		0.4341
29^*	0.4105		0.4101		0.4141		0.4160
30^*	0.4040		0.4039		0.4071		0.4090

5.4 某城市SO₂的NV-PPR模型的计算输出

与基于NV-FNN预测模型完全类似, 将建模样本1~25组成的100个训练样本规范值分别带入NV-PPR(2)(式(9))和NV-PPR(3)(式(10))模型, 用免疫进化算法对参数矩阵α和β反复迭代优化, 当优化目标函数式(13)分别满足minQ= 和minQ=时, 停止迭代, 分别得到优化好的NV-PPR(2)和NV-PPR(3)模型的参数矩阵元α_uj和β_u(u=1, 2;j=1, 2或j=1, 2, 3), 从而得到NV-PPR(2)和NV-PPR(3)模型的输出式, 分别如式(60)和(61)所示.

(60)

(61)

由式(60)和式(61)计算得到NV-PPR两种结构模型的建模样本1~25的拟合输出值及其拟合相对误差绝对值、检测样本26^*~30^*的模型计算输出值, 见表 4.

5.5 两种预测模型的精度检验

由式(28)计算出NV-FNN和NV-PPR两类预测模型的两种不同结构的F统计值分别为F(7.55)、F(7.31)和F(8.03)、F(8.09).模型的F值均大于F_0.01(4.18), 表明模型精度检验合格, 预测结果具有可信度.

5.6 预测样本模型输出的误差修正及修正后的SO₂浓度预测值

从表 4可知, 与26^*号检测样本的NV-FNN和NV-PPR两种模型输出相似的皆为23号建模样本; 与27^*号检测样本的NV-FNN两种结构模型输出相似的为12号与19号2个建模样本, 而与27^*号检测样本的NV-PPR两种结模型输出相似的为12、14、16、19号4个建模样本; 与28^*号检测样本的NV-FNN和NV-PPR两种模型输出相似的皆为12、13、14、16号4个建模样本; 与29^*号检测样本的NV-FNN和NV-PPR两种模型输出相似的皆为12号和16号2个建模样本; 与30^*号检测样本的NV-FNN和NV-PPR两种模型输出相似的皆为12、16、19、25号4个建模样本, 用式(14)和式(15)进行误差修正后的5个检测样本SO₂的NV-FNN和NV-PPR两种模型的两种不同结构预测输出值Y_x′, 如表 5所示.再由式(2)和式(57)的逆运算, 计算出两种模型的两种不同结构对5个检测样本的SO₂浓度预测值c_yi, 亦见表 5.

表 5 5个检测样本的两类预测模型的误差修正后的模型输出值和SO₂浓度预测值 Table 5 The model′s output values after error correction and the predictive values of SO₂ concentration of two class prediction models for 5 detection samples

5.7 预测结果的分析与比较 5.7.1 多种预测模型的实际预测值的相对误差及比较

5个检测样本的实际预测值与真实(测定)值之间的相对误差R_xz(绝对值)及其平均值和最大相对误差(绝对值)如表 6所示.为了比较, 表 6中亦分别列出了用笔者提出的NV-SVR模型(李祚泳等, 2018)对该5个检测样本的预测的相对误差绝对值及其平均值和最大相对误差绝对值.此外, 表 6中还列出用传统的SVR模型和多个文献中用BP网络(刘永等, 2004)、PPR(彭荔红等, 2002)、模糊识别(熊德琪等, 1993)、组合算子(姜庆华, 2006)及多元回归(姜庆华, 2006)等传统的模型与方法, 对该5个检测样本预测的相对误差绝对值R_xc及其平均值和最大相对误差绝对值.从表 5和表 6可见, 对同一个检测样本, 不仅基于规范变换的同类模型的两种不同结构的预测值及其相对误差几乎完全相同, 而且基于规范变换的3类不同预测模型的预测值及其相对误差也几乎完全相同或彼此相差甚小, 表明模型不但预测精度高, 而且结果稳定; 对多个样本预测的相对误差平均值及最大相对误差也有类似的结果.从表 6还可见, NV-FNN、NV-PPR和NV-SVR 3类预测模型对5个检测样本预测的相对误差绝对值的平均值和最大相对误差绝对值都远小于6种传统模型的预测结果.

表 6 5个检测样本的多种预测模型的预测相对误差的绝对值及其平均值和最大值 Table 6 The relative error absolute values and their average values and the maximal values of multiple prediction models for 5 detection samples

预测样本	基于规范变换的3种预测模型的预测相对误差的绝对值R_xz及其平均值和最大值
预测样本	NV-FNN(2)	NV-FNN(3)	NV-PPR(2)	NV-PPR(3)	NV-SVR(2)	NV-SVR(3)
26^*	3.57%	3.57%	3.57%	3.57%	3.57%	3.57%
27^*	0.67%	1.11%	0.22%	2.22%	2.22%	2.22%
28^*	4.11%	4.11%	2.74%	2.74%	2.74%	2.74%
29^*	2.56%	2.56%	2.56%	2.56%	2.56%	1.28%
30^*	2.02%	2.02%	2.02%	2.02%	5.05%	2.02%
平均值	2.59%	2.67%	2.18%	2.62%	3.23%	2.37%
最大值	4.11%	4.11%	3.57%	3.57%	5.05%	3.57%

预测样本	传统的6种预测模型的预测相对误差的绝对值R_xc及其平均值和最大值
预测样本	BP神经网络	传统PPR	传统SVR	模糊识别	组合算子	多元回归
26^*	56.07%	17.86%	28.57%	32.14%	14.29%	17.86%
27^*	37.56%	6.67%	6.67%	24.44%	22.22%	20.00%
28^*	9.18%	27.40%	10.96%	21.92%	4.11%	27.40%
29^*	17.82%	8.97%	37.18%	5.13%	12.82%	60.26%
30^*	7.98%	10.10%	27.27%	24.24%	38.38%	1.01%
平均值	25.72%	14.20%	22.13%	21.57%	18.36%	25.31%
最大值	56.07%	27.40%	37.18%	32.14%	38.38%	60.26%

5.7.2 作误差修正和不作误差修正的预测值的理论(估计)相对误差与实际相对误差比较

对每个预测样本, 由误差修正公式修正后的模型输出值y_xx′、相似样本的相似度K及相似样本的模型输出值y_s′和拟合相对误差r_s′, 用式(48)和式(50), 计算得到规范变换的3类预测模型对5个预测样本的用误差修正和不用误差修正的SO₂预测值的理论计算(估计)相对误差R_xx和R_x, 如表 7所示.其中, R_x是排除掉相似的异常样本后, 计算得到的相似样本的理论预测相对误差值的均值.表 7中还分别列出未进行误差修正的模型的预测相对误差(R_x)和传统的6种模型的预测相对误差(R_xc)与误差修正的模型预测值的实际相对误差(R_xz)的倍数比.比较表 6和表 7可见：5个预测样本的3类模型预测值的实际相对误差R_xz与用误差修正的理论计算(估计)相对误差R_xx皆非常接近; 而其预测精度比未进行误差修正的理论计算的预测精度提高了数倍到数十倍不等, 见表 7中R_x/R_xz; 与用传统的6种预测模型和方法的预测相对误差R_xc相比, 除30^*样本的SVR(3)模型外, 其预测精度也比用传统的6种预测模型和方法的预测精度提高了数倍到数十倍, 亦见表 7中R_xc/R_xz.从而证实了4.3.2节误差修正公式修正后的预测模型的预测精度分析及比较一节中的理论分析和公式推导结果(尤其是式(48)和式(50))的正确性和合理性.从表 7还可以得出：误差修正后的预测值的实际相对误差R_xz与未进行误差修正的预测相对误差R_x相比：当R_x>50%时, R_xz多数会比R_x缩小15-30倍, 即模型预测精度会提高15~30倍不等, 平均提高约25倍; 当20% < R_x≤ 50%时, R_xz多数会缩小10~15倍, 即模型预测精度会提高10~15倍不等, 平均提高约12倍; 当0% < R_x≤20%时, R_xz多数会缩小4~10倍, 即模型预测精度会提高4~10倍不等, 平均提高约5~6倍.由于R_x是预测模型的“外延性(泛化性能)”或“过拟合”的度量指标.可见, 不论模型的“外延性”优劣或“过拟合”程度如何, 用误差修正公式修正后的样本预测值的实际相对误差值R_xz大小相差不大, 多数都能控制在R_xz < 5%范围内, 很少有例外, 即误差修正后的模型的“外延性”变好, “过拟合”程度减弱, 见表 6.因此, 对“外延性”和“过拟合”不同的样本, 用误差修正公式修正后的的预测结果都十分精准、稳定、可靠.基于规范变换与误差修正的两种不同结构的3类预测模型与6种传统的预测模型对5个预测样本预测值的相对误差处于不同误差区间的百分比, 如表 8所示.从表 8可见：前者的相对误差在5%以内占97%, 所有相对误差都在10%以内; 后者的相对误差在5%以内仅占7%, 相对误差在10%以内仅占20%;相对误差在20%以内也只占50%, 而相对误差>20%的却占了50%.

表 7 误差修正模型的R_xz分别与未误差修正模型的R_x和6种传统模型的R_xc的比较 Table 7 Comparisons of R_xz with R_x of non-error correction model and R_xc of six traditional models

样本	模型	R_xx	R_x	R_x/ R_xz(倍)	R_xc/ R_xz(倍)
26^*	FNN(2)	3.30%	54.05%	15.14	15.71
	FNN(3)	2.90%	51.17%	14.33	5.00
	PPR(2)	3.40%	55.13%	15.44	8.00
	PPR(3)	3.02%	52.46%	14.69	9.00
	SVR(2)	2.29%	42.06%	11.78	4.00
	SVR(3)	1.61%	39.06%	10.94	5.00
27^*	FNN(2)	0.27%	21.80%	32.54	26.08
	FNN(3)	0.26%	21.54%	19.41	4.63
	PPR(2)	1.17%	19.60%	89.09	4.63
	PPR(3)	0.99%	18.55%	8.36	16.97
	SVR(2)	1.11%	25.45%	11.46	15.43
	SVR(3)	2.44%	31.99%	14.41	13.89
28^*	FNN(2)	1.74%	14.03%	3.41	2.87
	FNN(3)	1.73%	15.60%	3.80	8.56
	PPR(2)	1.82%	12.40%	4.53	3.43
28^*	PPR(3)	1.72%	13 67%	4.99	6.85
	SVR(2)	1.35%	37.96%	13.85	1.28
	SVR(3)	1.49%	24.25%	8.85	8.56
29^*	FNN(2)	0.61%	18.36%	7.17	7.58
	FNN(3)	0.62%	19.48%	7.61	3.82
	PPR(2)	0.63%	16.55%	6.46	15.82
	PPR(3)	0.60%	16.49%	6.44	2.18
	SVR(2)	6.20%	65.44%	25.56	5.46
	SVR(3)	5.62%	81.13%	63.38	25.64
30^*	FNN(2)	3.93%	21.56%	10.67	3.17
	FNN(3)	3.90%	21.94%	10.86	4.00
	PPR(2)	3.79%	19.43%	9.62	10.82
	PPR(3)	3.71%	18.36%	9.09	9.62
	SVR(2)	4.29%	24.70%	4.89	15.23
	SVR(3)	4.15%	11.11%	5.50	0.40

表 8 3类误差修正预测模型的R_xz和6种传统预测模型的R_xc处于不同区间所占百分比 Table 8 The percentages of R_xz of three kinds of error correction prediction models and R_xc of 6 traditional prediction models in different intervals

6 模型的分析与比较(Analysis and comparisons of the model) 6.1 样本数量的有限性和样本质量对模型预测精度的影响

虽然从理论上讲, 只要有代表性的训练样本数足够多, 则智能预测模型(如BP、RBF、FNN、PPR、SVR等)都能以任意精度逼近任意函数.不过, 实际问题的样本数总是有限的(即不完备性), 而且, 在有限样本中, 往往还存在若干质量差的样本或异常样本.基于统计理论的学习、模拟来发掘样本共同特性建立的智能预测模型对具有普遍规律的多数样本是适用的和有效的, 但对于质量差的样本或具有特殊规律的异常样本, 则无论是模型的拟合误差还是预测误差都会很大.此外, 某些情况下, 即使模型对训练样本的拟合精度高, 但对于在训练样本集中没有相同或相似样本的那些预测样本, 则预测误差也会很大, 这就是通常所说的“过拟合”.还有, 若模型优化采用的某些优化算法本身存在的局限, 使收敛过程陷入了局部极值, 得不到全局最优, 出现了“欠拟合”, 则模型的拟合和预测误差都会很大.这种由样本的不完备性和样本质量差导致模型预测精度低, 传统预测模型和方法是无法避免的.虽然这些影响因素在NV-FNN、NV-PPR和NV-SVR模型中也同样存在, 但通过采用相似样本误差修正法, 对预测(或检测)样本的模型计算输出值进行修正后, 再计算出预测样本的实际预测值, 可有效消除或至少削弱这些因素对模型预测精度的影响, 此种修正法对提高“过拟合”样本和异常样本的预测精度尤为显著.

6.2 使用的数学方法存在的局限性对模型预测精度的影响

一个理想而又实用的预测模型需满足预测模型结构的复杂性与实际问题的复杂性相匹配.因此, 对训练样本数有限, 而因子数目较多的复杂预测问题, 传统的预测模型通常采用主分量分析法、相关分析法或逐步回归法来减少因子个数(Jubas, 2008), 达到简化模型结构和提高学习效率的目的.但无论用何种方法, 不仅复杂, 而且皆会丢失建模样本部分信息, 致使模型失真, 导致模型预测结果大多精度不高和不同样本的预测的误差差异大(外延性和稳定性差).而基于规范变换的NV-FNN、NV-PPR和NV-SVR预测模型, 仅采用对因子数据进行规范变换的降维处理, 既简化了模型结构, 提高了模型的学习效率; 又因为样本的全部信息都充分得到利用, 无任何信息丢失, 使建立的模型更接近真实, 提高了模型的可靠性和稳定性.

6.3 基于规范变换的预测模型与传统的预测模型的比较

基于规范变换的3种预测模型与传统的3种预测模型的性能比较见表 9.

表 9 规范变换的3种预测模型与传统的3种预测模型的性能比较 Table 9 The performance comparisons between the three prediction models of normal transformation and the traditional three prediction models

传统的3种预测模型	规范变换的3种预测模型
BP网络具有自组织、自学习、自适应、容错性和非线性映射能力; 但初始权值和阈值的选取不当易导致学习效率低、泛化能力差(过拟合); 误差反向传播采用最速下降法易导致陷入局部极值, 出现“欠拟合”; 采用单极性sigmoid函数作激活函数对应于0~无穷大输入, 其输出的变化范围为0.5~1, 致使权值调整量较小, 网络功能不强; 还存在模型结构(隐层节点数)随影响因子数m不同, 而难以确定的问题, 因而BP模型的结构不能普适、规范和统一.	NV-FNN的隐层节点采用双极性sigmoid函数作激活函数, 对应于0~无穷大输入, 其输出的变化范围为0~1, 引起权值调整量增大, 不仅使网络功能更强大, 而且能加速收敛.此外, 网络输出则采用对隐层节点输出的线性求和计算, 因而信息从输入层输入到输出层输出仍是非线性的.因此, NV-FNN既能保持较强的非线性映射能力, 又比BP网络结构简化.模型的结构与影响因子数目m无关, 因而模型的结构变得简洁、普适、规范和统一.
传统的PPR预测模型用一系列岭函数的和去逼近回归函数, 适用于非正态、非线性高维数据的建模.但当因子数较多时, 传统的SMART求解法和参数矩阵优化算法不仅存在“维数灾难”, 而且编程和计算难度皆较大; PPR预测模型岭函数个数的选取严重影响模型的优化效率和优化效果; 而且也不能建立具有普适、规范、统一形式的PPR预测模型.	NV-PPR预测模型不仅保留了参数矩阵优化求解法直观和易于编程实现的优点, 而且, 由于对影响因子进行规范变换, 使规范变换后的所有影响因子皆“等效”于同一个规范影响因子, 因而对任意多个影响因子, 皆只需建立适用于2个岭函数的2个或3个规范影响因子的PPR预测模型即可, 不存在“维数灾难”, 模型变得更加简洁、普适、规范和统一.
传统的SVR模型具有理论全局最优、避免维数灾难、防止过拟合、克服局部极值及特别适用于小样本容量建模等方面的优势, 但其性能受惩罚因子C、核函数参数σ和不敏感系数e 3个参数的影响, 而它们的选取尚无可靠的理论依据.此外, 传统的SVR模型用于大样本、多因子预测建模, 学习效率低, 收敛速度慢, 求解精度低, 而且模型的结构(形式)不能普适、规范和统一.	NV-SVR预测模型除同样具有传统的SVR模型的优势外, 预测模型的结构与影响因子数目和建模样本数目的多少都无关, 皆只需对“等效”规范因子, 构建结构为2个或3个支持向量的两种简单结构的预测模型; 此外, 模型只需确定b和σ两个参数即可, 编程和计算亦得到简化, 提高了模型学习效率和求解精度, 因而预测模型的结构简单、普适、规范和统一

7 结论(Conclusions)

1) 对预测变量及其影响因子进行规范变换使预测模型的结构变得简化, 普适、规范和统一, 不仅减小了模型结构的复杂性对预测精度的影响, 而且极大地提高了模型的学习效率和稳定性.

2) 用相似样本的误差修正法对预测样本的模型输出进行误差修正, 可有效消除或削弱样本数量的有限性、样本质量的差异性和算法的局限性等因素对模型预测精度的影响, 能极大地提高模型对预测样本(尤其是“过拟合”样本和异常样本)的预测精度.

3) 规范变换和相似样本的误差修正法相结合用于FNN和PPR预测建模的思想和方法同样可用于BP网络、RBF神经网络、概率神经网络、模糊神经网络、小波神经网络、多元线性回归及灰色GM等传统的预测模型结构的简化和预测效果的改善.

致谢(Acknowledgements): 感谢四川师范大学伍绍贵副教授(博士)对修改英文摘要提供的协助

参考文献

Chen S Y, Ji H L. 2005. Fuzzy optimization neural network approach for ice forecast in the Inner Mongolia reach of the Yellow River[J]. Hydrological Sciences Journal, 50(2): 319–329. DOI:10.1623/hysj.50.2.319.61793

Chen C I. 2008. Application of the novel nonlinear grey Bernoulli model for forecasting unemployment rate[J]. Chaos, Solitons & Fractals, 37(1): 278–287.

Chen S Y, Xue Z C, Li M. 2013. Variable sets principle and method for flood classification[J]. Science China Technological Sciences, 56(9): 2343–2348. DOI:10.1007/s11431-013-5304-4

Comrie A C. 2013. Comparing neural networks and regression models for ozone forecasting[J]. Journal of the Air & Water Mangement Association, 47(6): 653–663.

Diaz Robles L A, Ortega J C, Fu J S, et al. 2008. A hybrid ARIMA and artificial neural networks model to forecast particulate matter in urban areas: The case of Temuco Chile[J]. Atmospheric Environment, 42(35): 8331–8340. DOI:10.1016/j.atmosenv.2008.07.020

笪英云, 汪晓东, 赵永刚, 等. 2015. 基于关联向量机回归的水值预测模型[J]. 环境科学学报, 2015, 35(11): 3730–3735.

Grivas G, Chaloulakon A. 2006. Artificial neural network models for prediction of PM₁₀ hourly concentrations, in the Greater Area of Athens, Greece[J]. Atmospheric Environment, 40(7): 1216–1229. DOI:10.1016/j.atmosenv.2005.10.036

Ghose D K, Panda S S. 2010. Prediction of water table depth in western region, Orissa using BPNN and RBFN neural networks[J]. Journal of Hydrology, 39(4): 296–304.

黄思, 唐晓, 徐文帅, 等. 2015. 利用多模式集合和多元线性回归改进北京PM₁₀预报[J]. 环境科学学报, 2015, 35(1): 56–64.

Jubas I, Makra L, Toth B. 2008. Forecasting of traffic origin NO and NO₂ concentrations by support vector machines and neural networks using principal component analysis[J]. Simulation Modelling Prictice and Theory, 16(9): 1488–1502. DOI:10.1016/j.simpat.2008.08.006

姜庆华. 2006. 大气污染预测的参数化组合算子方法[J]. 山东大学学报(理学版), 2006, 41(4): 76–79. DOI:10.3969/j.issn.1671-9352.2006.04.020

金菊良, 魏一鸣, 王文圣. 2009. 基于集对分析的水资源相似预测模型[J]. 水力发电学报, 2009, 28(1): 72–77.

Lange I A, Steel E A. 2007. Using wavelet analysis to detect changes in water temperature regimes at multiples scales:Effects of multi-purpose dams in the Willamette River basin[J]. River Research and Application, 23(4): 351–359. DOI:10.1002/(ISSN)1535-1467

李祚泳, 汪嘉杨, 金相灿, 等. 2007. 基于进化算法的湖泊富营养化投影寻踪回归预测模型[J]. 四川大学学报(工程科学版), 2007, 39(2): 1–8. DOI:10.3969/j.issn.1009-3087.2007.02.001

李祚泳, 徐源蔚, 汪嘉杨, 等. 2015. 基于前向神经网络的广义环境系统评价普适模型[J]. 环境科学学报, 2015, 35(9): 2996–3005.

李祚泳, 汪嘉杨, 徐源蔚. 2018. 基于规范变换与误差修正的回归支持向量机的环境系统预测[J]. 环境科学学报, 2018, 38(3): 1235–1244.

刘永, 郭怀成. 2004. 城市大气污染物浓度预测方法研究[J]. 安全与环境学报, 2004, 4(4): 59–62.

Moazami S, Noori R, Amiri B J, et al. 2016. Reliable prediction of carbon monoxide using development support vector machine[J]. Atmospheric Pollution Research, 7(3): 412–418. DOI:10.1016/j.apr.2015.10.022

Noori R, Barbassi A, Ashrafi K, et al. 2012. Active and online prediction of BOD₅ in river systems using reduced-order support vector machine[J]. Environmental Earth Sciences, 67(1): 141–149. DOI:10.1007/s12665-011-1487-9

倪长健, 丁晶, 李祚泳. 2003. 免疫进化算法[J]. 西南交通大学学报, 2003, 38(1): 87–91. DOI:10.3969/j.issn.0258-2724.2003.01.020

Ortiz Garcia E G, Salcedo Sanz S, Perez Bellido A M, et al. 2010. Predic of hourly O₃ concentrations using support vector regression algorithms[J]. Atmospheric Environment, 44(35): 4481–4488. DOI:10.1016/j.atmosenv.2010.07.024

Park Y, Cho K H, Park J, et al. 2015. Development of early-warning protocol for predicting chlorophyll-a concentration using machine learning models in freshwater and estuarine reservois, Korea[J]. Science of the Total Environment, 502: 31–41. DOI:10.1016/j.scitotenv.2014.09.005

Paschalidou A K, Karakitsios S, Kleanthous S, et al. 2011. Forecasting hourly PM₁₀ concentration in Cyprus through artificial neural networks and multiple regression models implications to local environmental management[J]. Environmental Science and Pollution Research, 18(2): 316–327. DOI:10.1007/s11356-010-0375-2

彭荔红, 李祚泳, 郑文教, 等. 2002. 环境污染的投影寻踪回归预测模型[J]. 厦门大学学报(自然科学版), 2002, 41(1): 79–83. DOI:10.3321/j.issn:0438-0479.2002.01.018

Qi X N, Liu Z G, Li D D. 2008. Prediction of the performation of a shower cooling tower based on projection pursuit regression[J]. Application Thermal Engineering, 28(10): 1031–1038.

Shaban K B, Kadri A, Rezk E, et al. 2016. Urban air pollution monitoring system with forecasting models[J]. IEEE Sensors Journal, 16(8): 2598–2606. DOI:10.1109/JSEN.2016.2514378

孙宝磊, 孙蒿, 张朝能, 等. 2017. 基于BP神经网络的大气污染物浓度预测[J]. 环境科学学报, 2017, 37(5): 1864–1871.

Wang X G, Tang Z, Tamura H, et al. 2004. An improved bad - propagation algorithm to avoid the local minima problem[J]. Neuro Computing, 56(1): 455–460.

王保良, 范昊, 冀海峰, 等. 2016. 基于分段线性表示的最近邻的水质预测方法[J]. 环境工程学报, 2016, 10(2): 1005–1009.

肖鸣, 李卫明, 刘德富, 等. 2017. 基于多重优化灰色模型的三峡库区香溪河支流回水区水华变化趋势预测研究[J]. 环境科学学报, 2017, 37(3): 1153–1161.

熊德琪, 陈守煜. 1993. 城市大气污染物浓度预测模糊识别理论与模型[J]. 环境科学学报, 1993, 13(4): 482–490.

杨云, 付彦丽. 2016. 关于空气中PM_2.5质量浓度预测研究[J]. 计算机仿真, 2016, 33(3): 413–418. DOI:10.3969/j.issn.1006-9348.2016.03.092

邹志红, 王乐娟. 2009. 湖泊富营养化趋势的灰色马尔柯夫预测[J]. 环境科学学报, 2009, 29(2): 427–432. DOI:10.3321/j.issn:0253-2468.2009.02.029

郑彤, 陈春云编. 2003. 环境系统数学模型[M]. 北京: 化学工业出版社: 31.


环境科学学报 2019, Vol. 39 Issue (6): 2053-2070