mse训练误差很大怎么办(如何计算均方误差)

摘 要:自然通风建筑室内温度受气象因素、建筑材料等多种非线性因素的影响,应用机理建模难度较大且计算复杂,很难得到精确的数学模型。利用神经网络不依赖模型和收敛速度快的优势和特性,可以很好地解决该问题。本文对经典的BP(Back Propagation)和RBF(Radial-based Function Method)神经网络建模方法进行对比研究,并对室内温度进行短期的预测。结果表明,在两种神经网络未经过优化的情况下,RBF神经网络在室内温度预测的应用要优于BP神经网络,基于RBF神经网络的室内温度预测方法在工程上有广阔的应用前景。

0 引言

我国是能源消耗大国,建筑供热能耗约占社会总资源消耗的四分之一,且随着大型、高能耗建筑的不断新建,这一比例还在逐年升高。为了实现建筑节能的目标,必须对建筑室内环境进行准确建模。建筑能量系统是一个非线性、多变量、分布式的复杂系统,在自然通风的条件下,室外气象因素对室内温度的影响是非线性的,这使得求解变得复杂[1]。神经网络为解决上述问题提供了一个可行的方案。人工神经网络是从微观结构以及功能上对人脑神经系统进行模拟而建立起来的一类计算模型,能够模拟人的部分形象思维能力,非常适合非线性预测[2]。目前在工业领域,BP(Back Propagation)和RBF(Radial-based Function Method)神经网络应用比较广泛,但在供热系统中的应用还处于起步阶段。因此,本文对这两种方法分别进行应用,继而选择出具有良好应用价值的方法。

1 神经网络的基本原理

1.1 RBF神经网络的基本原理

1988年,Moody和Darken提出了一种神经网络结构,即RBF神经网络,它属于前向型神经网络,一个典型的RBF网络拓扑结构如图1所示[3]。

mse训练误差很大怎么办(如何计算均方误差)

隐层和输出层的输入、输出关系分别为:

其中a1、a2分别为隐层和输出层的输出向量;c、σ分别为高斯基函数的中心和宽度;||·||为欧式范数;W为隐层到输出层的权值矩阵;b为输出层的阈值向量。由式(1)可知,当输入信号靠近基函数中心时隐层单元产生较大输出。

1.2 BP神经网络的基本原理

mse训练误差很大怎么办(如何计算均方误差)

BP神经网络是一种多层的前向型神经网络。在BP网络中信号是前向传播的,而误差是反向传播的。一个典型的具有一个隐含层的反向传播网络拓扑图如图2所示。图2中,X、Y分别为网络输入输出向量,W1为输入层和隐层的权值矩阵,W2为隐层和输出层的权值矩阵,f(X)为隐层激活函数,一般为sigmoid函数,隐层和输出层的激活函数为purlin线性函数,隐层和输出层的输入、输出关系分别为:

式中,n1,n2分别为隐层和输出层的输入向量;a1、a2分别为隐层和输出层的输出向量;b1,b2分别为隐层和输出层的阈值向量。

BP神经网络采用梯度下降法求连接权值及阈值的变化:

式中,Ek为误差函数;η为学习效率;W(k+1)、W(k)分别为第k+1和第k步的权值矩阵;b(k+1)和b(k)分别为第k+1和第k步的阈值向量。学习过程是一个反复迭代的过程,当误差达到预设误差精度或最大训练次数时,训练中止,存储权值和阈值[4]。

2 神经网络的建立

对于自然通风的建筑而言,着重分析室内没有供热及其他设备散热以及人体散热的情况下的室内温度。在这种情况下,室内温度因受到室外气象条件的影响,随着室外温度周期性的变化而变化,但是由于建筑围护结构等蓄热质的存在,室内温度的波动相比室外温度存在一个峰值上的衰减和延迟,其影响因素包括建筑材料、建筑形式、自然通风模式等。在特定的建筑中,建筑蓄热质可认为是不变的,而气象因素呈非线性变化。气象因素包含了室外温度、太阳辐射强度以及风速等。因此,将室外温度、太阳辐射、风速作为输入变量,考虑到上述存在的延迟,将采集时刻也包含在内,室内温度作为输出变量。对于RBF与BP神经网络而言,为了使样本更适合网络学习,防止计算过程中出现个别数据溢出的不良现象,需要将各输入和输出向量做数据归一化处理[5]:

网络学习结束后还需要将得到的0~1之间的预测值反归一化,这样就还原成实际值了。

一个具有3层机构的BP神经网络能够拟合任意非线性函数,且增加层数并不一定增加网络的精度,故选取3层BP神经网络。学习效率定为0.01,误差精度为10-3,最大训练次数100。隐含层及神经元的数量的选取对构建BP网络很重要,目前虽没有一个权威的结论,但构建过程仍需要先验知识的辅助。Norihito Kashiwagi等人的研究指出,有限数量的隐含层足以解决非线性和滞后问题[6]。张吉礼在研究了Kolmogorov定理后指出,隐含层节点数应该为2N+1(N为输入层的节点数)[7]。彭岚等人发现,第一、第二隐层的最佳节点数应为3∶1[8]。Lippman指出,第二隐层节点数应为2M(M为输出层节点数)[9]。根据选择输入参数,输入层共有4个节点,隐含层设置为10个节点,输出层为1。

在RBF网络中样本确定后需要确定的参数只有误差精度和扩展常数(spread)。spread为高斯基函数的分布密度,spread的值越大,需要的神经元越少。隐含层神经元个数的确定同样是一个关键问题,传统的做法是令其等于输入向量的个数。本文选取误差精度为10-3,spread值经过多次调试确定为0.009,建立并训练网络。

3 实验及结果分析

本文以某高校一幢办公楼为例,室内温度测试点选在一间南向的房屋内,室外气象条件由校园气象台提供,分别采集室外温度、太阳辐射强度以及风速,这些数据每隔10 min进行一次存储。选取5月28日~6月9日中的有效数据1 440条。将这些数据平均分为A、B两组,一组进行训练另一组进行测试,如表1和表2所示。

mse训练误差很大怎么办(如何计算均方误差)

对于RBF与BP神经网络,首先用A组数据的时间、室外温度、辐射强度、风速作为输入量,A组的室内温度作为目标值进行训练,训练结束后获得建筑室内温度模型。然后用B组的时间、室外温度、辐射强度、风速作为输入量,模型会输出预测的结果。最后,将模型输出的预测结果与实际室内温度值进行对比,得出预测效果。

mse训练误差很大怎么办(如何计算均方误差)

mse训练误差很大怎么办(如何计算均方误差)

图3为BP神经网络训练后得到的预测值与实际值曲线图,图4为利用RBF神经网络训练后得到的预测值与实际值曲线图,两者都比较好地实现了对建筑室内温度的建模和预测。在神经网络的初期网络输出的温度与实际温度存在较大差异,但是随着学习训练的进行,网络输出温度逐渐趋于实际温度,误差有明显的减小趋势。从图5和图6可见,BP预测绝对误差最大为4,相对误差最大不超过0.2;从图7与图8可以看到,RBF神经网络预测的最大绝对误差为3,相对误差也不超过 0.15,且两种预测方法训练初期绝对误差和相对误差都较大,训练后期误差有减少的趋势。从绝对误差与相对误差的曲线来看,初期RBF的绝对误差与相对误差略小于BP神经网络,而在后期的训练过程中BP神经网络绝对误差与相对误差逐渐比RBF小。对比两者的均方误差(MSE)可得,BP神经网络均方误差为0.43,而RBF的均方误差为0.48,略高于BP神经网络。

可以看出,在预测精确度上,BP神经网络与RBF神经网络比较接近,二者都满足建筑室内温度环境的预测需要。总体来看BP神经网络的精确度要略微高一些。但是,对于RBF网络,隐层神经元的最优个数可以在训练中获得,而BP网络要求隐层神经元预先设定,并且最优个数很难确定,同时,RBF每次训练的结果都很稳定,BP神经网络每次训练结果并不同,有时会产生很大偏差,所以在网络构建方面RBF神经网络更简单、方便。

4 结论及展望

本文提出将神经网络运用于自然通风建筑的室内温度建模及预测。实验结果表明,利用室外气象因素及时间序列对室内温度进行神经网络的建模是可行的且效果良好。在神经网络的构建方面,RBF神经网络的工作量要比BP网络小,收敛速度快且泛化能力强,更适用于自然通风建筑的室内温度建模预测。下一步将搭建Web网络实验平台,利用这一神经网络模型对自然通风建筑的建筑供热能耗进行分析和预测,为建筑供热节能奠定基础。

参考文献

[1] 李康吉.建筑室内环境建模、控制与优化及能耗预测[D].杭州:浙江大学,2013.

[2] 周敏,李世玲.广义回归神经网络在非线性系统建模中的应用[J].计算机测量与控制,2007,15(9):1189-1191.

[3] 闻新,周露,王丹力,等.Matlab神经网络应用设计[M].北京:北京科学出版社,2001.

[4] 魏海坤,徐嗣新,宋文忠.神经网络的泛化方法[J].自动化学报,2001,27(6):806-813.

[5] 罗新,牛海清,林浩然,等.BP和RBF神经网络在气隙击穿电压预测中的应用和对比研究[J].电工电能新技术,2013,32(3):110-114.

[6] KASHIWAGI N, TOBI T. Heating and cooling load prediction using neural network system[C]. Proceeding of 1993 International Joint Conference on Neural Networks, Nagoya,Japan, 1993:939-942.

[7] 张吉礼.神经网络控制原理与工程应用[M].哈尔滨:哈尔滨工业大学出版社,2004.

[8] 彭岚,何大鹏,李友荣.基于BP神经网络的工业锅炉房负荷预测[J].工业加热,2006,35(5):31-33.

[9] LIPPMAN R P. An introduction to computing with neutral networks[J]. IEEE ASSP Magazine,1987(4):4-32.

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 2022年9月5日 17:13
下一篇 2022年9月5日 17:15

相关推荐

发表回复

登录后才能评论