Air Quality Prediction Model Based on LSTM
赵义金 ZHAO Yi-jin
(中国人民大学信息学院,北京 100872)
(School of Information,Renmin University of China,Beijing 100872,China)
摘要:随着社会对空气污染问题关注的不断提升,空气质量预测研究成为被讨论的一个热点问题。本文提出一种基于长短期记忆网络LSTM的空气质量预测模型。采用沈阳市及其周边地区11个监测站的空气质量数据和气象条件数据进行模型训练和预测检验。从时间窗口与站点地理位置两个维度进行实验,并与差分整合平均自回归模型ARIMA与支持向量机SVM模型进行对比实验。实验结果表明,无论是在哪个维度下,我们提出的模型在准确率上优于其他方法,其预测误差RMSE有明显的下降。
Abstract: With the continuous improvement of social air pollution, air quality prediction has become a hot topic. An air quality prediction model based on LSTM is proposed in this article. The air quality data and meteorological condition data of 11 monitoring stations in Shenyang and its surrounding areas are used to train and test the model. The experiment is conducted from two dimensions of time window and site location and the experimental results are compared with ARIMA and SVM. The experimental results show no matter in which dimension, the accuracy of our model is better than other methods, and its prediction error RMSE is obviously reduced.
关键词: 预测;PM2.5;长短期记忆网络;污染源;神经网络
Key words: prediction;PM2.5;LSTM;pollution sources;neural network
中图分类号:X324 文献标识码:A 文章编号:1006-4311(2021)01-0235-02
0 引言
随着近年来社会对空气污染问题关注度不断增强,空气质量预测问题成为当下讨论的热点问题,受到了广泛的研究。众所周知,城市空气质量预测,是一种比较典型的时间序列预测问题,一般可以采用统计学模型。然而,深入研究发现,空气中的污染物浓度受到气象条件、城市地理位置、人类社会活动等多种因素影响,很难直接建立相应的统计学模型,进行准确的数值预测。目前,随着机器学习和深度学习方法的普及,以人工神经网络为代表的机器学习目前是空气质量预测领域最高效以及被认可度最高的研究方法。人工神经网络具有广泛的适应、学习及应用能力,在数值预测领域有广泛的应用。
国家近年来逐步加强了对空气污染物排放的控制,我国大部分地区日均空气质量已经有了明显的改善。与此同时,因为雾霾问题与每个人的健康状况息息相关,社会也逐渐增强了空气质量意识。在这种背景下,空气质量预测的核心问题逐步从高等级、重污染天气的预报及时性与准确性,转向了低等级空气质量较好情况下的精确的PM2.5浓度预测。
我们选取的模型首先要保证预测准确性,对不同应用场景、在不同条件下我们的模型都应具备较好的预测效果。空气质量预测,通常可获取的数据无外乎是空气污染物、气象条件等历史数据。而对于任何一个空气质量监测站周边的经济发展情况和人类活动数据往往无法获取,从而成为了影响预测效果的隐变量。一个良好的预测模型应该尽量减少这些因素的影响,即在使用相同的输入特征预测不同地点的空气质量时,仍然可以达到相对稳定的预测精度。
基于上述分析,本文提出的一种基于LSTM的空气质量预测模型,长短期记忆网络LSTM对于多维时间序列预测问题已被实验证明比传统的反向传播神经网络、支持向量机等经典算法模型更加有效,而且具有更强的泛化能力,特别适合解决空气质量预测问题。
本文将按如下的结构展开,第一节回顾了国内外空气质量预测的相关研究,以及LSTM在预测领域应用的文献综述;第二节介绍了长短期记忆网络LSTM预测模型;第三节从时间、空间、空气质量等级等不同维度,交叉验证了LSTM模型的有效性和效率;第四节总结了全文。
1 国内外研究现状
近年来,随着人类环保意识的不断增强以及科学技术水平的不断提高,国内外学者针对空气质量以及PM2.5的预测的课题进行了一系列的研究。国内外对PM2.5预测研究较早,早在20世纪70年代后期,美国等发达国家开始对各种空气污染物指数进行预报;我国在空气污染物监测及预报的研究起步较晚,1997年13个主要城市中开始空气质量周报制度。
近年来,国内外学者也针对数值模型在空气质量预测相关内容的应用进行了一系列研究,郎咸梅[1]等利用全球格点大气模式系统针对一些年份我国冬季平均气温异常的问题进行研究,研究结果表明该模式对中国东北地区等气温变化较大地区平均气温的预测准确度较高。Zarandi M.H等[2]建立了type-2型模糊逻辑系统,针对伊朗德黑兰CO浓度进行预测,对数据分析的相关参数进行建模,结果表明有较好的预测效果。付高平[3]采用区域多尺度CMAQ,结合了气象资料、污染源、地形地貌等数据模拟了成都地区的PM2.5浓度。Gibson[4]等根据PM2.5点源和线源的扩散机制,利用高斯烟羽扩散模型预测PM2.5浓度值。
2 模型介绍
长短期记忆网络LSTM,该模型引引入了遗忘门、输入门和输出门。增加了长短期记忆功能使得信息不再衰减,同时又解决了RNN存在的梯度消失和梯度爆炸问题,是解决时间序列预测问题的经典模型,其网络结构如图1所示。
一个LSTM单元有三个输入,分别是t时刻的输入xt,t-1时刻的长时记忆ct-1以及短时记忆ht-1;有三个输出,t时刻的输出yt,长时记忆ct和短时记忆ht。zf,zi,zo分别代表遗忘门、输入门和输出门的结果。
3 实证研究
3.1 数据获取
本文选取沈阳地区11个空气质量监测站,自2016年1月1日0∶00到2016年3月26日8:00每小时的各项气象数据及对应PM2.5浓度共22528组,删去其中信息残缺非常严重的107组数据,使用剩余22421组数据进行实验。从22421组数据中随机抽取20179组作为训练集,剩余2242组作为测试集。
3.2 实验设计及分析
为了验证模型的有效性,本文选取了差分整合平均自回归模型ARIMA与支持向量机SVM模型,基于前述的数据,进行实证对比研究。选取RMSE作为评价指标,RMSE是预测值与真实值的误差平方根的均值,计算公式如下:
■(1)
3.3 模型实验结果
3.3.1 基于不同时间窗口的浓度预测
空气质量指数的变化是随着一段时间内空气污染物的不断累积或消散而变化的,论文通过设置不同的时间窗口大小来进行对比试验。这里的时间窗口指的是根据多少小时的历史数据来预测当前的空气质量指数,假设时间窗口为6,那么利用六个小时的历史数据来预测当前的空气质量指数。针对不同的算法,本文分别将时间窗口设置为1、3、6,实验结果如表1所示。
通过实验结果,我们发现, LSTM模型相比于另外两个模型而言,不但将误差控制在较低范围内,同时随着时间序列的增加,PM2.5的浓度值预测也有明显的提升。就此我们得出结论,随着时间序列的增加,即用前N个小时的数据去预测第N+1个小时的数据,随着N的增加,预测效果也逐步提升,误差控制也控制在更小的范围内。
3.3.2 每个站点的数据
通过上述每个站点的实验结果,我们发现LSTM模型在新秀街、文化路、陵东街、森林路几个站点,对PM2.5值预测的准确率有很大提升,但是在沈辽西路、裕农路的准确率提升不是很明显。
4 总结
本文建立一个基于LSTM的空气质量预测模型,从时间窗口维度看,我们不难发现,随着时间窗口的不断增加,LSTM-全连接神经网络模型的预测效果有显著的提升。从对于监测站点维度,LSTM模型在预测PM2.5值时,准确度也有很大提升。
参考文献:
[1]郎咸梅,王会军,姜大膀.中国冬季气候可预测性的跨季度集合数值预测研究[J].科学通报,2003,48(15):1700-1704.
[2]Zarandi, M.H., Faraji, M.R., Karabasian, M.Interval type-2 fuzzy expert system for prediction of carbon monoxide concentration in mega-cities[J]. Applied Soft Computing, 2012, 12(1): 291-301.
[3]付高平.成都市微细颗粒物(PM2.5)形成机理及对人类健康危害研究[D].西南交通大学,2014.
[4]Gibson M D, Kundu S, Satish M. Dispersion model evaluation of PM2.5, NOX and SO2, from point and major line sources in Nova Scotia,Canada using AERMOD Gaussian plume air dispersion model[J].Atomospheric Pollution Research, 2013, 4(2):157-167. |