2)基于最大熵的坏数据分类模型。
由于人为因素或某些特殊原因存在,通常采样得到的异常数据将影响预测结果的精确度及可靠性。本文首先对样本历史数据进行了预处理,基于最大熵算法建立了坏数据分类模型,如图3所示。
完成了模型建立任务。
图3 基于最大熵的坏数据分类模型
Fig. 3 Bad data classification model based on maximum
entropy
Map 阶段:
?xq
?D={D1,D2,",Dn}
foreach Di
{foreach{xi∈Di}
{μj}←argmin{d(x,xi),j=1,2,",K}}Reduce 阶段:?xq
?map={μ1,μ2,",μn}foreach μi
{foreach{yi∈μi}
{βi}←argmin{d(xq,yi),i=1,2,",K},n=1,2,",K}基于混合高斯模型计算 k 个点的加权值 ωi?(x)=ω+ωa(x)+ωa(x)+"+ωa(x)f
11
22
nn
最大熵原理是在1950年由E. T. Jaynes提出的,其主要思想是:在用有限知识预测未知假设时,应该选取符合已知假设条件但熵值最大的概率分布。即在已知部分知识的前提下,关于未知分布最合理的推断就是符合已知知识的最不确定或最随机的推断。
在最大熵模型中,信息以特征的方式表达,其中特征为二值特征fi (x, y),若fi对模型有用,则构
??(x,y)的约束模型(模型期建一个能生成训练样本p望=经验期望):
图4 基于云计算的LWLR预测算法
Fig. 4 LWLR forecasting based on cloud computing
P={p|Ep(fi)=Ep2 负荷预测实验及结果分析 ??(fi),1≤i≤k} (6)
最大熵算法提出在与约束集合一致的模型中,选择具有最大熵的p*。在有用特征fi的基础上进行
2.1 负荷预测误差评测指标
由于电力负荷预测是通过历史数据对未来电
40 中 国 电 机 工 程 学 报 第35卷
力负荷的估算,因此预测值与实际值存在差距,产生电力负荷预测误差。产生误差的原因很多,归纳起来主要包括:1)数学模型的简化和忽略各种因素的关系;2)历史数据不够完整;3)参数选取不当造成误差。
本文采用的评测指标如下:
?(i)分别表示i时刻的实际负荷值和设y(i)和y预测值,则有:
绝对误差:
考虑了温度、湿度、工作日、节假日、季节等负荷影响因素对电力用户负荷波动的影响,通过计算与负荷的关联强度,为建立更加精确的负荷预测模型提供依据。
本文的数据表达为:负荷时间序列为X1, X2,???,
Xn;x1,i为负荷数据;x2,i为温度序列;x3,i为湿度序列;以此类推。 2.3 实验结果
1)并行局部加权线性回归算法与传统算法
?(i) (9) E=y(i)?y对比
从图5所示的结果可以看出,在小数据样本时,
相对误差:
两者之间的预测时间相差不大,相反,传统线性回?(i)1ny(i)?ye1=∑||×100% (10)
归方法所需要的时间略优于并行局部线性加权算ni=1y(i)
法,原因在于:并行局部线性加权算法在小样本集
式中e1为日平均误差。由于预测误差有正负,为了
下仍将数据分成若干个子样本集,不同数据子集之
避免正负相抵消,计算其平均数的时候取误差的绝
间的通讯代价增高反而影响预测速度;但随着样本
对值。
e2=100% (11)
时间/min
式中e2为均方根误差。均方根误差指标加强了数值大的误差的作用,提高了该指标的灵敏性。 2.2 实验数据
本文的数据来源为甘肃省某电网企业所采集的负荷数据和天气数据,训练数据范围为2011年
输入数据集大小/MB
11月24日至2011年11月30日的用电数据,每个设备的采样间隔周期为15 min,如表1所示。预测
图5 传统算法和并行算法所需时间对比 Fig. 5 Consume time contrast between the traditional
algorithm and the parallel algorithm
2011年12月1日的电力负荷,如表2所示。同时
表1 训练数据 Tab. 1 Training data
日期
小时
分钟
最高温度 最低温度 电量/(kW?h)
集的增大,预测算法所需的迭代时间有了明显不同,并行加权线性回归算法所需的时间要远远小于传统方法。
24 00 15 7 ?3 52 679.184 224 00 30 7 ?3 58 495.673 024 00 45 7 ?3 57 386.641 0#
#
#
#
#
#
2)本文实验结果
本文基于并行局部加权线性回归算法得到的负荷预测值与实际负荷值对比结果如表3所示。
如图6、7所示,预测值的曲线与实际值的曲线趋势相似,其均方根误差平均值为3.01%。预测
表3 对比结果 Tab. 3 Comparison results
序号
预测值
实际值
误差/% ?4.0
30 23 30 3 ?5 84 704.784 130 23 45 3 ?5 72 975.840 8
表2 2011年12月1日的实际负荷数据 Tab. 2 Actual load data on December 1,2011
小时
分钟
最高温度
最低温度
电量/(kW?h)
00 15 8 ?1 53 100.606 101 30 8 ?1 53 105.972 302 45 8 ?1 54 000.864 3#
#
#
#
#
1 50 976.581 8 53 100.606 1
2 54 386.020 9 53 105.972 3 2.4 3 56 034.593 1 54 000.864 3 3.8 4 52 065.280 6 53 400.287 8 #
#
#
?2.5 #
23 30 8 ?1 72 000.504 523 45 8 ?1 71 100.308 5
96 73 517.718 9 71 100.308 5 3.4
第1期 张素香等:海量数据下的电力负荷短期预测 41
负荷/MW
Zhong Qing,Sun Wen,Yu Nanhua,et al.Load and power forecasting in active distribution network planning[J].
Proceedings of the CSEE,2014,34(19):3050-3055(in Chinese).
[3] 肖白,周潮,穆钢.空间电力负荷预测方法综述与展望
[J].中国电机工程学报,2013,33(25),78-92. Xiao Bai,Zhou Chao,Mu Gang.Review and prospect of
时间/h
the spatial load forecasting methods[J].Proceedings of the CSEE,2013,33(25):78-92(in Chinese).
[4] Liang Z S.The short term load forecast of power system
based on adaptive neural network[J].Journal of Northeast China Institute of Electric Power Engineering,1994,14(1):27-35.
[5] 谢开贵,李春燕,周家启.基于神经网络的负荷组合预
测模型研究[J].中国电机工程学报,2002,22(7):85-89.Xie Kaigui,Li Chunyan,Zhou Jiaqi.Research of the combination forecasting model for load based on artificial neural network[J].Proceedings of the CSEE,2002,22(7):
图6 负荷预测对比图
Fig. 6 Load forecasting contrast curve
均方根误差/%
时间/h
85-89(in Chinese).
[6] 刘玲,严登俊,龚灯才,等.基于粒子群模糊神经网络
的短期电力负荷预测[J].电力系统及其自动化学报,2006,18(3):47-50.
Liu Ling,Yan Dengjun,Gong Dengcai,et al.New method for short term load forecasting based on particle swarm optimization and fuzzy neural network[J].Proceedings of the CSU-EPSA,2006,18(3):47-50(in Chinese). [7] 傅忠云.粒子群优化BP算法在电力系统短期负荷预测
中的应用[J].重庆工学院学报(自然科学版),2007,21(10):93-96.
Fu Zhongyun.Application of PSO-BP algorithm in electric power system short-term load forecast[J].Journal of Chongqing Institute of Technology (Natural Science Edition),2007,21(10):93-96(in Chinese).
[8] Hagan M T,Behr S M.The time series approach to
short-term load forecasting[J].IEEE Transactions on Power System,1987,2(3):25-30.
[9] 赵宏伟,任震,黄雯莹.考虑周周期性的短期负荷预测
[J].中国电机工程学报,1997,17(3):211-213. Zhao Hongwei,Ren Zhen,Huang Wenying.Short-term load forecasting considering weekly period based on PAR[J].Proceedings of the CSEE,1997,17(3):211-213(in Chinese).
[10] 陶文斌,张粒子,潘弘,等.基于双层贝叶斯分类的空
间负荷预测[J].中国电机工程学报,2007,27(7):13-17. Tao Wenbin,Zhang Lizi,Pan Hong,et al.Spatial electric load forecasting based on double-level Bayesian classification[J].Proceedings of the CSEE,2007,27(7):13-17(in Chinese).
[11] Bakirtzis A G,Theocharis J B.Short term load forecasting
using fuzzy neural networks[J].IEEE Transactions on
图7 负荷预测的均方误差曲线
Fig. 7 Mean square error curve of load forecasting
结果的误差符合负荷预测的误差标准。证明基于云计算的局部加权线性回归方法是可行的,该系统软件一直在某智能园区运转正常,为电力企业管理该园区的电力负荷起到了很重要的作用。
3 结论
本文针对传统局部加权线性回归算法的严重缺陷,研究了海量数据电力负荷短期预测问题。通过最大熵剔除坏数据模型进行数据预处理后,将具有并行编程模型和计算框架的Mapreduce和局部加权线性回归算法相结合,提出了并行局部加权线性回归算法,解决了海量数据的计算量问题,预测所耗的时间大大缩短,同时还保证了预测精度满足负荷预测要求。
下一步,将围绕多模型相结合的方法解决负荷预测中的因素关联问题。
参考文献
[1] 中国电力大数据发展白皮书[M].北京:中国电力出版
社,2013.
The white paper for the development of Chinese electric power big data[M]. Beijing: China Electric Power Press, 2013(in Chinese).
[2] 钟清,孙闻,余南华,等.主动配电网规划中的负荷预
测与发电预测[J].中国电机工程学报,2014,34(19):3050-3055.
bbs.99jianzhu.com内容:建筑图纸、PDF/word 流程,表格,案例,最新,施工方案、工程书籍、建筑论文、合同表格、标准规范、CAD图纸等内容。