基于大数据分析的输变电设备状态数据异常检测方法_严英杰(2)

 

P[ct=CI1,ct+k=CI2]=P[xt∈(b1,a1),xt+k∈(b2,a2)] (14) 式中CI1, CI2∈{C1,…,CN},I1=(a1,b1),I2=(a2,b2)。由于式(1)中xt属于正态分布,因此xt的二阶正态分布函数为

a1

1

∫b∫b

a2

2

[?

e

(x?μ)2+(y?μ)2?2ρ(k)(x?μ)(y?μ)

]

2σdxdy (15)

SOM神经网络的这一特点,量化后的时间序列Ct可看作在拓扑结构中一个神经元到另一个神经元的转移,从而挖掘出数据随时间的变化规律

[21-22]

式中ρ(k)=αk,表示一阶AR过程的自相关函数。

由于这里考虑神经元之间的一步转移,因此根据式(8)、(11)可以将式(15)简化为

1)神经元所属的概率密度函数。

通过一阶转移概率P来表示神经元之间的相关关系,AR(n)模型中神经元之间的一阶转移概率为

P[ct+1=CI2|ct=CI1]=

P[ct+1=CI2,ct=CI1]

(16)

P[ct=CI1]

P[ct+1|,ct,…,ct?n+1],由此可得AR(1)模型的一阶转移概率为P[ct+1|ct]。

令{C1,C2,…,CN}的取值为{1,2,…,N},则由式(5)可得在时刻t,ct的取值为CI的概率为

以变压器油温正常情况下的在线监测数据为例,首先将数据通过AR(1)模型进行拟合,得到模型参数为α=0.85,με=0,λ=0.01,其次将5000个点的温度数据输入到含有12个神经元的SOM中进行训练,得到训练好的SOM神经网络。截取一段温度数据,如图1(a)所示,并将其输入到训练好的

P[ct=CI]=P[i(xt)=I] (8)

由式(7)和(8)可得i(xt)的概率密度函数为 &xt?Ci&=I]??P[i(xt)=I]=P[argmini

(9) ?

??P[&xt?CI&≤&xt?Cj&?j≠I]

式中||?||表示欧式距离。

由于x和c都是一维数组,因此式(9)可表示为 P[i(xt)=I]=P[|xt?CI|<|xt?CI?1|]∧

P[|xt?CI|<|xt?CI+1|] (10)

SOM中得到量化输出,如图1(b)所示。

根据AR模型的参数,计算出SOM神经元间的转移概率,为12×12的矩阵,如图2所示。可以看出,对角线上的转移概率最大,说明两相邻时刻的数据属于神经元的概率最大。同时,阴影区域内的转移概率明显大于阴影区域外的转移概率,这表

油温/(°)

55504540观测时间点

令a=(CI+CI+1)/2且b=(CI+CI?1)/2,由于式(1)中

则xt的概率分布函数可用标表示xt服从正态分布,

准正态分布函数来表示,则式(10)可用xt的分布函P[i(xt)=I]=P[b<xt<a]=Fx(a)?Fx(b)= Φ(

a?μ

(a) 油温在线监测数据

序列量化值

数来表示:

b?μ

σ

?Φ(

σ

=f(I,α,μe,λ) (11)

10

86420

观测时间点

当I=1时,式(11)简化为

(b) 油温数据量化后的序列


第1期

转移概率

严英杰等:基于大数据分析的输变电设备状态数据异常检测方法 55

1.0 0.8 0.6 0.4 0.2 0.0

则认为该数组不属于任何1个簇。因此,当某个参量的值出现异常而导致该多维数组Z不属于任何1个簇时,可以判断该时刻的多维数据出现异常。

观测时间点

(c) 油温数据转移概率序列

3 异常检测步骤

根据以上2节中时间序列的特征量提取算法,对在线监测数据进行异常检测的流程如图3所示,具体步骤如下所述。

图1 油温数据、量化序列及其转移概率序列示例 Fig. 1 Example of oil temperature data and

its transition probabilities series

明AR过程中数据在神经元之间的转移概率与神经元的距离呈反比,神经元之间的距离越大,数据越难以转移。

将温度数据随时间的动态变化用转移概率序列表示,如图1(c)所示。可以看出在正常情况下,数据的转移概率都很高,大都从图2中阴影区域内取值,这表明温度数据随时间的变化平稳。反之,当序列中的一段数据的转移概率在阴影区域外时,说明该段数据在神经元之间的转移较为频繁,可能原因是状态量发生异常,导致数据已不服从初始的

AR分布。

图3 异常检测步骤图 Fig. 3 Steps of anomaly detection

1)针对每个参量的历史数据,通过第1节中AR模型、SOM算法计算出转移概率矩阵{X1,X2, …,XN}。

图2 转移概率矩阵

Fig. 2 Matrix of transition probabilities

2)针对所有参量的历史数据,通过第2节中的DBSCAN算法对该多元时间序列进行聚类,将历史数据聚成m个簇。

2 多状态量数据流的特征提取

在实际运行过程中,由于设备属性、运行工况、环境的差异,对于设备的状态监测参量,多维参量之间的相关关系难以用精确、统一的函数表示。如变压器热点温度与底层油温、顶层油温、环境温度、负荷等参量的关系主要通过热平衡方程给出,而热平衡方程参数众多且在高温时常会计算不准,从而导致热点温度异常难以检测。

针对多维参量融合的问题,本文通过基于密度的聚类算法(density-based spatial clustering of

3)将在线监测的实时数据流代入1)中的转移概率矩阵得到各参量的转移概率序列,并判断各时间点的数据是否属于2)中的m个聚类。

4)根据3)中的结果对数据流进行异常检测,异常检测逻辑如下:

①当各参量的转移概率序列都不存在0值,且数据流中各时间点的数据属于m个簇中的1个时,则该段数据不存在异常;

②当各参量的转移概率序列存在少数几个0值,且数据流中少数时间点的数据不属于m个簇,则该段数据中存在少数几个噪声点,属于传感器异常,可以忽略;

③当k个参量(k<N)的转移概率序列存在一段0值,且数据流中一大段时间点的数据不属于m个簇,则判断设备出现了异常运行状态;

④对③中异常运行状态,根据参量转移概率序列的过0点,判断设备异常状态的发生时间。

为了验证本文异常检测方法的有效性,下面将

applications with noise,DBSCAN)对多维的在线监既能充分利用在线监测数据量测数据进行聚类[22],

大的特点,又能将各参量间的复杂相关关系简化。

以案例分析中的输电线路覆冰为例,将在线监测参量Z=(耐张塔导线轴向张力、导线倾斜角、风速)作为1个3维数组通过DBSCAN算法聚类。若1个

3维数组到任意簇中点的距离都大于某个特定值R,


56 中 国 电 机 工 程 学 报

转移概率

第35卷

以输变电设备在线监测数据为例,对其进行异常检测,并将结果与现有方法(逐个阈值)相比较。

1.00.50.0

t/h (c) 环境温度转移概率序列

4 案例分析

4.1 案例一

转移概率

以某变电站中1台220 kV 主变压器为例,选取其2013年7月15日—7月22日的油温、负荷、环境温度的在线监测数据作为历史数据,并作为训练样本,同时选取其2013年7月23日的

1.50.5?0.5

t

/h (d) 实时数据属于聚类结果

12:00—20:00的480组在线监测数据作为异常检测的样本。油温、电流、环境温度的采样周期都是

图5 异常检测结果图 Fig. 5 Results of anomaly detection

1 min/组,如图4所示。从图上可直接看出,在第380个数据点之后负荷和油温呈上升趋势。

温度/℃、环境/℃、负荷/A 论,该时刻的油温数据为噪声,可能是由于传感器不稳定导致的,可以将此异常忽略;

2)在时间T=384~390间,负荷和油温的转移概率序列都为0,T=390~410间负荷和油温的转移概率序列不平稳且间断地存在0点,且T=390~500间的数据大部分不属于任何1个聚类。因此可以得出结论:设备从T=84(对应当地时间为6:20)开始出现异常运行状态,油温及负荷相对于正常值呈现快速升高的现象,应该在运行过程中加以警惕,时刻关注变压器运行状态。

变电站的运行记录显示,当时实际情况是根据调度的需要,该变压器于6:15开始超铭牌额定值运行,计划超铭牌额定值负载系数为1.1~1.2,于7:30返回正常运行负载。该实际运行请况表明,当时变压器的确处于异常运行状态,本文方法具有有效性,能针对状态监测数据流快速检测出运行状态的异常。

若采用阈值判定方法,由于变电设备评价导则并没有油温、负荷、环境温度方面的阈值标准,因此只能采用经验设定1.2的系数,即监测数据超过正常值的1.2倍时认为有异常状态。因此,根据 图4用阈值判定法可得:1)T=80处油温存在异常;

观测时间t/min

图4 油温、负荷、环境温度的数据图 Fig. 4 Monitored data of oil temperature,

current and ambient temperature

对该台变压器历史在线监测数据通过第3节中

1)、2)建立好3个转移概率矩阵并聚类生成3个簇。将选取的480组数据根据步骤3)计算出3个参量的转移概率序列,并判断每个时间点的数据是否属于这3个簇(1代表属于,0代表不属于),结果如图5所示。

从图5中可以得到该变压器的异常检测结果:

1)在时间点T=80,油温的转移概率序列存在0点,且该时刻的实时数据不属于任何一个聚类,而在T=80周围不存在这类情况,因此可以得出结

转移概率

t/h

(a) 负荷转移概率序列

2)T=450(当地时间6:50)以后,油温和电流出现异常。该结论检测的异常远远滞后于实际情况,且无法消除传感器异常带来的误判。 4.2 案例二

某超高压公司的1条500kV线路是历年的覆冰严重区域,每年的11月至次年2月都是覆冰频发时段。在各重冰段都有覆冰监测装置安装,这里选取该线路某耐张段2013年11月—2014年2月覆冰

转移概率

t/h

(b) 油温转移概率序列

正常时的在线监测数据(耐张塔导线张力、导线倾

角、风速)作为训练样本,2013年12月至2014年1


第1期 严英杰等:基于大数据分析的输变电设备状态数据异常检测方法 57

月的数据作为异常检测样本,采样周期为1h/组,

拉力/N

间点T=380~400之间,导线拉力和导线倾角的转移序列都出现多次过零点,聚类结果显示该段时间的数据不属于任何1个簇;在时间点T=400~580之间,在线监测数据的聚类结果都为0。因此,可以得出结论,在时间序列T=380时刻(对应12月17日),在线监测数据已出现异常,结合数据增长趋势可以

bbs.99jianzhu.com内容:建筑图纸、PDF/word 流程,表格,案例,最新,施工方案、工程书籍、建筑论文、合同表格、标准规范、CAD图纸等内容。


TOP最近更新内容

    江苏省盱眙县都梁中学高中数学第2章平面向
    绿豆蛋花是怎样制作及具有什么样的功效?
  • 上一篇:建筑电气开关型号符号
  • 下一篇:电力系统负荷建模的数据预处理技术_王雁平