计及天气因素相关性的配电网故障风险等级预测方法

A Prediction Method of Fault Risk Level for Distribution Network Considering Correlation of Weather Factors

张稳1, 盛万兴2, 刘科研2, 杜松怀1, 贾东梨2, 白牧可2

1.中国农业大学 信息与电气工程学院,北京市 海淀区 100083

2.中国电力科学研究院有限公司,北京市 海淀区 100192

ZHANG Wen1, SHENG Wanxing2, LIU Keyan2, DU Songhuai1, JIA Dongli2, BAI Muke2

1. College of Information and Electrical Engineering, China Agriculture University, Haidian District, Beijing 100083, China
2. China Electric Power Research Institute, Haidian District, Beijing 100192, China

  • 张稳(1988),女,博士研究生,研究方向为电力系统自动化,E-mail:zhangwen1898@126.com;

  • 盛万兴(1965),男,博士,教授级高级工程师,

  • 研究方向为电力系统自动化、可再生能源发电等;

  • 刘科研(1979),男,博士,高级工程师,研究方向为配电网仿真建模与智能分析;

  • 杜松怀(1963),男,通信作者,教授,研究方向为电力市场和电力系统继电保护等。

基金项目: 国家重点研发计划项目(2017YFB0903000); 国家电网公司科技项目(52020116000G); Project Supported by National Key Research and Development Program of China (2017YFB0903000); Science and Technology Project of SGCC(52020116000G);

文章编号: 1000-3673(2018)08-2391-08 中图分类号: TM721

摘要

配电网风险等级的准确性预测对配电网运行维护具有重要意义。针对配电网故障影响因素众多且冗余性强的问题,提出一种计及天气因素的配电网故障特征选择和故障停电风险等级预测的方法。通过对故障数据的预处理,归纳出18个配电网故障特征,综合考虑故障发生频率、停电时长和缺供电量比例,确定风险等级划分依据;提出改进G-ReliefF算法实现对故障特征权重计算和冗余剔除,得到最优故障特征集合;基于Adaboost改进C4.5决策树算法进行配电网故障风险等级预测,挖掘故障停电风险等级与天气因素间的关联关系。通过实际算例分析,验证了所提方法的有效性,可以为配电网风险预控提供有效依据。

关键词 : 配电网; 天气因素; 特征选择; 相关性; Adaboost; 风险预测;

DOI:10.13335/j.1000-3673.pst.2018.0760

ABSTRACT

It is significant for operation and maintenance of distribution network to forecast risk level more accurately. In allusion to the problems of many factor and strong redundancy related to fault, a method of fault feature selection and fault outage risk level prediction for distribution network considering meteorological factors was proposed. Eighteen fault features of distribution network were summarized after data preprocessing and the basis of risk level was determined after considering failure frequency, proportion of outage duration and power supply. An improved G-ReliefF algorithm was proposed to calculate fault feature weights and eliminate redundancy. Then, an Adaboost based C4.5 decision tree algorithm was used to forecast the risk level of distribution network fault and find relationship between fault outage risk level and meteorological factors. Results of analyzing calculation example showed that the proposed method is effective. It provides an efficient basis for pre-control of distribution network risk.

KEY WORDS : distribution network; weather factor; feature selection; correlation; Adaboost; risk prediction;

0 引言

配电网网络拓扑复杂、设备数量种类繁多,外部环境因素引发的故障随机性强、机理复杂,常规电气机理分析和概率统计难以发挥有效作用。配电网运维检修存在维护工具落后、维护工作量大,运维检修人员不足等现象[1]。因此,如何综合考虑配电网故障特征属性、故障严重程度、发生故障时环境因素[2],对配电网运行中潜在风险进行准确预测,找出薄弱环节加以改进,已成为当前亟待解决的问题。

恶劣天气情况下,配电网故障更容易发生,因此,天气因素日益成为影响配电网故障的重要因

[3]。但由于天气变化的不规律性、突发性以及多样性等特点,导致天气因素引发的配电网故障不易被有效监测。随着气象卫星、气象雷达和超级计算机等现代科学技术的发展,气象预报准确率也在不断提高。基于天气数据的配电网故障停电风险(简称故障风险)等级预测模型建立天气因素与故障风险等级间的关联关系,通过对未来时间段的故障风险等级预警,可以帮助运维检修部门有针对性地进行设备管理、线路维护和系统升级[4-5]

国外研究主要针对天气因素、动物因素及植物因素造成的配电网故障进行预测,但很少对配电网故障影响因素之间的相关性进行系统分析。文献[6]提出了一种与风暴天气相关的故障停电预测方法,利用历史停电数据和天气数据建立经验模型,通过实际风暴数据对预测模型的有效性进行评价;文

献[7-8]利用统计模型预测了飓风、台风等恶劣天气导致的配电网故障;文献[9]考虑了影响植被生长的因素,基于温度、降水和馈线附近植被的年均修剪次数等特征,采用线性回归、指数回归、线性多变量回归和人工神经网络四种模型预测了植被生长导致的配电网故障;文献[10-11]基于风速和雷电等数据运用泊松回归、贝叶斯网络和集成学习方法预测了天气导致的配电网故障。国内受限于在线监测设备匮乏和信息系统建设滞后,已开展的配电网故障风险预测方面的研究较少。文献[12-13]基于负荷特性、粗糙集和灰色理论提出变压器短期故障的风险评估和预测方法。文献[14]基于神经网络“能量-故障”映射关系,提出将小波频带分析与灰色预测理论相结合进行水电机组故障预测。文献[15]通过加权马尔可夫模型,提出基于马尔可夫链的连锁故障预测方法。

当前,大数据、物联网、云计算和人工智能技术逐渐成为智能化电网的研究热点。数据挖掘技术被应用在配电网故障预测和诊断中,文献[2]采用Apriori算法,提出一种基于典型故障与环境场景关联识别的配电网运行风险预警方法。文献[16]提出基于关联规则挖掘和改进频繁模式算法的电网故障诊断方法。配电网发生故障时环境因素众多,存在很多冗余、无关甚至对故障风险预测产生干扰的特征[17]。因此,从海量数据和众多故障特征中挖掘对配电网风险等级预测能力较强的特征[18],并进行相关性分析十分必要。

针对上述问题,本文提出一种计及天气因素相关性的配电网故障风险等级预测方法,首先对配电网运维、故障数据和相同时段的天气数据进行数据预处理,确定初始特征集合,提出配电网故障风险等级划分依据;然后基于改进G-ReliefF算法进行最优故障特征选择;最后采用Adaboost改进C4.5决策树(简称Ada-DT)为强分类器的算法进行故障风险等级预测,寻找故障风险等级与天气因素间的关联关系。经算例分析,本文所提方法的预测准确率和召回率都较高,具有实际应用价值。

1 配电网故障数据处理

1.1 数据基础

通过对配电网信息管理系统中气象信息系统、智能公用配变监测系统、地理信息系统和电网资产质量监督管理系统的调研[19],提取气象信息系统中的温度、湿度、风速等天气数据和配电地理信息系统中的设备位置数据,分析配电网故障发生的时空特性,用于确定配电网故障初始特征集合。提取智能公用配变监测系统中的配变容量、实时负荷数据、月最大负荷数据和电网资产质量监督管理系统中的停电时间、停电次数、缺供电量等用于配电网故障风险等级划分和预测。

分析系统中的数据类型、数据完整性、数据可用性;进行数据清洗、数据变换和数据集成,并对离群样本诊断和剔除。配电网故障风险等级预测相关数据源和数据类型如图1所示。

图1 故障风险等级预测相关数据 Fig. 1 Data of fault risk level prediction

1.2 故障风险等级划分依据

配电网故障风险是指导致配电网停电的故障发生的可能性及故障停电损失的严重程度[20]。本文主要针对的是故障风险的充裕性评估,包括温度、风速、湿度等天气因素导致的故障停电的可能性及停电的影响程度。

配电网的故障风险不仅与停电发生频率有关,还与每次故障停电时长和缺供电量有关[21]。实际中不同供电区域的配电网规模相差甚远,本文在不考虑人工校正措施的基础上,以不同线段区域每周的运行数据和状态为统计分析对象,记SiN为线段区域i的停电总时长,Sij为统计周中该线段第j次停电事故中的停电时长,n为该周停电事故总数,则该区该周的停电时长比例累积值Si

\({{S}_{i}}=\sum\limits_{j=1}^{n}{\frac{{{S}_{ij}}}{{{S}_{iN}}}}\) (1)

EiN为线段区域i的供电总量,Eij为统计对象周中该分区第j次停电事故的缺供电量,n为该周停电事故总数,则该区该周缺供电量比例累积值Ei

\({{E}_{i}}=\sum\limits_{j=1}^{n}{\frac{{{E}_{ij}}}{{{E}_{iN}}}}\) (2)

根据选取的每周故障次数n、停电时长比例累积值Si和缺供电量比例累积值Ei三类故障风险指标,将配电网线段区域故障停电风险程度分为3级:一般、中度、严重。计算后选取最高的风险等级,即每周故障停电为1次的缺供电量比例超过30%,则该周的风险等级应该定为2级。故障风险分级评价标准如表1所示,表1中阈值可以根据城市配电网实际情况进行设定。

表1 配电网故障风险等级划分 Tab. 1 Level divided for fault risk of distribution network

2 配电网故障特征选择

Relief(relevant features)是著名的过滤式特征选择方法,根据各个特征和类别的相关性赋予特征不同的权重,权重小于某个阈值的特征将被移除[22]。Relief主要针对二分类问题,其拓展算法ReliefF用于处理多分类问题。

本文提出的G-ReliefF算法,改进了ReliefF算法不能有效剔除冗余的特点。采用G-ReliefF算法进行配电网故障特征的最优化选择主要分为2个部分:基于ReliefF算法的特征选择和基于灰色关联分析[23]的冗余特征剔除。

G-ReliefF算法具体伪代码如图2所示。

1)样本近邻的计算公式为

\(d\text{(}\mathbf{A}\text{,}\ \mathbf{B}\text{)=}\sqrt{\sum\limits_{i=1}^{n}{{{({{a}_{i}}-{{b}_{i}})}^{2}}}}\) (3)

式中:特征AB分别用n维数组表示,\(\mathbf{A}\text{= }\!\!\{\!\!\text{ }{{a}_{1}}{{a}_{2}}\cdots {{a}_{n}}\text{ }\!\!\}\!\!\text{ }\)、\(B\text{= }\!\!\{\!\!\text{ }{{b}_{1}}{{b}_{2}}\cdots {{b}_{n}}\text{ }\!\!\}\!\!\text{ }\),每个样本为n维空间的一个点。

图2 G-ReliefF算法伪代码图 Fig. 2 Diagram of G-ReliefF algorithm pseudo code

2)样本特征差计算公式为

\(diff(\mathbf{A}\text{,}\ {{\mathbf{R}}_{\text{1}}}\text{,}\ {{\mathbf{R}}_{2}})\text{=}\)

式中样本R1和样本R2在特征A上的差用\(diff(\mathbf{A}\text{,}\ {{\mathbf{R}}_{\text{1}}}\text{,}\ {{\mathbf{R}}_{\text{2}}})\)表示。

3)特征权重计算公式为

\(\begin{align} W(\mathbf{A})\text{=}W(\mathbf{A})-\sum\limits_{j=1}^{k}{diff(\mathbf{A}\text{,}\ \mathbf{R}\text{,}\ {{\mathbf{H}}_{j}})/(mK)}+ \\ \sum\limits_{C\notin \text{Class}(\mathbf{R})}{[\frac{P(C)}{1-P(\text{Class}(\mathbf{R}))}\cdot \sum\limits_{j=1}^{k}{diff(\mathbf{A}\text{,}\ \mathbf{R},{{\mathbf{M}}_{j}}\text{(}\mathbf{C}\text{))}}]/(mK)} \\\end{align}\)(5)

式中:\(diff(\mathbf{A}\text{,}\ \mathbf{R}\text{,}\ {{\mathbf{H}}_{j}})\)代表样本R和\({{\mathbf{H}}_{j}}\)关于特征A的差异;\({{\mathbf{H}}_{j}}\)与\({{\mathbf{M}}_{j}}\)分别代表训练集中与样本R

离最近的同类样本与不同类样本;m代表抽样次数;K代表近邻样本数;\(P(C)\)是第C类样本数占样本总数的比例,即

4)配电网主要故障特征矩阵。

配电网主要故障特征种类为m*,每个评价对象包含的评价指标个数为n;特征矩阵中选择\({{\mathbf{X}}_{\mathbf{T}{{\mathbf{m}}^{\mathbf{*}}}}}\)作为“参考序列”,剩余特征分别作为“比较序列”。

5)关联系数。

第\(k\)时刻比较序列\({{\mathbf{X}}_{Ti}}\)与参考序列\({{\mathbf{X}}_{To}}\)的相对差值作为\({{\mathbf{X}}_{Ti}}\)对\({{\mathbf{X}}_{To}}\)在\(k\)时刻的关联系数,记为

\(\begin{align} {{\xi }_{oi}}(k)=\frac{{{\Delta }_{0i}}(min)+P\cdot {{\Delta }_{0i}}(max)}{{{\Delta }_{0i}}(k)+P\cdot {{\Delta }_{0i}}(max)} \\ 0<{{\xi }_{oi}}(k)\le 1P\in [0-1] \\\end{align}\) (8)

式中:\({{\Delta }_{0i}}(min)\text{=}{{\min }_{(i)}}{{\min }_{(k)}}\left| {{X}_{To}}(k)-{{X}_{Ti}}(k) \right|\)称为两级最小差,即\({{\mathbf{X}}_{To}}\)与所有\({{\mathbf{X}}_{Ti}}\)的最小绝对差值中再选出一个最小的差值;\({{\Delta }_{0i}}(\max )\text{=}{{\max }_{(i)}}\)\({{\max }_{(k)}}\left| {{X}_{To}}(k)-{{X}_{Ti}}(k) \right|\)称为两级最大差,即\({{\mathbf{X}}_{To}}\)与所有\({{\mathbf{X}}_{Ti}}\)的最大绝对差值中再选出一个最大的差值;\(\left| {{X}_{To}}(k)-{{X}_{Ti}}(k) \right|\text{=}{{\Delta }_{0i}}(k)\)称为参考序列与比较序

列在第k时刻的绝对差值;P为分辨系数,主观上体现研究者对\({{\Delta }_{0i}}(\max )\)的重视程度,在客观上反映系统各个因子对关联度的间接影响程度。

6)关联度。

\(\begin{align} \overline{{{\xi }_{oi}}(k)}=\sum\limits_{k=1}^{n}{{{\omega }_{k}}{{\xi }_{oi}}(k)} \\ (i=1,2,\cdots ,{{m}^{*}}k=1,2,\cdots ,n) \\\end{align}\) (9)

式中:\({{\omega }_{k}}\)的取值直接影响关联度的大小,\({{\omega }_{k}}\)详细求解步骤见文献[23];\(\overline{{{\xi }_{oi}}(k)}\)的值越大说明两个特征之间的相关性越强。

7)关联度矩阵。

\({{\mathbf{X}}_{ij}}=\text{Inter}({{\mathbf{X}}_{i}}\to {{\mathbf{X}}_{j}})\text{,}\ {{\mathbf{X}}_{i}}\text{,}\ {{\mathbf{X}}_{j}}\in \mathbf{A}\) (10)

3 基于Adaboost的配电网故障风险预测

3.1 Adaboost-DT算法

Adaboost算法是机器学习中的集成学习算法,通过对同一训练集训练不同的弱分类器,然后将这些弱分类器组合成强分类器。弱分类器之间的互补特性使组合后的强分类器有较强泛化能力。该算法核心思想是提高训练集中训练效果差的样本权重和学习能力强的弱分类器权重,降低训练效果好的样本权重和学习能力弱的弱分类器权重[24]

Adaboost算法具体步骤见文献[24],不再赘述。

本文提出的Ada-DT算法采用了基于C4.5算法的决策树作为弱分类器。决策树算法作为一种典型的分类算法,着眼于从一组无次序、无规则的事例中推理出以决策树形式表示的分类规则[25]。典型的决策树算法有ID3、C4.5、CART等,其中,C4.5决策树算法计算特征变量的信息增益和增益率,根据计算结果选取分裂节点、构建分支及生成叶节点,最后通过后剪枝方法完成决策树构建。

使用Adaboost算法训练T个决策树模型,首先对配电网故障样本数据进行归一化处理,使样本值分布在[0, 1]区间;初始化训练集权重,n为训练集中样本的个数;根据权重分布,选取样本训练第1个决策树,设置步长和阈值,分类结束后,计算各样本的预测误差,根据预测误差更新各样本权重和该决策树模型的权重。重复上述过程,直至训练T个决策树模型,根据T个决策树模型\({{G}_{t}}(x)\)和权重值\({{W}_{t}}\)进行配电网故障风险等级的预测。基于Ada-DT的算法流程如图3所示。

图3 Ada-DT算法流程图 Fig. 3 Flow chart of Ada-DT algorithm

3.2 配电网故障风险等级预测

本文计及天气因素相关性的配电网故障特征最优化选择和故障风险等级预测方法的研究主要分为四个阶段:信息采集/处理、天气相关的故障特征提取、故障特征选择和风险等级预测。配电网故障风险等级预测实现流程,如图4所示。

1)信息采集/处理阶段。对采集到的配电网负荷数据、台账数据、天气数据和故障数据进行数据预处理;筛除故障数据中明显与天气无关的数据。

2)初始故障特征确定和风险等级划分阶段。分析可能与配电网故障风险有关的天气数据,筛选与配电网故障风险有关的特征集合,建立初始特征集;考虑故障发生频率、停电时长和缺供电量,确定配电网故障风险等级划分的依据。

3)故障特征选择阶段。基于改进G-ReliefF进行特征选择,剔除相关性强的特征,得到最优故障

图4 配电网故障风险等级预测流程 Fig. 4 Flow chart of fault risk level prediction

特征集合。

4)故障风险等级预测阶段。采用Ada-DT算法得到强分类器,进行配电网故障风险等级预测。

4 算例分析

本文采用北方某区县52个线段区域2014年

1月至2017年12月的故障数据、运维数据和天气数据进行试验。按停电线段统计故障数据8065条,经过预处理,筛除设备因素、运行维护和施工影响等明显与天气无关的数据。以周为单位统计故障数据922条,其中一类样本数据620条,二类样本数据230条,三类样本数据72条。

实验平台包括硬件配置和软件环境两部分,硬件配置为Intel(R)Core i7-6700HQ 2.6 GHz处理器、8 GB内存的PC机,软件环境采用基于WIN7操作系统的MATLAB R2015a。

4.1 特征选择及分析
4.1.1 数据分析

统计该区县不同线段区域不同月份的故障情况,计算平均故障数,得到该区县12个月份的平均故障和52个线段区域月平均故障分布如图5所示。其中,横坐标分别代表月份和线段区域编号,纵坐标分别代表月月平均故障数和线段区月平均故障数。

图5可知月平均故障数在5月最高、1月最低,月平均故障次数的大小和时间存在关系,将“时间分级”以月为单位作为一个故障特征,并依据不同月份对应的月平均故障数大小对月份划分

图5 平均故障分布图 Fig. 5 Distribution diagram of average fault

4个等级;不同线段区域月平均故障数存在较大差异,即故障发生情况存在地域特性,将“区域分级”作为故障特征,并依据各线段区域对应的月平均故障数大小对线段区域划分4个等级。

考虑温升高将导致设备耐压水平、绝缘特性下降;湿度大容易降低设备绝缘性能,导致电流泄漏、污闪等情况的发生;雷电可能直接导致设备承受雷击过电压等。经分析,初步确定配电网故障特征如表2所示。

表2 配电网故障风险特征(1) Tab. 2 Fault risk features of distribution network(1)

4.1.2 特征选择

对初始故障特征进行权重计算,其中样本抽样次数50,最近邻样本数10,重复计算20次,得到特征权重和按权重从大到小排序情况如表3所示。基于前项选择策略遍历特征空间,绘制分类预测准确率的变化趋势见图6。

表3和图6可知,计算至第12个特征时的分类准确率最高,随着特征量的增加,至第13个特征时分类准确率出现大幅下降。虽然特征f18(最大持续风速)对准确率有所贡献,但其权重远远低于18个样本的权重均值0.026。最终,特征权重的阈值取值0.018。

表3 配电网故障风险特征(2) Tab. 3 Fault risk features of distribution network(2)

4.1.3 冗余特征剔除

配电网故障风险特征个数设为12,每个特征评价对象包含的评价指标设为922,建立相应配电网故障风险特征矩阵;分别设12个故障风险特征作为参考序列,对应余下11个故障风险特征作为比

图6 分类准确率变化趋势 Fig. 6 Trend of classification accuracy rate

较序列;设置分辨系数P值为0.5[23],求解关联度矩阵如表4所示。

表4可知,X34X35X45的值分别为0.888、0.903、0.862(表4中加粗表示),即:f3f4关联度是0.888,f3f5关联度是0.903,f4f5关联度是0.862;f3代表平均温度,f4代表平均高温,f5代表极端高温。三者之间存在很强的关联性。通过分析,剔除f3、f4,选择f5极端高温。确定配电网故障风险最优特征集合为{f2、f10、f1、f5、f9、f16、f15、f17、f14、f13}。

表4 配电网故障特征关联度矩阵 Tab. 4 Correlation matrix of distribution network fault feature

4.2 配电网故障风险等级预测

采用本文Ada-DT算法,以2014年1月至2016年12月的线段区域周故障数据作为训练样本,2017年1月至12月的线段区域周故障数据作为测试样本进行预测,预测结果如表5所示。

表5 配电网故障风险等级预测结果 Tab. 5 Prediction results of fault risk level

表5中“等级1”代表配电网故障风险等级1,即一般风险;“等级2”代表中度;“等级3”代表严重;“综合”是三类样本总体预测准确率。由表5可知,3类样本的故障风险等级的预测准确率在88%以上,说明本文方法的有效性;由于实际配电网中等级3的样本数较少,预测准确率较低;在训练样本中增加等级3的样本数,可以进一步增加预测准确率。

为验证本文Ada-DT算法进行风险等级预测的优越性,分别采用BP神经网络、RBF-SVM进行等级预测,预测准确率和召回率对比如表6所示,混

表6 配电网故障风险等级预测对比 Tab. 6 Prediction comparison of fault risk level

淆矩阵对比如图7所示。

图7中,混淆矩阵的行表示实际类实例,列表示预测类实例,绿色背景中的数值分别表示等级1、2、3中预测正确的样本个数和比例,红色背景中的数值表示预测错误的样本个数和比例,蓝色背景表示总体预测准确率,灰色背景表示各级样本准确率(纵排)和召回率(横排)。

表6和图7可以得出:基于Ada-DT算法的故障风险预测准确率90.4%,高于BP神经网络算

图7 3种算法的混淆矩阵对比 Fig. 7 Confusion matrix comparison of three algorithms

法和RBF-SVM算法,预测误差率9.6%,低于其他2种算法;基于Ada-DT算法对3类风险等级预测的召回率相对较高,说明其对不同预测样本具有较好的适应性;虽然基于BP神经网络算法对风险等级1的预测准确率为97.6%,但其对等级2的预测准确率仅为60.8%,说明对等级2样本进行预测的适应性极差。

5 结论

本文提出一种计及天气因素相关性的配电网故障风险等级预测方法,得出如下结论:

1)基于G-ReliefF算法的配电网故障风险特征选择和相关性分析方法,提高了配电网故障风险预测效率。

2)基于Ada-DT算法对配电网故障风险等级的预测精度和泛化能力均优于BP神经网络和RBF- SVM算法。通过对某区县不同线段区域进行算例分析,验证了本文所提方法的有效性和正确性,可以为后续配电网风险预警和运行维护提供理论依据。

3)本文旨在提出一种考虑天气因素的配电网故障特征选择和风险等级预测的方法,鉴于配电网故障风险影响因素繁多、部分因素无法量化或获取,随着配电网海量数据挖掘技术的发展和数据量的累积,本文所提方法可以针对不同区县的不同时间尺度进行更多类型的风险特征相关性分析和等级预测,预测精度也会不断提升。

参考文献

[1] 徐特威,鲁宗相,乔颖,.基于典型故障与环境场景关联识别的城市配电网运行风险预警方法[J].电网技术,2017,41(8):2577-2584. Xu Tewei,Lu Zongxiang,Qiao Ying,et al.A risk warning method for urban distribution network based on associated recognition of typical fault and environment scenario[J].Power System Technology,2017,41(8):2577-2584(in Chinese).

[2] 李蕊,李跃,苏剑,.配电网重要电力用户停电损失及应急策略[J].电网技术,2011,35(10):170-176. Li Rui,Li Yue,Su Jian,et al.Power supply interruption cost of important power consumers in distribution network and its emergency management[J].Power System Technology,2011,35(10):170-176(in Chinese).

[3] 马瑞,周谢,彭舟,.考虑气温因素的负荷特性统计指标关联特征数据挖掘[J].中国电机工程学报,2015,35(1):43-51. Ma Rui,Zhou Xie,Peng Zhou,et al.Data mining on correlation feature of load characteristics statistical indexes considering temperature[J].Proceedings of the CSEE,2015,35(1):43-51(in Chinese).

[4] 刘科研,盛万兴,张东霞,.智能配电网大数据应用需求和场景分析研究[J].中国电机工程学报,2010,35(2):287-293. Liu Keyan,Sheng Wanxing,Zhang Dongxia,et al.Big data application requirements and scenario analysis in smart distribution network[J].Proceedings of the CSEE,2010,35(2):287-293(in Chinese).

[5] Kankanala P,Das S,Pahwa A.AdaBoost+: an ensemble learning approach for estimating weather-related outages in distribution systems[J].IEEE Transactions on Power Systems,2014,29(1):359-367.

[6] Zhu D,Cheng D,Broadwater R P,et al.Storm modeling for prediction of power distribution system outages[J].Electric Power Systems Research,2006,77(8):973-979.

[7] Liu H,Davidson R A,Rosowsky D V,et al.Negative binomial regression of electric power outages in hurricanes[J].Journal of Infrastructure Systems,2005,11(4):258-267.

[8] Liu H,Davidson R A,Apanasovich T V.Spatial generalized linear mixed models of electric power outages due to hurricanes and ice storms[J].Reliability Engineering and System Safety,2007,93(6):897-912.

[9] Radmer D T,Kuntz P A,Christie R D,et al.Predicting vegetation-related failure rates for overhead distribution feeders[J].IEEE Transactions on Power Delivery,2002,17(4):1170-1175.

[10] Li H,Treinish L A,Hosking J R M.A statistical model for risk management of electric outage forecasts[J].IBM Journal of Research & Development,2010,54(3):8:1-8:11.

[11] Zhou Y,Pahwa A,Yang S S.Modeling weather-related failures of overhead distribution lines[J].IEEE Transactions on Power Systems,2006,21(4):1683-1690.

[12] 孙小军,林圣,冯玎,.考虑负荷特性的牵引变压器短期风险评估[J].电网技术,2016,40(9):2817-2823. Sun Xiaojun,Lin Sheng,Feng Ding,et al.Short-time risk evaluation of traction transformer based on loading characteristics[J].Power System Technology,2016,40(9):2817-2823(in Chinese).

[13] 费胜巍,孙宇.融合粗糙集与灰色理论的电力变压器故障预测[J].中国电机工程学报,2008,28(16):154-160. Fei Shengwei,Sun Yu.Fault prediction of power transformer by combination of rough sets and grey theory[J].Proceedings of the CSEE,2008,28(16):154-160(in Chinese).

[14] 程宝清,韩凤琴,桂中华.基于小波的灰色预测理论在水电机组故障预测中的应用[J].电网技术,2005,29(13):40-44. Cheng Baoqing,Han Fengqin,Gui Zhonghua.Application of wavelet transform based grey theory to fault forecasting of hydroelectric generating sets[J].Power System Technology,2005,29(13):40-44(in Chinese).

[15] 吴文可,文福拴,薛禹胜,.基于马尔可夫链的电力系统连锁故障预测[J].电力系统自动化,2013,37(5):29-37. Wu Wenke,Wen Fushuan,Xue Yusheng,et al.Prediction of chain failure of power system based on markov chain[J].Automation of Electric Power Systems,2013,37(5):29-37(in Chinese).

[16] 李再华,白晓民,周子冠,.基于特征挖掘的电网故障诊断方法[J].中国电机工程学报,2010,30(10):16-22. Li Zaihua,Bai Xiaomin,Zhou Ziguan,et al.Method of power grid fault diagnosis based on feature mining[J].Proceedings of the CSEE, 2010,30(10):16-22(in Chinese).

[17] 刁赢龙,盛万兴,刘科研,.大规模配电网负荷数据在线清洗与修复方法研究[J].电网技术,2015,39(11):3134-3140. Diao Yinglong,Sheng Wanxing,Liu Keyan,et al.Research on online cleaning and repair methods of large-scale distribution network load data[J].Power System Technology,2015,39(11):3134-3140(in Chinese).

[18] 牛东晓,谷志红,邢棉,.基于数据挖掘的SVM短期负荷预测方法研究[J].中国电机工程学报,2006,26(18):6-12. Niu Dongxiao,Gu Zhihong,Xing Mian,et al.Study on forecasting approach to short-term load of SVM based on data mining[J].Proceedings of the CSEE,2006,26(18):6-12(in Chinese).

[19] 胡丽娟,刁赢龙,刘科研,.基于大数据技术的配电网运行可靠性分析[J].电网技术,2017,41(1):265-271. Hu Lijuan,Diao Yinglong,Liu Keyan,et al.Operational reliability analysis of distribution network based on big data technology[J].Power System Technology,2017,41(1):265-271(in Chinese).

[20] 张文俊. 配电网故障停电风险评估指标体系及评估方法研究[D].保定:华北电力大学,2014.

[21] 周湶,廖婧舒,廖瑞金,.含分布式电源的配电网停电风险快速评估[J].电网技术,2014,38(4):882-887. Zhou Quan,Liao Jingshu,Liao Ruijin,et al.Rapid assessment of power system blackout risk with distributed generation[J].Power System Technology,2014,38(4):882-887(in Chinese).

[22] 蒋玉娇,王晓丹,王文军,.一种基于PCA和ReliefF的特征选择方法[J].计算机工程与应用,2010,46(26):170-172. Jiang Yujiao,Wang Xiaodan,Wang Wenjun,et al.New feature selection approach by PCA and ReliefF[J].Computer Engineering & Applications,2010,46(26):170-172(in Chinese).

[23] 王雁凌,吴梦凯,周子青,.基于改进灰色关联度的电力负荷影响因素量化分析模型[J].电网技术,2017,41(6):1772-1778. Wang Yanling,Wu Mengkai,Zhou Ziqing,et al.Quantitative analysis model of power load influencing factors based on improved grey relational degree[J].Power System Technology,2017,41(6):1772-1778(in Chinese).

[24] 吴俊利,张步涵,王魁.基于Adaboost的BP神经网络改进算法在短期风速预测中的应用[J].电网技术,2012,36(9):221-225. Wu Junli,Zhang Buhan,Wang Kui.Application of adaboost-based bp neural network for short-term wind speed forecast[J].Power System Technology,2012,36(9):221-225(in Chinese).

[25] 栗然,刘宇,黎静华,.基于改进决策树算法的日特征负荷预测研究[J].中国电机工程学报,2005,25(23):36-41. Li Ran,Liu Yu,Li Jinghua,et al.Study on the daily characteristic load forecasting based on the optimized algorithm of decision tree[J].Proceedings of the CSEE,2005,25(23):36-41(in Chinese).

  • 目录

    图1