基于随机森林的高压电缆局部放电特征寻优

Random Forest Based Feature Selection for Partial Discharge Recognition of HV Cables

王干军1, 李锦舒2, 吴毅江1, 彭小圣2, 李黎2, 刘泰蔚2

1.广东电网有限责任公司中山供电局,广东省 中山市 528400

2.华中科技大学 电气与电子工程学院,湖北省 武汉市 430074

WANG Ganjun1, LI Jinshu2, WU Yijiang1, PENG Xiaosheng2, LI Li2, LIU Taiwei2

1. Zhongshan Power Supply Bureau of the Guangdong Power Grid Co., Ltd., Zhongshan 528400, Guangdong Province, China
2. School of Electrical and Electronic Engineering, Huazhong University of Science and Technology, Wuhan 430074, Hubei Province, China

  • 王干军(1978),男,广东电网公司中山供电局,高电压技术专业,从事输变电技术管理工作,熟悉电缆运行维护技术,E-mail:nwwanggj@163.com。

基金项目: 国家自然科学基金项目(51807072); 广东电网有限责任公司科技项目(GDKJXM20172769); National Natural Science Foundation of China (51807072); Project Supported by Science and Technology Project of Guangdong Power Grid Co; , Ltd; , (GDKJXM20172769);

文章编号: 1000-3673(2019)04-1329-07 中图分类号: TM721

摘要

高压电缆局部放电(简称局放)新特征的构建与优化选择是提升识别精度、优化识别效率、增强监测参数可视化效果的重要手段。提出了一种基于随机森林的局放特征优选新方法。在实验室构建了5种类型的电缆人工缺陷,通过加压测试获取局放原始数据,并提取了3500个局放脉冲和3500个典型干扰信号脉冲,构建了1235个局放特征。基于上述样本,开展了基于随机森林的特征寻优,分别获得了局放和干扰信号特征排序结果和不同类型局放信号的特征排序结果,并通过反向传播神经网络(back propagation neural network,BPNN)和支持向量机(support vector machine,SVM)对优选排序结果进行了验证。结果表明,局放和干扰识别的有效特征参数主要是表征信号快慢的特征和小波组合特征;不同类型局放识别的有效特征参数主要是小波组合特征。结果证明,随机森林算法是一种有效的电缆局放特征优选方法,并有望推广到其他电力设备局放的特征寻优。

关键词 : 局部放电; 特征选择; 随机森林; 高压电缆; 模式识别;

DOI:10.13335/j.1000-3673.pst.2018.2652

ABSTRACT

New feature construction and optimal feature selection of partial discharge (PD) pattern recognition for HV cables contribute not only to improvement of pattern recognition accuracy and efficiency, but also to PD parameter visualization of HV cable condition monitoring and diagnostics. In the paper, a novel random forest (RF) algorithm based optimal feature selection for PD pattern recognition of HV cables is proposed. Based on five types of artificial defects of 11 kV ethylene-propylene (EPR) cables, 3500 sets of transient PD pulses and 3500 sets of typical interference pulses are extracted. 1235 features in total are extracted. Then the RF based optimal feature selection for PD pattern recognition of HV cables is carried out. The feature ranking results of PD signals and interference signals as well as the ranking results of different PD signals are obtained and evaluated with pattern recognition methods based on back propagation neural network (BPNN) and support vector machine (SVM). Results show that, the wavelet combination features and the features describing “fast pulses” and “slow pulses” are effective features for identification of PD and interference signals. The wavelet combination features are attested to be effective for recognition of different types of PD signals. The RF method is proven effective for PD features selection of HV cables and is prospective to be applied to PD feature selection of other HV power apparatus.

KEY WORDS : partial discharge; feature selection; random forest; HV cables; pattern recognition;

0 引言

高压电缆局部放电(简称局放)[1]新特征构建与优选,对局放和干扰的识别以及不同类型局放信号识别具有重要的意义。第1,对局放和干扰的识别,若干有效新特征的优选,能提升识别的精度,增强信号可视化效果。例如文献[2]中的T-W Mapping方法就是采用等效时间长度(equivalent time length,T)和等效带宽(equivalent bandwidth,W)2个核心特征来表征快脉冲和慢脉冲,以实现局放和干扰的识别。该研究成果被局放检测领域学者跟踪研究,并在工业监测系统中获得广泛的应用[3-6]。第2,对不同类型局放的识别,特征寻优能在保证识别率的前提下,提升识别的效率。现有文献中提出的局放特征包括:单个脉冲波形特征、统计特征、谱图特征、分形特征、序列特征、数字图像特征等,高达数百种[7-10]。将这些特征全部作为人工智能方法的输入参数,将带来维数灾,对识别方法的训练带来很大的难度。通过特征寻优,获得特征有效性排序,并进一步研究特征个数和识别率之间的关系,得到识别率上限对应的特征个数,将有效提升模式识别方法的效率。

特征寻优方法包括ReliefF、最大相关最小冗余算法、SVM递归算法、遗传算法等,已经广泛应用在各个领域的数据处理中[10-13]。文献[10]采用线性和非线性特征分析技术对电缆局放信号进行特征提取,并基于改进的最大相关最小冗余算法进行最优特征子集的选择。文献[11]提出基于ReliefF算法和灰色关联分析的改进G-Relief特征选择算法,并实现了配电网故障特征的最优选择。文献[12]将支持向量机递归特征选择算法和最佳优先搜索算法相结合用于暂态稳定评估中,实现了最优特征子集选择。文献[13]提出基于遗传算法的迭代特征选择算法用于图像轮廓特征的搜索中,每轮迭代都从原始特征集中选择特征子集,并利用SVM和随机森林对优选的特征子集进行了评估。

近年来,随机森林算法在许多领域的特征选择中取得了较好的效果,例如微阵列数据分析中的基因选择[14]、网络入侵检测系统[15]、光谱数据[16]等领域的特征选择。该方法的突出优点在于:1)随机森林的特征优选是在随机森林的训练过程中自动进行的,计算复杂度低,易于实现。2)随机森林算法的构建过程中应用了随机选择样本和随机选择特征2个随机性,因而其泛化能力较强,特征优选结果准确性高。

本文采用随机森林算法,用于高压电缆局放特征优选,并通过实验室数据进行了验证,分析得到了表征局放的新特征。结果表明,随机森林是一种有效的电缆局放特征优选方法,可以推广到其他电力设备局放特征寻优的研究。

1 随机森林

1.1 随机森林原理

随机森林是由美国科学家Leo Breiman提出的一种以决策树作为基分类器的集成机器学习算法[17-18]

随机森林训练步骤如下:

步骤1:通过bootstrap重抽样方法,由原始样本集产生k个训练样本集和k个袋外(out-of-bag,OOB)数据集。

步骤2:从特征变量中随机选择部分特征组成特征子集,再从特征子集中选取最优特征,以此作为决策树节点的分裂属性。

步骤3:基于bootstrap训练集和抽取的特征子集训练一颗决策树,k个训练样本集分别训练得到k颗决策树。

步骤4:将每一颗决策树的输出结果线性集成得到随机森林整体的输出。

由于步骤2中存在“最优分裂特征”的选择过程,随机森林在训练过程中对每个特征进行了评判。随机森林特征重要性度量的方法应用最广泛的是“排序重要性”。其依据是OOB数据中某个特征标签改变之前和之后,随机森林模型分类误差率的变化情况[15]

1.2 基于随机森林的局部放电特征寻优流程

基于随机森林的局放特征寻优流程如图1所示。该流程分为3个阶段,分别为实验数据获取和特征提取、基于随机森林的特征寻优以及特征寻优结果验证。

图 1 基于随机森林的局放特征寻优流程 Fig. 1 Flowchart of random forest based optimal feature selection for partial discharge pattern recognition

第1阶段为实验数据获取和特征提取。本文对11 kV乙丙橡胶(ethylene propylene rubber,EPR)电缆设置5种类型的人工缺陷。加压后利用高频电流互感器(high frequency current transformer,HFCT)获取原始数据,并基于该数据提取了3500个干扰脉冲和3500个局放脉冲。其中局放样本分为5类,每类局放样本数目均为700个。详细的实验方法见文献[19-20]。然后基于提取的局放脉冲和干扰脉冲进行1维特征提取和2维、3维特征构建。共提取1维特征34个,构建2维、3维特征分别为119个和1082个,每个脉冲特征共计1235个。

第2阶段为基于随机森林的特征寻优。本文基于bootstrap样本集进行决策树分类模型的训练,并利用该模型对相应的OOB数据集进行分类,统计正确分类个数。同时改变OOB数据集中待度量特征标签,对特征标签改变后的OOB数据集进行分类。计算特征标签改变之前和之后的袋外误差率差值,即为待度量特征的重要性得分。

第3阶段为特征寻优结果验证,分为以下2个方面:

1)基于局放信号和干扰信号的特征寻优结果验证。采用SVM和BPNN 2种方法对特征重要性排序结果进行有效性验证。并通过特征的2维可视化,分析局放的核心表征特征。

2)基于5种不同类型局放信号的特征寻优结果验证。采用SVM和BPNN对特征重要性排序结果进行有效性验证。

2 实验数据获取和特征提取

2.1 实验设置

11 kV实验电缆的结构如图2所示。实验设置的5种人工缺陷如图3、图4所示。

图2 EPR电缆样品结构 Fig. 2 Construction of the EPR cable

类型1模拟的是电缆绝缘中从电缆外部到绝缘层的空隙缺陷。如图3(a)所示,本文实验使用0.4 mm直径的钻孔机给EPR电缆样品钻孔,并用铜带将孔密封。

类型2和类型3模拟的是金属尖刺缺陷。如

图3(b)和图3(c)所示,将钻头钻入电缆,在缺陷类型2中尖刺和外半导电层、屏蔽铜带、铝铠装层以及聚氯乙烯(polyvinyl chloride,PVC)外护套相接触。而缺陷类型3中的尖刺是悬浮的,并没有与铝铠装层、PVC外护套相接触。

类型4模拟的是外半导电层上的缺口缺陷。如图3(d)所示,本文实验通过在电缆外半导电层、铝铠装层、PVC外护套层上切除一个7 mm×7 mm的区域来模拟类型4缺陷。

类型5模拟的是电缆终端附近的沿面放电。如图4所示,实验通过暴露样品的屏蔽铜带并使其接地的方式来模拟类型5缺陷。

图3 缺陷类型 Fig. 3 Defect type

图4 缺陷类型5:电缆终端放电 Fig. 4 Defect type 5: surface discharge around end termination

根据5种缺陷的产生机理,缺陷类型1和类型5与其他3种类型的缺陷产生原因有很大不同,信号的差异性比较大,识别难度小。但类型2和类型3缺陷的产生原因都是导电层上的尖刺,因此这2类缺陷诱发的局放信号相似度比较高,信号的特征选择难度大,识别难度大。

为获取不同类型的局放信号,对每类缺陷进行加压测试,电压以1 kV为步长从0 kV升到13 kV。记录不同电压水平时的原始数据。局放测试电压与每类缺陷数据量的关系如表1所示。

2.2 干扰信号和局放信号的分离

在上述获取的原始数据中,包含大量的干扰信

表1 局放测试电压与每类缺陷数据量关系 Tab. 1 PD test voltage and number of sets of 20 ms data for each defect

号,且干扰信号种类繁多。基于时域波形特征可将检测到的干扰信号大致分为3类:白噪声、周期性干扰信号和随机脉冲干扰信号[19,21]。因此本文基于IEC60270系统,采用基于同步检测和多信息融合的脉冲识别方法,对已获取的原始数据进行脉冲提取,实现原始数据中局放信号和干扰信号的分离,详细的实验方法见文献[19]。共提取3500个干扰脉冲和3500个局放脉冲,其中局放脉冲共分为5类,每类局放脉冲数目均为700个。

局放类型2和干扰信号的最大幅值局放相位图谱(phase resolved partial discharge,PRPD)如图5所示。5种类型局放信号的放电幅值PRPD图谱如

图6所示。

图5 局放类型2脉冲最大幅值的PRPD谱图 Fig. 5 PRPD of maximum voltage from defect type 2

图6 5类局放信号放电幅值的PRPD谱图 Fig. 6 PRPD of discharge magnitude from five types of PD signals

2.3 特征提取和构建

本文在实验结果的基础上对11 kV EPR电缆中5种类型人工缺陷诱发的3500个局放信号和3500个干扰信号进行特征提取和特征构建。提取出的一维特征有34个,如表2所示,包括1个位置参数(相角)、5个幅值参数(电压峰值、电压均值、均方根值、标准差、放电幅值)、5个时间参数(信号宽度、上升时间、下降时间、T、W)、16个小波参数(ED1,ED2, ED3,ED4,ED5,EA5,Ea1,Ea2,Ea3,Ea4, Ea5,Ed1,Ed2,Ed3,Ed4,Ed5)、偏度与峰度、波形因素与波峰因素、主频、测试电压、极性。

表2 一维局放特征 Tab. 2 Extraction of one-dimensional PD features

表3 16个小波参数的含义 Tab. 3 Details of 16 wavelet features

基于上述34个1维特征构建了119个2维特征和1082个3维特征。2维特征的构建方法有3种:1)2个同类型一维特征的比值,共82个;2)1维特征的平方,共31个;3)幅值参数或位置参数与极性的乘积,共6个。同理,3维特征的构建方法也有3种:1)3个同类型1维特征的比值,共960个;2)1维特征的立方,共31个;3)2维非极性特征与极性的乘积,其中2维非极性特征仅用幅值参数比值、小波参数比值、幅值参数平方、小波参数平方4类2维特征,此类特征共91个。2维和3维局放特征如表4所示。

表4 2维和3维局放特征 Tab. 4 Two-dimensional and three-dimensional PD features

3 特征寻优的结果

基于第2节获取的局放数据,采用图1所示的流程分别对高压电缆局放信号和干扰信号以及不同类型局放信号进行了特征寻优。

3.1 干扰信号和局放信号的特征寻优结果
3.1.1 特征排序结果

基于随机森林的局放信号和干扰信号特征重要性排序结果的前10个特征分别为Ea4/Ed1、W/上升时间/T、下降时间/W/信号宽度、T/W、下降时间/信号宽度/W、EA5/ED1/ED2、信号宽度/W/TW/T/信号宽度、T/W/信号宽度和T/上升时间/WWT特征排名分别为30和78。更多特征的重要性排序结果见附录表A1。排序结果显示,识别局放信号和干扰信号的有效特征参数主要是表征信号快慢的特征和小波组合特征。表征信号快慢的特征主要是与TW、上升时间、下降时间以及信号宽度等相关的特征。有效的小波组合特征主要包括Ea4/Ed1、EA5/ED1/ED2等。

3.1.2 基于特征排序结果的模式识别验证

本文基于局放和干扰特征排序结果,取重要性排名前600个特征,每100个特征分为1组,将

6组特征分别作为模式识别算法的输入参数,以识别精度的变化来评估随机森林模型特征寻优的有效性,识别结果如图7所示。图中横坐标表示6组特征编号,编号1~6分别表示排名为501-600、401-500、301-400、201-300、101-200和1-100的特

图7 局放和干扰模式识别结果 Fig. 7 Results of pattern recognition of PD signals and interference signals

征。即分组编号越大的特征表明随机森林中特征重要性排名越靠前。

图7显示,随着分组编号的增大、特征重要性排名的升高,SVM和BPNN识别精度都呈现出上升的趋势。第6组特征集在SVM和BPNN下的识别精度比第1组的识别精度分别高出52.13%和58.72%。结果表明,随机森林特征选择方法是高压电缆局放信号和干扰信号特征优选的有效方法。

3.1.3 基于特征排序结果的特征可视化验证

基于特征重要性度量结果,选择排名前20的特征进行相关性分析,选择重要性分值高且相关度不强的特征做可视化评估,结果如图8所示。

图8 可视化验证(局放信号VS干扰信号) Fig. 8 Results of visual verification of PD signals and interference signals.

由于2号特征和3号特征相关度很强,因此

图8(a)选取1号特征“Ea4/Ed1”和3号特征“下降时间/W/信号宽度”进行可视化。图8(b)是典型的T-W映射方法。图8(a)和图8(b)对比分析的结论如下:

1)干扰信号在“Ea4/Ed1”和“下降时间/W/信号宽度”下的聚集程度比在TW下的聚集程度更加理想,说明“Ea4/Ed1”和“下降时间/W/信号宽度”对于干扰信号的识别有很大的可能性是优于TW的。因此可将“下降时间/W/信号宽度”和小波组合特征“Ea4/Ed1”作为区分局放和干扰的核心表征特征,应用于干扰信号抑制。

2)局放信号在“Ea4/Ed1”和“下降时间/W/信号宽度”下的聚集范围比在TW下的聚集范围更广,而更加广的局放聚集范围更有利于不同类型局放信号的分析和识别,因此“Ea4/Ed1”和“下降时间/W/信号宽度”可应用于不同类型局放信号的识别和可视化分析中。

3.2 不同类型局放信号的特征寻优结果
3.2.1 特征排序结果

基于随机森林的不同类型局放信号特征重要性排序结果的前13个特征分别为Ed5/Ed3/Ea5、Ed3/Ea4/Ea2、Ed5/Ed3/Ea1、Ed3/Ea4/Ea3、Ed5/Ea5/ Ed3、Ed3/Ea3/Ea4、测试电压、Ed5/Ea2/Ed3、Ed3/ Ea4/Ea1、Ed3/Ea2/Ea4、Ed5/Ed4/Ed3、Ed5/Ed3/Ea2和相角与极性的乘积。更多特征的重要性排序结果见附录表A2。排序结果显示,小波组合特征排名靠前,是不同类型局放识别的有效特征参数。

根据表1中局放测试电压与各类局放样本数量的关系可得出:当测试电压为5 kV时,50组局放样本的缺陷类型均为类型1;当测试电压为13 kV时,52组局放样本的缺陷类型均为类型2。因此仅通过“测试电压”这一特征就可从原始样本中区分出7.27%的样本,说明“测试电压”是识别各类型局放的有效特征。特征排序结果显示,“测试电压”在1235个特征中排名为第7,即“测试电压”是重要特征。该结果与表1所得结论一致,证明了基于随机森林特征寻优方法的有效性。

“相角与极性的乘积”特征是识别局放的有效特征,被广泛应用于局放的相位图谱分析中。特征排序结果显示,“相角与极性的乘积”在1235个特征中排名为第13,即“相角与极性的乘积”是重要特征。该结果与业界公认的相位图谱分析方法一致,证明了基于随机森林特征寻优方法的有效性。

3.2.2 基于特征排序结果的模式识别验证

采用与3.1.2节中一致的方法,通过选择不同的特征集合作为BPNN、SVM 2种模式识别算法的输入特征,以识别精度的变化来评估随机森林特征寻优的有效性,结果如图9所示。

图9可知,识别率与特征重要性排序的梯度规律大体是一致的。随着分组编号的增大,特征重要性排名的升高,SVM和BPNN识别精度都呈现出上升的趋势。且第6组特征集在SVM和BPNN下的识别精度比第1组的识别精度分别高出28.82%和24.37%。这些结果表明,随机森林特征选择方法是高压电缆不同类型局放信号特征优选的有效方法。

图9 5类局放模式识别结果 Fig. 9 Results of pattern recognition of five types of PD signals

4 结论

本文提出基于随机森林的高压电缆局放特征选择方法,并通过实验数据对该方法进行了验证,所得结论如下:

1)基于BPNN和SVM 2种模式识别方法的验证结果表明,随机森林特征选择方法是高压电缆局放信号和干扰信号特征优选的有效方法,也是高压电缆不同类型局放信号特征优选的有效方法。

2)局放信号和干扰信号的特征寻优结果表明,识别局放信号和干扰信号的有效特征参数主要是表征信号快慢的特征和小波组合特征。表征信号快慢的特征主要是与TW、上升时间、下降时间以及信号宽度等相关的特征。有效的小波组合特征主要包括Ea4/Ed1、EA5/ED1/ED2等。

3)不同类型局放信号的特征寻优结果表明,小波组合特征排序靠前,是不同类型局放识别的有效特征参数。

4)局放信号和干扰信号的可视化评估结果表明,与T-W映射相比,干扰信号在“Ea4/Ed1”和“下降时间/W/signal width”下的聚集程度更好,有利于干扰信号的抑制;不同类型局放信号在“Ea4/

Ed1”和“下降时间/W/信号宽度”下的聚集范围更广,有利于不同类型局放信号的可视化分析。因此“Ea4/Ed1”和“下降时间/W/信号宽度”这2个特征参数有较大的可能性优于传统的TW,需要进一步通过更多数据的检验。

本文局放和干扰的特征寻优采用的样本都是实验室样本。通过工业现场典型的干扰信号和局放信号,开展特征寻优,挖掘对工业现场局放监测有参考价值的核心表征特征集合,值得进一步研究。

附录见本刊网络版(http://www.dwjs.com.cn/CN/volumn/current.shtml)。

附录A

表A1 局放信号和干扰信号的特征重要性排序 Tab. A1 Sorted scores of feature importance for PD signals and interference signals

表A2 5种类型局放信号特征重要性排序 Tab. A2 Sorted scores of feature importance for five types of PD signals

参考文献

[1] 张强,李成榕.X射线激励下局部放电的研究进展[J].电工技术学报,2017,32(8):22-32. Zhang Qiang,Li Chengrong.Review on X-Ray induced partial discharge[J].Transactions of China Electrotechnical Society,2017,32(8):22-32(in Chinese).

[2] Montanari G C,Cavallini A,Puletti F.A new approach to partial discharge testing of HV cable systems[J].IEEE Electrical Insulation Magazine,2006,22(1):14-23.

[3] Contin A,Pastore S.Classification and separation of partial discharge signals by means of their auto-correlation function evaluation[J].IEEE Transactions on Dielectrics & Electrical Insulation,2009,16(6):1609-1622.

[4] 鲍永胜. 局部放电脉冲波形特征提取及分类技术[J].中国电机工程学报,2013,33(28):168-175. Bao Yongsheng.Partial discharge pulse waveform feature extraction and classification techniques[J].Proceedings of the CSEE,2013,33(28):168-175(in Chinese).

[5] Chan J C,Ma H,Saha T K.Time-frequency sparsity map on automatic partial discharge sources separation for power transformer condition assessment[J].IEEE Transactions on Dielectrics & Electrical Insulation,2015,22(4):2271-2283.

[6] Ren M,Dong M,Ren Z,et al.Transient earth voltage measurement in PD detection of artificial defect models in SF6[J].IEEE Trans-actions on Plasma Science,2012,40(8):2002-2008.

[7] 李刚,汪可,张书琦,.变压器油纸绝缘沿面放电缺陷发展特征及阶段识别方法[J].电网技术,2018,42(10):3451-3458. Li Gang,Wang Ke,Zhang Shuqi,et al.Evolution characteristics and stage recognition method of surface discharge defects of oil-paper in-sulation in transformer[J].Power System Technology,2018,42(10):3451-3458(in Chinese).

[8] 杨帆,杨旗,程鹏,.电缆接头内部气隙放电缺陷下的绝缘劣化程度表征方法[J].电工技术学报,2017,32(2):24-32. Yang Fan,Yang Qi,Cheng Peng,et al.Study of cracking extent for gap discharge in insulating material of power cable joint[J].Transactions of China Electrotechnical Society,2017,32(2):24-32(in Chinese).

[9] Firuzi K,Vakilian M,Darabad V P,et al.A novel method for differentiating and clustering multiple partial discharge sources using S transform and bag of words feature[J].IEEE Transactions on Dielectrics & Electrical Insulation,2018,24(6):3694-3702.

[10] 杨丰源,许永鹏,钱勇,.相关分析技术在直流电压下XLPE电缆局部放电信号特征提取与筛选中的应用[J].电网技术,2018,42(5):1653-1660. Yang Fengyuan,Xu Yongpeng,Qian Yong,et al.Application of correlation analysis techniques in feature extraction and selection for DC partial discharge signals of XLPE cables[J].Power System Technology,2018,42(5):1653-1660(in Chinese).

[11] 张稳,盛万兴,刘科研,.计及天气因素相关性的配电网故障风险等级预测方法[J].电网技术,2018,42(8):2391-2398. Zhang Wen,Sheng Wanxing,Liu Keyan,et al.A prediction method of fault risk level for distribution network considering correlation of weather factors[J].Power System Technology,2018,42(8):2391-2398(in Chinese).

[12] 叶圣永,王晓茹,刘志刚,.基于支持向量机的暂态稳定评估双阶段特征选择[J].中国电机工程学报,2010,30(31):28-34. Ye Shengyong,Wang Xiaoru,Liu Zhigang,et al.Dual-stage feature selection for transient stability assessment based on support vector machine[J].Proceedings of the CSEE,2010,30(31):28-34(in Chinese).

[13] Pedergnana M,Marpu P R,Mura M D,et al.A novel technique for optimal feature selection in attribute profiles based on genetic algorithms[J].IEEE Transactions on Geoscience & Remote Sensing,2013,51(6):3514-3528.

[14] Pang H,George S L,Hui K,et al.Gene selection using iterative feature elimination random forests for survival outcomes[J].IEEE/ACM Transactions on Computational Biology & Bioinformatics,2012,9(5):1422-1431.

[15] Hasan M A M,Nasser M,Ahmad S,et al.Feature Selection for Intrusion Detection Using Random Forest[J].Journal of Information Security,2016,7(3):129-140.

[16] Menze B H,Kelm B M,Masuch R,et al.A comparison of random forest and its Gini importance with standard chemometric methods for the feature selection and classification of spectral data[J].BMC Bio-informatics,2009,10(1):1-16.

[17] Breiman L.Random forests[J].Machine Learning,2001,45(1):5-32.

[18] 方匡南,吴见彬,朱建平,.随机森林方法研究综述[J].统计与信息论坛,2011,26(3):32-38. Fang Kuangnan,Wu Jianbin,Zhu Jianping,et al.A review of technologies on random forests[J].Statics & Information Forum,2011,26(3):32-38(in Chinese).

[19] Peng X,Wen J,Li Z,et al.SDMF based interference rejection and PD interpretation for simulated defects in HV cable diagnostics[J].IEEE Transactions on Dielectrics & Electrical Insulation,2017,24(1):83-91.

[20] Peng X,Wen J,Li Z,et al.Rough set theory applied to pattern recognition of partial discharge in noise affected cable data[J].IEEE Transactions on Dielectrics & Electrical Insulation,2017,24(1): 147-156.

[21] 张冠军,朱明晓,王彦博,.基于可移动特高频天线阵列的变电站站域放电源检测与定位研究[J].中国电机工程学报,2017,37(10):2761-2773. Zhang Guanjun,Zhu Mingxiao,Wang Yanbo,et al.Detection and localization of discharge sources in substation area using movable UHF antenna array[J].Proceedings of the CSEE,2017,37(10):2761-2773(in Chinese).

[22] 周凯,赵世林,何珉,.考虑短距离电缆中行波特性的振荡波局部放电定位方法[J].电网技术,2017,41(6):2047-2054. Zhou Kai,Zhao Shilin,He Min,et al.An oscillating wave test method based on traveling wave characteristics of partial discharges for defect location in short cables[J].Power System Technology,2017,41(6):2047-2054(in Chinese).

  • 目录

    图1