- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
PAGE33
基于LightGBM算法的变压器故障诊断实证分析案例
目录
TOC\o1-3\h\u28682基于LightGBM算法的变压器故障诊断实证分析案例 1
128521.1引言 1
320701.2LightGBM诊断模型的构建 2
87801.2.1直方图算法 2
122191.2.2GOSS单边采样法 3
93031.2.3EFB特征降维法 4
308361.2.4带有深度约束的leaf-wise叶子节点生成策略 5
31311.3基于重要度分析的特征筛选 5
283491.4基于LightGBM的变压器故障诊断流程 6
171881.5算例分析 7
45711.5.1故障数据集的建立 7
171221.5.2评价指标 8
54921.5.3诊断结果 9
300091.5.4特征筛选 10
302541.5.5基于贝叶斯网络的超参数优化 12
241831.5.6算法对比与数据分析 15
1.1引言
DGA方法能够通有效发现变压器内部的故障情况,但传统故障诊断方法精度较低,对处于不同故障的DGA数据间分界较为模糊。鉴于变压器故障诊断问题本质上为多分类问题,与集成学习中性能优秀的LightGBM算法所涉范围相重合,本章提出一种基于LightGBM的变压器故障诊断方法。对LightGBM及其相对于梯度提升树的改进进行介绍,利用其在分类问题上的优势,构建起基于LightGBM的故障诊断模型;基于信息增益与特征使用次数的重要度分析,对5种原始DGA气体含量特征与9种比值特征相结合的14种故障相关特征进行特征筛选;最后将LightGBM模型与其他传统方法进行对比,并进行模型参数优化,从而证明所提出模型具有良好的分类性能。
1.2LightGBM诊断模型的构建
LightGBM是一种基于决策树算法的梯度提升框架,属于集成学习的Boosting方法。该方法相比于GBDT做出了大量改进,对决策树的最优分割点有哪些信誉好的足球投注网站机制和叶子节点展开方法进行了大量优化,在保证准确度的同时,提高运算速度并减少内存消耗。LightGBM采用直方图算法进行最优分割,引入GOSS算法对大梯度样本进行强化训练,获取更大信息增益,使用EFB算法对高维复杂特征进行特征捆绑降维,从而对直方图复杂度进行简化,同时使用带有深度约束的Leaf-wise方法对叶子节点展开方式进行优化来提高模型精度以及防止过拟合[78]。
1.2.1直方图算法
对于GBDT的基学习器决策树而言,最优分裂点的的选择是核心问题。传统Boosting算法中对每一个特征都要扫描所有的样本点进行预排序,并选择最优分裂点,虽然能够较为准确地找到分裂点,但耗时很大并且需要较大的内存容量。LightGBM采取直方图算法寻找最优分割点,将连续的特征值转化为直方图。首先将特征值进行分桶,即转换K个整数,得到一个宽度为K的直方图,然后遍历训练数据,统计每个离散值在直方图中的累计统计量。在进行特征选择时,只需根据直方图的离散值来遍历寻找最优的分裂点。这种方法可以有效简化数据的表达,并带来一定正则化的效果,从而减少内存的使用,并且避免过拟合。直方图算法的数据转换方式如图4-1所示。
图4-1直方图算法数据转换方式
直方图算法的分裂流程为:
Step1:对于每棵树中的所有叶子节点,对14种DGA气体特征进行遍历,寻找增益最大的特征和划分值,以此为依据进行分裂;
Step2:针对每一个DGA气体特征构造相应的直方图,直方图中保存每个分桶中样本的梯度之和和样本数量两类数据。循环遍历所有样本,将这两类数据添加到各自的分桶中;
Step3:遍历所有分桶,分别以当前分桶作为分裂点,按照公式(4-1)计算分桶的增益值:
(4-1)
式中,为增益值,为左侧分桶和当前分桶的梯度之和,为左侧样本数,为父节点总梯度之和,为总样本数,为右侧分桶梯度之和,为右侧样本数量。选取最大增益,并将最大增益处的特征和分桶值作为最优分裂点。
直方图算法在选择最优分裂点时只需遍历K个分桶,而不需对该叶子节点的全部数据进行遍历,模型的训练速度大大加快。
1.2.2GOSS单边采样法
直方图算法可以提升训练效率,但仍可在计算梯度以及减少特征维度方面来简化构建直方图时的复杂度。LightGBM分别使用GOSS算法与EFB算法来完成上述优化。
GOSS算法全称为基于梯度的单边采样,核心在于留下全部大梯度样本,随机抽取小梯度样本。小梯度样本点的信息增益有限,因此在采样时随机保留小梯度,从而在提升效率的同时减少模型精度的损失。GOSS算法的步骤如图4-2所示,其中a、b分别表
您可能关注的文档
- 2025《发动机噪声品质主客观评价实验探究报告》2800字.docx
- 2025《水滴模板法及其多级阵列结构的制备与应用研究文献综述》2500字.docx
- 2025《单片机心率体温报警装置的软件设计案例概述》1100字.docx
- 2025《电动机软启动系统的PLC控制硬件和软件系统设计案例》4100字.docx
- 2025《提高员工素质对仓储管理效能的影响分析》13000字(论文).doc
- 2025《上海某业务中心空调工程防火排烟设计计算案例》2800字.docx
- 2025《基于PLC的排水设备监控系统中传感器选型分析案例》3500字.docx
- 2025《健安喜股份有限公司利润质量分析》11000字(论文).doc
- 2025《某六轴喷涂机器人手臂的结构设计计算案例》1200字.docx
- 2025《小学建筑电气设计中的人性化考量》11000字(论文).doc
- 2025华润燃气投资(中国)有限公司校园招聘笔试历年参考题库附带答案详解.docx
- 2025贵州黔东南州台江县苗疆粮油购销储备有限责任公司招聘拟聘用人员笔试历年参考题库附带答案详解.docx
- 2025中国兵器工业集团有限公司所属企业总经理招聘3人笔试历年参考题库附带答案详解.docx
- 2025金地物业管理有限公司西北区域公司招聘笔试历年参考题库附带答案详解.docx
- 2025甘肃陇南银联商务支付股份有限公司分公司招聘笔试历年参考题库附带答案详解.docx
- 2025黑龙江哈尔滨工业大学机电工程学院精密工程研究所招聘笔试历年参考题库附带答案详解.docx
- 2025广西壮族自治区河池水利电力勘测设计研究院公开招聘专业技术人员9人笔试历年参考题库附带答案详解.docx
- 2025江西吉安遂川县城控人力资源管理有限公司招聘巡检员2人笔试历年参考题库附带答案详解.docx
- 2025浙江嘉兴海宁云杉建筑设计有限公司招聘7人笔试历年参考题库附带答案详解.docx
- 2025重庆人力资源发展有限公司所属子企业重庆市子漫人力资源服务有限公司物业部副部长家政培训服务部副部长社会招聘延长笔试历年参考题库附带答案详解.docx
最近下载
- 金属非金属矿山安全标准化规范地下矿山实施.doc VIP
- 工厂物料计划编制:流程、规范、4大编制方案.docx VIP
- 2025年预防接种技能竞赛预防接种管理测试题及答案.docx VIP
- YB-4001.1-2007钢格栅板及配套件-第1部分:钢格栅板(中文版).docx VIP
- 全国预防接种技能竞赛理论训练题库及答案(传染病学基础154题).docx VIP
- 环氧树脂的吸水研究.doc VIP
- 全国预防接种技能竞赛理论训练题库及答案冷链系统管理(89题).docx VIP
- 集装箱码头装卸作业与业务管理.pptx
- 闽楠轻基质容器育苗技术规程.pdf VIP
- 全国预防接种技能竞赛理论训练题库及答案(预防接种管理447题).docx VIP
文档评论(0)