浅析数据挖掘在化学化工中的研究进展.docVIP

浅析数据挖掘在化学化工中的研究进展.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析数据挖掘在化学化工中的研究进展.doc

  浅析数据挖掘在化学化工中的研究进展   随着数据库技术的不断发展,各行各业所积累的数据也越来越多,人们已不能满足数据表面所提供的信息,并且逐渐开始尝试挖掘出大量数据背后所隐藏的更加有用的信息,数据挖掘技术便由此应运而生。随后,数据挖掘技术便在信息产业和商业服务等领域产生了重大影响,人们利用数据挖掘技术从所积累的数据库中得到了过去所不可能获取的知识。随着数据挖掘技术取得成效之后,许多不同领域的研究人员也显示出了极大的兴趣。   自计算机诞生以来,信息技术便不断地推动着化工行业的发展。信息化时代的到来,促进了信息技术和化学工业的进一步结合,为数据挖掘技术在化工领域的应用打下了坚实的基础。随着大数据时代的来临,数据挖掘技术势必会对化学与化工领域产生更加深远、更加全面的影响。近年来,很多研究者针对以往积累的数据,将数据挖掘技术运用到自己的研究课题中,取得了很多极具应用价值的研究成果。本文通过整合近年来数据挖掘技术在化学化工领域所取得的突破性进展,评述了数据挖掘技术在化工建模、工艺条件的优化、数据库平台的创建和安全生产等方面的应用。   1 数据挖掘技术   数据挖掘技术是智能系统理论的重要内容,同样也是数据库处理的重要的技术手段。它是利用关联规则、分类、聚类等分析方法从大量无序的、存在噪声的、冗余的或缺损的数据中提取出有用的潜在信息,并为进一步的研究提供数据支撑的数据库处理技术。数据挖掘技术的操作流程一般为: 信息收集、数据集成、数据预处理、数据挖掘过程、模式评估和知识表示几个阶段。其中数据挖掘过程为该流程的技术核心,运用的主要方法有: 统计方法、决策树、规则推理、模糊集、遗传算法、神经X络、主元分析、偏最小二乘法等。   2 数据挖掘在化学化工中的应用   2. 1 化工建模的应用   化工过程建模一直是化工领域的难点。因为在实际过程中,化工过程系统的很多条件因素具有交互性和严重的非线性,因此化工过程建模具有很大的困难。然而数据挖掘技术具有丰富的算法,神经X络算法能够以任意精度逼近任意非线性映射,对处理含噪声和非线性数据具有较大的优势; 遗传算法在解决非线性问题时不依赖于问题模型的特性,不仅具有鲁棒性和全局最优性,还具有高效率和可并行性等特点; 主元分析在解决非线性数据时能够做到数据简化、数据压缩、建模等; 偏最小二乘法对多因变量对多自变量的回归建模具有较为明显的优势。   孔德根等对18 种酚类化合物的量子化学参数进行了优化计算,采用多元线性回归分析和人工神经X络反传误差算法,研究了酚类化合物对抑制黑曲霉毒性的定量构效关系,并采用去一法通过对模型的预测能力和稳健性的验证筛选出了最佳的计算模型。分析表明酚类化合物的分子体积和苯环上的净电荷增量与其对黑曲霉的抑制毒性呈正相关,而最低空轨道能与黑曲霉的抑制毒性呈负相关。该文章的建模方法为评估和预测其他化合物对抑制黑曲霉的毒性提供了参考。   林凌等提出了一种针对体表组织内进行的高谱图技术。该技术通过对组织内的光谱信息和图像信息等多元信息进行关联,然后采用数据挖掘技术,对数据和病症进行分析建模。通过该模型挖掘出组织的图像、光谱以及二者交互项与疾病之间的关系,大大提高了临床皮肤病的诊断精度和准确度。还能够有效地改善光谱技术和光学相干层析技术对组织成分和位置信息探测不足和缺乏系统性、多元性等局限性,为皮肤病的早期诊断提供了技术支撑,并且对人体内更深层组织以及器官的检测提供了思路。   Kusiak 等通过收集2008 ~ 2010 年间甲烷生产的工业数据,对甲烷生产的参数进行了探究,采用自适应神经模糊推理系统( ANFIS) 对甲烷的生产预测进行建模。并通过百分比误差、偏差因子、均方根误差、归一化均方根误差和一致性指数等五个指标对该模型进行了评估。结果表明,利用自适应神经模糊推理系统所建立的模型性能优异,所预测的数据与实测值显示出了高度的一致性。与采用神经X络、支持向量机、随机森林等算法所建立的甲烷生产预测模型比较也显示出了更好的预测精度。该模型不仅能够对甲烷的生产过程进行更准确的模拟和预测,而且能够指导并优化甲烷的生产过程。   刘天玲等采用主成分分析、局部线性嵌入、支持向量机、偏最小二乘和小波变换五种模式识别方法,利用NIR 技术建立了玉米种子的分类识别模型。该模型已成功运用于108 玉米杂交种和母本178 种子的识别,而且具有较高的识别精度和分类精度。Rommel 等提出了一种基于机器学习算法和电感耦合等离子体质谱法测定有机甘蔗样品真实性的识别模型。该模型可以采用Random Forest 和Naive Bayes 算法对样品进行分析识别,RandomFores 算法通过检测32 个化学元素作为参考,准确率约为90%; Naive Bayes 算法只需检测8 个化学元素作为参考,但是

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档