面向工程问题侦测背景信息关联性分析.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载!

SHANGHAI JIAO TONG UNIVERSITY 学士学位论文 THESIS OF BACHELOR 论文题目: 面向工程问题侦测的背景信息关联性分析 学生姓名: 王高鹏 学生学号: 5100209265 专 业: 工业工程 指导教师: 蒋祖华 学院(系): 机械与动力工程学院 面向工程问题侦测的背景信息关联性分析 摘要 情景的识别已经是工程领域一项重要课题,利用识别的问题情景,为工程师主动的推送知识,使工程师能够快速的获取知识,减少他们有哪些信誉好的足球投注网站知识的时间,降低他们打断思考的次数,使他们能够专注他们的研究,能够使工程师很大程度上提高他们的工作效率,尽最大可能的的发挥他们的潜能。 本文从工程师的历史邮件中获取问题情景,从工程师的邮件中获取问题情景是本文的研究重点。本文将收集到的几十份邮件作为训练集,利用文本分类算法中的决策树算法,利用支持向量机的方法把邮件文本表示为向量模型,基于词频-逆向词频和潜在语义空间两种方法计算邮件文本内容的相似度的聚类算法,将邮件进行分类,过滤掉非工程问题的邮件,将工程问题邮件保留,从中获取工程问题发生的背景信息,从这些背景信息中提取工程问题情景的关键词,用以进行情景的匹配和识别。 本文的最终目的是动态的预测工程师在收到一份工程邮件时,可能遇到的问题,进而为工程师推送相应的知识。我们通过决策树算法,聚类算法把邮件分类后,从分类后的工程邮件中提取工程问题发生的任务情景,从工程论坛抽取问答记录,建立工程问题情景库,将任务情境和问题情景库通过关键词算法匹配起来,找出和任务情境最相似的几个问题情景。把这几个问题的答案作为邮件任务情境的推送内容推送给工程师,通过设计的邮件知识推送界面来实现知识的推送。 关键词:决策树算法,聚类算法,情景识别,情景匹配 BACKGROUND INFORMATION CORRELATION ANALYSIS TOWARD engineering QUESTION DETECTION ABSTRACT It has been an important issue for identifying contextual information in the field of engineering.During the engineers’working process,using identify contextual information, initiatively to provide knowledge supply with engineers,which allows engineers quickly obtain relevant knowledge,reduce time that they search the knowledge,will reduce the number of times that interrupt their thinking,so that they can focus on their studies,thus greatly improve their work efficiency,make the best of their inspiration. This pape gets contextual from the history mail of engineers, this pape focuses on getting contextual from the history mail of engineers. This pape collects dozens of mail and takes them as the training set ,classify the mail based on decision tree Algorithm,representing the mail text for the vector model with SVM method,based on mail text similarity clustering Algorithm using TF-IDF and LSA method that filter out the non-engineering problems mail,keep the engineering problems mail,obtain background information of en

文档评论(0)

mghkfg58 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档