资料探勘与知识发现 期末专案报告.pptVIP

资料探勘与知识发现 期末专案报告.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2008/6/17 * 研究趨勢預測 在研究趨勢的預測部分,不單是以過往資料作為預測未來趨勢的基準,也要同時以過往資料作為淘汰過時或是不適合的研究議題或是領域,如此才能在研究領域中找出創新的切入點與良好的洞察力 對於一般支援贊助相關計畫或是研究的單位,這會是一個非常良好的決策依據 主題發展 在主題發展的部分,一則是結合研究趨勢的預測,二則是對於雖然非當時其大部份的研究相關計畫,但是卻是具有前瞻的領導發展探究,以特定的主題方式進行分析,對於前瞻領導計劃的推導具有一定的依據說明 因此,運用本研究的方式進行更大量與更加深入的探討,訂定不同的特定主題,應該可以找出這樣的決策依據 資料探勘程序 未來展望 1/2 2008/6/17 * 預算編列與控制 透過前述研究趨勢預測與主題發展,可以提供決策者在預算編列與控制上,有更好的分配方式與依據 不至於讓經費侷限在某些領域或是某些計畫提案 如此更能促進在每個部門皆有均衡的經費使用與發展 資料探勘程序 未來展望 2/2 2008/6/17 * Thanks 資料探勘與知識發現 期末專案報告 指導老師 : 黃三益教授 M954020009 徐慎宜 D954020004  林皇吉 D954020008 唐 筠 議程 2008/6/17 * 簡介 背景 動機與目的 研究流程 資料探勘程序 結論 研究限制 未來展望 簡介 背景 2008/6/17 * 文字探勘是資料探勘的一環,透過文字探勘的理論與技術,可對非結構化的資料進行深入挖掘資訊,洞察文件的潛在價值,提供決策者評估與實行依據 一般文字探勘應用大量的文件資料庫,提供資訊蒐集、訊息過濾、事件相關、趨勢預測、犯罪分析、案例追蹤、知識管理、知識萃取與決策輔助等多種相關應用 2008/6/17 * 本研究希望透過分析此該基金會所贊助的計畫摘要的內容,並透過摘要的分析,得知該基金會所贊助的計畫案類型比例的分部,分析目前的研究計畫領域趨勢,進而做為提供調整經費預算的比重等重要依據 說明: 美國國家科學基金會 ( National Science Foundation, NSF ) 為一獨立的美國政府機構,依據經修正之1950年國家科學基金法案 ( the National Science Foundation Act of 1950 ) 所設置 簡介 動機與目的 2008/6/17 * 簡介 研究流程 確立研究目標 資料蒐集與確定 資料前置處理 資料整合 資料清理 資料轉換 資料精簡 模型建立與組成 數據分析與探討 結論 資料探勘程序 1.轉換企業問題成為資料探勘問題 2008/6/17 * 為了瞭解美國國家科學基金會所贊助的計畫比例,讓基金會對於所贊助的計畫在領域部門的比例有所了解,因此轉換此問題為資料探勘的問題即是經由分析摘要文件後,摘要內容文字所出現重要文字的頻率比較,可以得知目前或是該年度的研究趨勢與領域方向,除了可以作為未來研究趨勢的導引,也可以做為將來調整經費贊助比例的依據 2008/6/17 * 資料來源 UC Irvine Machine Learning Repository 網站的NSF Research Award Abstracts 1990-2003的資料集 網址為/ml/datasets/NSF+Research+Award+Abstracts+1990-2003 該網站為熱門且實用的資料集提供網站,除了提供資料集也接受研究者提供與分享自己的資料集,並有格式規範提供研究者參考,因此選用該網站資料做研究,在公信力上是有一定的水平 資料探勘程序 2.選擇合適的資料 2008/6/17 * 資料探勘程序 3.瞭解選擇的資料 1/2 名稱 型態 說明 Title 文字 摘要的標題 Type 文字 該計畫是屬於贊助計畫或是專案計畫等 Date 日期 該計畫提案日期 File 文字 摘要文件檔案名稱 Award Number 數字 該基金會贊助計畫的編號 Start Date 日期 計畫開始執行日期 Expires 日期 計畫預計結束日期,可以為預估日期 Total Amt. 數字 該基金會贊助的金額 Investigator 文字 說明研究者姓名與研究者的電子郵件帳號 Abstract 文字 提案計畫的摘要內容 表1文件摘要重要欄位屬性說明資訊 2008/6/17 * 資料探勘程序 3.瞭解選擇的資料 2/2 名稱 定義 說明 idnsfid.txt doic NSF_doc_id 文件檔案標號對應 docauths.txt docid Author_string 文件作者編號對應 doctitles.txt docid Title_string 文件標題與編號對應 docwords.txt doci

文档评论(0)

神话 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5203223011000000

1亿VIP精品文档

相关文档