- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于粗糙集的增量学习和数据过滤(2002.11.22)
《人工智能》第四讲基于粗糙集的增量学习和数据过滤 浙江大学计算机科学与技术学院 2002年11月22日 * * 第一部分 基于粗糙集的增量学习 1.1 为什么需要增量学习算法? ? 数据库中的数据是动态变化的 ? 数据量(训练样本)的变化引起重复学习 ? 应避免在海量数据的情况下重复学习 ? 只需修改因数据变化而涉及的规则 ? 增量学习算法是数据挖掘算法走向实用化 的关键问题之一 1.2 增量式学习 增量式算法的重要性体现在2个方面: ? 在实际的数据库中,数据量往往是逐渐增 加的,因此,在面临新的数据时,学习方法应能对训练好的系统进行某些改动,以对新数据中蕴涵的知识进行学习。 ? 对一个训练好的系统进行修改的时间代价通常低于重新训练一个系统所需的代价。 增量式算法:就是每当新增数据时,并不需要重建所有的知识库,而是在原有知识库的基础上,仅做由于新增数据所引起的更新,这更加符合人的思维原理。 ? 有了增量式学习算法的支持,知识库就处于动态更新状态,既能具有动态的自适应学习能力,又能有较好的时间特性。 ? 若一个算法是非增量式的,则其时间、空间耗费很大,影响其应用价值。 20世纪80年代中期,一些研究者致力于为决策树(Decision Tree)算法提供增量学习能力。主要成果有: (1)1986年,Schlimmer等提出的ID4算法; (2)1988年,Utgoff提出的ID5算法; (3)1996年,提出TDIDT、MSC算法等; (4) 1997年以后,提出ITI、增量树归纳算法等。 增量式学习问题划分为3类: ? E-IL(Example-Incremental Learning):学习系统训练好之后,又得到了新的训练例。需要对训练好的系统进行一定的改动,以使其在尽可能保持已有知识的同时,能对新知识进行学习。 ? C-IL(Class-Incremental Learning) :学习系统训练好之后,输出表示发生了变化,增加了新的输出分类。这时,没有或仅有少量已学习过的训练例可供使用。 典型实例:电子门锁。它对新增的家庭成员,仅需新获得的该新成员的人脸图像,而无需对整个系统进行重新配置和训练,就能将其与陌生人区分开来。 ? A-IL(Attribute-Incremental Learning):学习系统训练好之后,输入表示发生了变化,增加了新的输出属性。例如,电子门锁与新的人脸特征识别辅助设备的关系。 1.3 基于粗糙集的增量式学习 1994年,N.Shan等人提出一种适用于一致性数据的决策矩阵(Decision Matrix)增量算法。该算法的基本思想如下: ? 对于一个决策系统,根据其决策属性值的数量而决定该决策系统所对应的决策矩阵的个数,即一个决策值对应于一个决策矩阵。 ? 设信息系统I=U,A?{d},设Xi,Xj?U/IND({d}), 1 ? i,j ? |U/IND({d})|。Xi包含的对象个数为r,Xj包含的对象个数为s,则Xi对于Xj的决策矩阵M(i,j)是一个r*s的矩阵。矩阵中的第i行与第j列的元素表示对象的属性中所有差异属性的析取。 例如:表1.1是医学诊断的一个信息系统I=(U, A) 。其中,U = {e1, e2, ..., e7}, A = {A, T} ? {F}。为方便表达,用1表示“是”,0表示“否”;2表示体温“很高”,1表示体温“高”,0表示体温“正常”,则表1.1的简化形式如表1.2所示。 表1.1 医学诊断信息系统的描述 是 很高 否 e6 否 高 否 e5 否 正常 否 e4 是 很高 是 e3 是 高 是 e2 否 正常 是 e1 流感F 体温T 头痛A 实例 表1.2 简化后的决策系统 1 2 0 e6 0 1 0 e5 0 0 0 e4 1 2 1 e3 1 1 1 e2 0 0 1 e1 F T A U (T, 2) (T, 2) (A, 0) ? (T, 2) e6 (A, 1) ? (T, 2) (A, 1) ? (T, 2) (T, 2) e3 (A, 1) (A, 1) ? (T, 1) (T, 1) e2 e5 e4 e1 表1.3 对应决策为1的决策矩阵 将决策矩阵中的每行的元素进行合取,然后进行简化,得到相应的必然规则: ? (T, 1) ? ((A, 1) ? (T, 1)) ? (A, 1) ? (F, 1) 得 (T, 1) ? (A, 1) ? (F, 1) (1) ? (T, 2)
您可能关注的文档
- 赢利模式-小柯08-11.ppt
- 2008.11.14第29讲不等式的性质及基本不等式(上).ppt
- 第十章~第十一章习题+解答.doc
- 10实施细则-48-53页设计变更管理细则.doc
- 2008.11.12数列的综合应用.ppt
- 2008.11.18第30讲一元二次不等式的解法.ppt
- STC11F02E的RS232RS485转换器设计.docx
- 夏普故障代码.doc
- 第五章(10-48).doc
- 103847_板岩48种.doc
- ASX_Series_操作说明书手册.pdf
- Battery-Backup-Kit-Installation-操作说明书手册.pdf
- DCB-05-V2-操作说明书手册.pdf
- DEIMOS-Installation-操作说明书手册.pdf
- Axess-Pro-Series-2120-Roller-Shutter-Pendant-操作说明书手册.pdf
- Controll-A-Door-P-Diamond-操作说明书手册.pdf
- Controll-A-Door-PD-Power-Drive-操作说明书手册.pdf
- Controll-A-Door-Secure-SDO-6-操作说明书手册.pdf
- AMX_Series_操作说明书手册.pdf
- ELI-250-Installation-操作说明书手册.pdf
最近下载
- 中华人民共和国机械行业标准燃煤热风炉技术条件.PDF
- 武汉市光谷为明实验学校新初一分班语文试卷含答案.pdf VIP
- 浙江大学紫金港校区校园平面图.PDF VIP
- 中级车号员(长)试题及答案.pdf VIP
- 铁路车号员(长):中级车号员(长)测试题.docx VIP
- 铁路车号员(长)中级车号员(长)试卷(铁路车号员(长)).doc VIP
- 铁路车号员(长)车号员一体化考试试卷(铁路车号员(长)).doc VIP
- 铁路车号员(长)铁路车号员(长)综合练习试卷(铁路车号员(长)).doc VIP
- 铁路车号员(长)铁路车号员(长)综合练习试卷.doc VIP
- 初中数学高质量作业设计策略与实践.pptx
文档评论(0)