- 1、本文档共52页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SDML-论文答辩
空间数据挖掘语言SDML的设计与实现 高韬 2003年6月9日 目录 1. 应用背景及研究现状 2. 数据挖掘视图概念的提出 3. SDML的设计 4. SDML的实现 5. 应用SDML解决SDM的两个特殊问题 6. 展望 应用背景 空间数据挖掘 长期以来,遥感、遥测等对地观测技术的发展,特别是GIS的广泛使用,积累了大量丰富的地理空间信息。这些需求促进了空间数据挖掘的发展,并使之成为数据挖掘研究领域中的一个重要分支。 数据挖掘语言 数据挖掘语言是数据挖掘研究的一个重要内容。正如SQL语言极大地促进了关系数据库的发展一样,数据挖掘语言也将对数据挖掘系统的标准化和广泛应用产生巨大和深远的影响。然而现有的数据挖掘语言对空间数据挖掘的支持远远不够。 研究现状——空间数据挖掘 空间数据的特点 1. 空间数据的海量性 2. 空间数据复杂的数据类型 3. 空间对象间的空间关系 4. 空间自相关性 SDM的两种研究策略 1. 沿用地理统计分析的方法——桌面GIS中广泛使用 2. 对数据挖掘方法进行扩展——数据挖掘领域的普通观点 空间数据?空间数据预处理?通用DM算法 研究现状 空间关联:Koperski, Han[KH95], ILP[ML01] 空间聚类:BIRCH[ZRL96], CLIQUE[AGGR98], CLARANS[NH94] 空间分类:Neighborhood Graph[EKS97], [KHS98] 系统开发:GeoMiner[HK97], SPIN![Mic00], S-PLUS[KJV01] 研究现状——数据挖掘语言 数据挖掘语言 ——数据挖掘系统的标准化访问界面 数据挖掘发展的两个阶段 第一阶段:由学术界提出的数据挖掘查询语言 DMQL[HFW+96], MSQL[IV99], MineRule[MPC96] 第二阶段:工业界的介入和数据挖掘建模语言PMML[PMML01], OLEDB for DM[Mic03] 研究现状——数据挖掘语言(续) 数据挖掘模型的提出——知识的共享 数据挖掘模型的内容 数据字典 模型类别、算法及参数 数据挖掘的结果 PMML2.0: W3C的正式推荐标准 XML格式的数据挖掘模型交换格式 OLE DB DM: OLE DB的演化和延伸 支持向PMML的导入、导出 数据挖掘语言研究中的不足 1. 对于空间数据挖掘的支持远远不够 已有研究:1996, J. Han, GMQL, 对DMQL的简单扩展 不支持:空间数据预处理、数据挖掘建模 对空间数据挖掘的特殊应用支持不够 2. 对数据库上的DM缺乏系统化的、强大的预处理 应用程序的大量重复开发、算法的额外负担 低效的DM算法运行 3. 数据预处理与数据挖掘定义层次不明确 理想的模型:PMML 4. 对于数据挖掘结果的应用缺乏在语言上的支持 目录 1. 应用背景及研究现状 2. 数据挖掘视图概念的提出 3. SDML的设计 4. SDML的实现 5. 应用SDML解决SDM的两个特殊问题 6. 展望 数据挖掘视图概念的提出 面向数据挖掘的数据视图 数据挖掘视图 = 预处理后的数据+元数据 功能 通用预处理 空间预处理 数据整合 元数据补充 高效访问 数据挖掘视图与数据挖掘模型 DM View对于DM Model的支持 强化了数据提供者的能力 提高了数据挖掘模型的独立性 提高挖掘过程的共享能力 DM View概念 派生列定义 元数据补充 嵌套表 视图索引 DM View概念——派生列 派生列(Derived Column) 通过对原始数据的处理得到新的数据表现形式 涵盖了绝大部分的预处理、属性构造方法 派生列的定义 函数变换:离散化、正规化函数 基于规则的值映射 表达式计算 嵌入式的SQL查询 派生列的物化选择——对性能的支持 DM View概念——派生列(续) 派生列对空间数据挖掘的扩充: 允许表达式中的空间算子——基于空间属性的属性构造 允许嵌入式的Spatial-SQL语句 空间函数变换:空间对象的近似 派生列功能的进一步强化 多步计算的派生列 临时派生列 DM View概念——嵌套表 嵌套表:DM View中对于多表连接的结果采用嵌套表集成在视图中并以一列的形式出现 OLE DB DM中嵌套表——非空间自然连接 完成数据整合 减少数据冗余 支持算法有效运行 DM View概念——嵌套表(续) SDML对于嵌套表的扩充 ——在嵌套表定义中支持使用了空间谓词的空间连接 提供了对于空间关系的描述能力 自然地支持了邻域图的使用——空间自相关性 提供了对于更多空间预处理手段的扩展能力 DM View概念——元数据补充 1. 统计信息预计算 支持数据
您可能关注的文档
- RISUN中国手持移动终端第一品牌.ppt
- Risk_Assessment_风险评估.ppt
- RJYW040224麦哨.ppt
- RLC电路的谐振.ppt
- RMX500产品培训.ppt
- Robot初级培训.ppt
- Rocky老师小升初 - Uni3介词.ppt
- Robot罗伯特水泵简介精选.ppt
- Robot-水景用泵.ppt
- ROHS指令培训内容.ppt
- 2026版创新设计高考总复习地理中图版教师用-第58课时 交通运输与区域社会经济发展.docx
- 2026版创新设计高考总复习地理中图版教师用-第71课时 南水北调对区域发展的影响.docx
- 2026版创新设计高考总复习地理中图版教师用-第81课时 环境保护与国家安全.docx
- 2026版创新设计高考总复习地理中图版教师用-第77课时 海洋空间资源与国家安全.docx
- 2026版创新设计高考总复习地理中图版教师用-第72课时 黄河流域内部协作.docx
- 教育硕士考前冲刺练习含答案详解【达标题】.docx
- 教育硕士经典例题附答案详解【考试直接用】.docx
- 教育硕士综合提升测试卷附参考答案详解(完整版).docx
- 教育硕士题库附参考答案详解【黄金题型】.docx
- 教育硕士预测复习必威体育精装版附答案详解.docx
最近下载
- 《质量评估流程》课件.ppt VIP
- 17J008 挡土墙(重力式、衡重式、悬臂式)(必威体育精装版).pdf VIP
- 2024年数智工程师职业鉴定考试复习题库(含答案).docx VIP
- (完整版)建筑施工技术交底范本(大全) .pdf VIP
- 水运工程大体积混凝土温度裂缝控制技术规范_JTS-T 202-1-2022.pdf
- 设备供货、安装、调试、验收方案.docx VIP
- 《水利水电工程施工图审查技术导则》.pdf VIP
- 《木材学》——李坚 木材学笔记(完整).doc VIP
- 《公路水泥混凝土路面施工技术规范》_(JTGF30-2015).pdf VIP
- 小学生数学学习自查习惯现状调查报告.pdf VIP
文档评论(0)