- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第九章:复杂类型数据的挖掘 复杂数据对象的多维分析和描述性挖掘 空间数据库挖掘 多媒体数据库挖掘 时序数据和序列数据的挖掘 文本数据库挖掘 Web挖掘 9.1.1 结构化数据的概化 集合值属性 将集合中的每一个值概化为其对应的更高级别的概念 导出集合的一般特征,如集合中元素的个数,集合中类型或值的区间,或数字数据的加权平均 例9.1 {网球,曲棍球,国际象棋,小提琴,任天堂游戏}可以概化为{体育,音乐,电子游戏} 列表值或序列值属性 类似集合值属性,所不同的是概化中要保持元素的次序 9.1.2空间和多媒体数据概化中的聚集和近似计算 空间数据: 将一些具体的地理上的点概化为一些聚类区域,如根据土地的用途可概化为商业区、居民区、工业区或农业区 需要通过一些空间操作,如空间并、空间重叠、空间交 多媒体数据库: 图象数据 聚集和近似计算 尺寸、颜色、形状、纹理、方位,和对象或区域相对位置和结构 音乐数据 音调 风格 文章:摘要、结构 9.1.3对象标识符和类/子类层次的概化 对象标识的概化 基于相关的层次结构由低至高逐层攀升概化 继承特性概化 数据概化不区分数据来源:类或超类,一视同仁 方法 定义:计算过程/函数或一组演绎规则 方法本身不可能概化,但由方法导出的数据可以概化 9.1.4 类复合层次的概化 9.1.5对象立方体的构造与挖掘 9.1.6 用分治法对规划数据库进行基于概化的挖掘 规划: 由一个可变的行为序列组成 例9.4,飞行旅游:traveler, departure, arrival, d-time, a-time, airline, price, seat 规划挖掘的用途 定义 例:从飞行数据库发掘旅行模式,发掘汽车修理数据库的行为序列模式 例9.4 一个乘机旅行规划库 例9.4:发掘旅行规划库 多 维 分 析 步骤 按不同方向概化规划库 观察概化规划 导出高层的简洁规划 多 维 概 化 第九章:复杂类型数据的挖掘 复杂数据对象的多维分析和描述性挖掘 空间数据库挖掘 多媒体数据库挖掘 时序数据和序列数据的挖掘 文本数据库挖掘 Web挖掘 9.2.1 空间数据立方体构造和空间OLAP 空间数据仓库:面向主题的,集成的,时变的和非易失的空间和非空间数据集合,用于支持分析决策过程 挑战性问题 空间数据的集成 与特定结构有关 与特定厂家有关 快速而灵活的OLAP 维和度量都包含空间成分 空间数据立方体中的维和度量 维 非空间维 例:25-30℃概化为“热” 空间-非空间维 例:广东概化为华南省份 空间-空间维 例:0-10℃的地区 度量 数字度量 分布 代数 整体 空间度量 指向空间对象的指针 例9.5 BC_weather模式分析 输入 3000个气象探测器的分布地图 每日的气温、降雨量等数据 所有属性的概念层次 输出 发现模式的地图:合并相似区域 目标 交互式分析(下钻,分片,切块,旋转等) 快速响应 最小的贮存空间 挑战 一个合并的区域可能包含上百个原始区域 例9.6 BC_weather空间数据仓库的星型模式 空间数据仓库 维 region_name time temperature precipitation 度量 region_map area count 空 间 合 并 空间数据立方体的计算方法 在线的聚集:在空间数据立方体中收集与储存有关的空间对象指针 代价大且慢,需要有效的聚类技术 预计算和存储所有可能的结果 所需空间大 预计算和存储粗略近似的空间度量结果 牺牲精度 有选择的预计算: 经常用到的那部分 在较细粒度的级别上进行 权衡合并区域的实用性、可共享性及时空代价 9.2.2 空间关联分析 空间关联规则:A ? B [s%, c%] A 和 B 是空间和非空间谓词的集合 距离信息:临近、远离等 拓扑关系:交、重叠、分离等 空间方位:左边、西部等 s%表示规则的支持度,c%表示规则的可信度 例子 is_a(x, school) ^ close_to(x, sports_center) ? close_to(x, park) [0.5%, 80%] 逐步求精的挖掘优化空间关联分析 两个步骤: 第一步:粗略挖掘 使用 MBR 或 R-tree 满足超集覆盖特性 第二步:求精 在裁剪过的数据集上用代价较高的算法 9.2.4 空间分类和空间趋势分析 空间分类 定义:分析空间对象导出与一定空间特征有关的分类模式 例9.7:根据家庭收入把地区按贫富分类 空间趋势分析 定义:根据某空间维找出变化趋势 特点:空间上的非空间与空间数据的变化 例:交通流量,气象模式 第九章:复杂数据类型的挖掘 复杂数据对象的多维分析和描述性挖掘 空间数据库挖掘 多媒体数据库
您可能关注的文档
最近下载
- 苏教版小学科学三年级上册《13 吹气球》(第一课时)课件、视频、作业设计.pptx VIP
- 【人教版新课标】小学五年级语文上册期中测试卷22.docx VIP
- 第八单元(复习课件)一年级语文上册单元速记巧练(统编版).pptx VIP
- 三年级音乐桔梗谣 课件.ppt VIP
- 数字化转型对资源型城市绿色发展的推动作用研究.docx VIP
- 中华民族大团结全册知识点- 统编版道德与法治七年级全一册.docx VIP
- (新版)导游资格证考试题库及答案(夺冠系列).docx VIP
- 幼儿园教师培训消防安全.pptx VIP
- 华为营销体系IPMS详解第一部分 讲师版glz.pptx VIP
- 党员电化教育和电教片拍摄.ppt VIP
有哪些信誉好的足球投注网站
文档评论(0)