- 1、本文档共23页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于网格的区域划分方法
一种基于网格的空间聚类方法在区域划分中的应用 厦门大学 杨帆 2006-11-7 背景 区域规划 区域经济研究 深圳“十一五“人口规划 深圳南山区 山东临沂市 北京大兴区 GIS概念 地理信息系统 地理信息科学 地理信息服务 System-Science-Service GIS -SDBMS- DBMS OA 、MIS、 DSS 知识发现过程 数据清理 数据集成 数据查询与选择 数据变换 数据分析、挖掘和模式评估 知识表达 在区域划分中,人们常常要根据行政统计单元,如省、市、区县、乡镇的人口和社会经济指标进行空间划分,人为地将它们划分成不同的类,为决策支持服务。 针对非空间属性的聚类方法 GIS只起到空间分布的展示作用 忽视单元空间分布及其之间依赖关系 忽视了空间自相关性 空间聚类方法 涉及到拥有复杂数据结构的空间属性 发现“空间邻近,属性值相似”的地理实体集合 基于行政统计单元的空间聚类最直接的方法是采用面状数据的聚类算法。面状数据是矢量数据的一种,如行政区划单元、普查小区等,是统计中经常遇到的研究对象。 相似性评价。聚类中相似性评价方法主要有三种,分别是基于距离的(Distance-based )、基于密度的(Density-based)和基于连接的(Linkage-based )。前两类通常适用于欧几里德空间(Euclidean space ),第三类则适用于任意度量空间(Metric space)。在面状数据聚类中,在考察两个地理实体的空间邻近性时,常用距离或拓扑邻接关系来度量。 基于行政统计单元的空间聚类中,以不同尺度的行政区划作为研究对象,其聚类结果必然不同,因为行政区划本身就是一种区域的划分。这是基于行政统计单元的空间聚类的固有缺陷。 基于距离方法的缺陷 近似质量 如何将地理空间上的距离与属性空间上距离统一度量 基于拓扑邻接方法的缺陷 邻接矩阵的更新 现有行政统计单元存在不足 Modifiable Area Unit Problem,MAUP 行政区划本身就是一种人为划分 新的统计单元设计 陈述彭、陈秋晓、周成虎[18 – 20]从网格地图思想出发,提出建立格网信息系统(格网系统),用不同精度的网格来划分、存贮面状的行政统计单元及其属性数据。 一种基于网格的空间聚类方法 将面状数据划分成网格后,进行分析时有很大方便,本文提出一种基于格网系统的空间聚类方法(Supervised Density Information Grid ,SDIG),是从格网系统的数据结构—单元网格出发,由于格网系统中,统计数据依赖于单元网格而存在,单元网格之间隐含空间关系,因此采用基于网格密度的聚类方法,将单元网格上存贮的属性数据看成网格内的样本密度(Density),能够很方便地实现聚类。 SDIG 空间属性- Grid-based Method 非空间属性- others,eg , k-means , SOM 建立网格 对网格聚类 SDIG吸取了面状数据聚类的策略,将非空间属性和空间属性分开度量;引入K均值法“监督”网格区域的扩张,真正实现了“属性相似,空间位置邻近”的空间聚类,SDIG具有以下优势: 以单元网格作为聚类对象,不会损失原面状数据的属性信息,而且属性信息在行政区划界线上的过渡也更加合理,不会产生跳变,更能反映属性的空间分布特征。 基于行政统计单元的聚类无法实现任意区域的聚类分析,必须依赖于行政区划。SDIG算法可以打破行政区划的限制,对任意选中的网格区域进行聚类分析 可以实现多指标的空间聚类,既可以描述非空间属性在高维数据空间中的分布情况,又可以刻画具有多维非空间属性的地理实体在二维地理空间中的分布情况。 对其他数据结构,如栅格数据(raster)的应用值得探讨。 谢 谢 欢迎批评和指正! * * 数据展示与地理信息系统 K=5 K=10 特 点
文档评论(0)