- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析和聚类分析应用可视化.pdf
主成分分析和聚类分析应用可视化 目标:用VC 编程,实现在windowsXP 以上环境的主成分分析和聚类分析应用可视化 编程环境:VisualC++6.0 程序要求实现: 1、数据读取部分 用 ado 或 dao 方式(要求两种方式可自选)读取数据,至少支持 Excel (自由选择行列 读取,包括个别行列)和ndat,tdat(另附样本)格式数据的直接读取 注:ndat,tdat 格式的数据可以用txt 方式打开查看如下 从左往右的列依次为左上各元素从上往下一一对应,其中有部分列(整列,所以 无需做到个别数据的读取选择)为无效数据,因此读取时需要可选择列。ndat 类似,只是数据上部没有给出具体元素而已,也是按列来读的。 关于Excel,各元素有可能是按行排列,也可能是按列排列 2、数据分析算法实现部分 对读取到的数据做主成分分析和聚类分析(要求能选择这两种方式) 注:主成分分析和聚类分析可在《多元统计分析》书中找到具体算法说明 对聚类分析,要求实现以下计算距离方式的选择(书中有各计算距离方法说 明) 数量积法 夹角余弦法 相关系数法 指数相似系数法 最大最小法 算术平均最小法 几何平均最小法 一般欧式距离法 一般海明距离法 一般切比雪夫距离法 倒数欧式距离法 倒数海明距离法 倒数切比雪夫距离法 指数欧式距离法 指数海明距离法 指数切比雪夫距离法 程序运行时先选择计算距离的方式,然后按选取的方式进行聚类分析, 输出结果 对主成分分析,只要求实现算法并输出结果 3、算法可视化部分 对于主成分分析的可视化,只要求在一维(用横坐标上的点表示)二维(用 平面直角坐标系内的点表示)三维(空间直角坐标系内的点表示),最好还 能实现四维(我找到的资料是优酷上一个四维表示方法的视频,但具体怎么 实现未知……)的可视化 在二维下的可视化范例(一维三维类似) (下图不是对应我样本给出的数据 绘的图,只是找的一个示例) Component1 和Component2 就是二维时对应的选取的主成分,后面的百分比 即贡献率,选取方式为把所有主成分(第一主成分,第二主成分……)按贡 献率排序,选出其中贡献率最高数个的建立坐标并绘图(即一维二维三维四 维分别选取1、2、3、4 个主成分)对于超过四个后只要求实现上一步的数据 分析算法输出结果 (一维二维三维四维也要有输出结果这一步),不用考虑 可视化 对于聚类分析的可视化,只要求二维的绘图 在二维下的可视化范例 (下图不是对应我样本给出的数据绘图,只是找的一 个示例) 由于聚类分析的结果最后都是归为一类,因此要求每一次聚类后都可以暂停,然后许可后才 继续下一次的聚类,直至聚类绘图完成 4、程序要带有注释,方便阅读 注:我附了两个在网上找的关于用MATLAB 写的主成分分析和聚类分析算法的.m 程序,程 序还未知是否正确,但可用来参考下编程思路。另外,程序必须完全用VC 写,不能调用其 他语言来实现,比如直接调用MATLAB。
文档评论(0)