聚类规则在金融行业的应用分析.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

聚类规则在金融行业的应用分析

摘要:俗话说“物以类聚,人以群分”。对事物进行分类,是人们认识事物的出发点,也是

人们认识世界的一种重要方法。在自然科学和社会科学中,存在着大量的聚类问题。通俗地

说,类是指相似对象的集合。聚类分析是数据挖掘中的一种重要方法。既可以作为独立的方

法透视数据分布,也可以作为其他分析方法的预处理步骤。然而,聚类与分类的不同在于,

聚类所要求划分的类是未知的。基于聚类规则的特点,它被广泛应用在银行、零售和保险领

域等其他各个领域,例如,应用于股票市场的研究、营销策略中的客户细分等。

关键词:数据挖掘;聚类规则;金融;股票市场;板块

前言:俗话说“物以类聚,人以群分”。对事物进行分类,是人们认识事物的出发点,也是

人们认识世界的一种重要方法。在自然科学和社会科学中,存在着大量的聚类问题。通俗地

说,类是指相似对象的集合。聚类分析是数据挖掘中的一种重要方法。聚类与分类的不同在

于,聚类所要求划分的类是未知的。基于聚类规则的特点,它被广泛应用在银行、零售和保

险领域等其他各个领域,例如,应用于股票市场的研究、营销策略中的客户细分等。

正文:聚类规则在金融行业的应用分析

近年来,计算机应用范围日益扩大,数据库技术和挖掘技术的不断发展,因

此利用信息技术生产和搜集数据的能力大幅度提高,人类所拥有的数据急剧增长,

各种大型数据库被广泛应用于各行各业,而且这一势头将继续发展下去。一般来

说,数据挖掘是指从数据库或数据仓库中发现隐藏的、预先未知的、有趣的信息

的过程,该过程可以看作是知识发现过程中的一个核心步骤。而聚类规则挖掘是

数据挖掘中最活跃的研究方法之一。本文就数据挖掘中的聚类规则及其在金融行

业的具体应用进行详尽的分析与说明。

一、聚类

聚类是把对象或样本的集合分组成为多个簇的过程,使同一个组中的对象具

有较高的相似度,而不同类的对象差别较大。相异度是根据描述对象的属性值进

行计算的,距离通常采用相异度度量方式。在许多应用场合,可以把一个簇中的

对象作为一个整体对待。聚类源于很多领域,包括数学,计算机科学,统计学,

生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方

法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇

中。

二、聚类规则的概念

聚类规则就是通过对样本或指标进行量化分类,讨论的对象是大量的样品,

要求能按各自的特性进行合理的分类。其目标就是在相似的基础上收集数据来分

类。聚类规则是一种重要的人类行为。早在孩提时代,一个人就通过不断地改进

下意识中的聚类模式来学会如何区分猫和狗,或者动物和植物。

三、聚类规则的分析

聚类规则是一个富有挑战性的研究领域,它的潜在应用提出了各自特殊的要

求。数据挖掘对聚类的典型要求如下:可伸缩性、处理不同类型属性的能力、发

现任意形状的聚类、用于决定输入参数的领域知识最小化、处理噪声数据的能力、

对于输入记录的顺序不敏感、高维性、基于约束的聚类、可解释性和可用性。

建立模型:设有n个样品,p个指标,每个样品都有这p个指标的观察值,

设第i个样品的第j个指标的观察值为x,把n个样品看成p维空间中的n个

ij

点,则两个样品间亲疏程度可用p维空间中两点的距离来度量。令d表示样品

ij

q1/q

x与x的距离。定义距离公式——明考斯基距离,即:d(q)[∑|x-x|]

ijijikjk

当q1时,明考斯基距离变为曼哈顿距离:d(1)∑|x-x|

ijikjk

21/2

当q2时,明考斯基距离变为欧几里得距离:d(2)[∑|x-x|]

文档评论(0)

A~下一站守候 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档