- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第36卷 南京大学学报(自然科学) №I.36
0FNANJ烈G
计算机专辑 JOIJRNAL UNⅣERSrrY
姗年11月 c‘栅胛衙I娼惦
(NAll瓜札ScⅢNCEs)脚挪
分类算法比较研究综述·
徐立本 张世伟
(吉林大学商学院 长春,1300121
闵丹
(长春税务学院经济信息管理系,长春.130021)
囊薹分类算法(a船五6曲吐湘)在科学上实业上(机如e诣)都有广泛的应用,历来受到许多镁
域研究者的关注.其实现方法有统计算法、机器学习算法和神经网络方法等.近年来一些研
究人员对其中一些算法进行了一些比较研究.得到一些对琏择分类算法有益的结论.其中所
使用的某些比较方法在方莹研究上具有参考价值.本文旨在评介这些比较方法及其褥掰曲比
较结果.同时还列出目前引入注目的分类算;圭研究谭墨.目前,计算机互曝网方兴束艾.信
息舞谭丰膏、肇杂.在取用方便的同时也带来r信息查询与检索工作的不便.因此,分类算
法作为一种基础性的数据挖掘工具.必将继续受到备领域研究人员的广泛关注.
美t词分类算法.蔡类分析。^工智能.模式识剐
0引言
分类算法(da翳i矗c越on)就是把一群客体分成几类豹过程.分类算法可分为两类:
有监督分类(跏peⅣised cla蟠inc鲥∞).有监
cla鹃ific鲥∞)和无监督分类(叽supe州∞d
督分类是示饲学习。也即.给定N个例子(Z.F#《))(f=,,Z…,帕,学习函数,(提出一
个用以判别该函数的规则).无监督分类可以看做为观察学习(1∞啦曲m
obs蝴d锄)。对无监督分类器给定一些观察m.即一群客体,但是没有导师对客体进
行分类。研究的目标是寻找模式的相似性.也即自动把这群客体分成若干组,■于同一
组的客体,彼此相似。属于不同组的客体.彼此相异.也就是说,无监督分类的目的是
对敦据进行方便而有效的分组,而不是寻找日后对数据进行分类的规则.
两种分类算法均可用统计、机器学习和神经罔络方法实现.给定了一群客体.选用
哪种(或哪几种)分类算法合适,这是一个特别值得研究的问题。本文旨在综述有关这
两种分类算法比较研究的概况,并列出目前引人注目的分类算法研究课题.
‘蒋一作者简介:绦立奉,吉林大学教授,博E生导师.目前研究方向为:人工智能,量量经济
学.计算帆在蛭济管理中的I起用.
计算机专辑 榱立本等:分类算法比较毒f究壕述
l有监督分类算法的比较研究
有关有监督分类算法的比较研究的文章比较多.本文仅评述一篇比较新的有代衰性
的了作【11.这个工作是4位荚田研究人员完成的.
这项工作是著名的st砒I孵研究项目的一部分.它考查的算法非常全面,共计18种.
其中有绕计算法8种(H丑ive
B盯鹄.Km明吼N吨黼K啪e1d唧i吼Li眦盯djo口.皿.蚰峨
fI玎1cdoII,K0h∞%).这个研究把上述算法用于8种大型
(B鲇kp∞附鲥on,Rad甜basis
实际分类问题上,其中有卫星影像、手写数字影像、KL(K盯hu加nL∞ve)数字影像、
车辆影像、心脏损伤、心脏病、信誉风险和移动控制问题等。
该研究表明,没有一个算法对上述每个数据集合都是最好的。该文作者们认为,哪
个算法最好,因数据集台的特性而定。然而,根据数据集合的什么特性决定采用什么类
型算法最好,要回答这个问题尚有许多理论分析和实验工作要傲。目前他们只得到一些
初步结论.
对Iine盯di∞dmin洲t算法来说,如果它的分布假定成立,用最大精度来衡量,该算
法最优.如果客体的诸特性同等重要且度量方式相同,则nea”sI
文档评论(0)