西电模式识别大作业.docxVIP

下载本文档

251
0
约 12页
2016-12-31 发布于重庆
举报
版权申诉

西电模式识别大作业.docx

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

西电模式识别大作业

题目：模式识别学院：电子工程学院专业：智能科学与技术学生姓名： **** 学号： 02115*** 模式识别大作业问题描述分别用近邻法和Fisher线性判别准则对Wdbc和sonar数据进行分类并计算识别率。二、算法介绍近邻法假定有c个类别W1,W2,…,Wc的模式识别问题，每类有标明类别的样本Ni个（i=1,2, …,c），我们规定Wi类的判别函数为若则决策 x∈WjFisher线性判别假设有一集合包含N个d维样本，其中N1个属于类的样本记为子集X1，N2个属于类的样本记为X2。若对Xn的分量做线性组合可得标量这样便得到N个一维样本yn组成的集合，并可分为两个子集Y1和Y2。定义各类样本均值向量mi：样本类内离散度矩阵Si和总类内离散度矩阵Sw：样本类间离散度矩阵Sb：我们希望投影后，在低维空间里个样本尽可能的分开些，即希望两类均值(m1-m2)越大越好，同时希望各类样本内部尽量密集，即Si越小越好。因此，我们定义Fisher准则函数为:采用Lagrange乘子法求解它的极大值我们很容易得到忽略比例因子R/，得这就是我们Fisher准则函数取极大值时的解。三、实验数据表1 实验数据类别数特征维数样本个数Wdbc230M:212B:357sonar260W1:98W2:110 表2 实验结果（准确率%）不降维(最近邻法)降维(Fisher判别)Wdbc78%96%sonar73%69%四、实验结果Wabc由结果可知，在特征向量维数较低时，用Fisher判别准则的正确率较高且比较稳定。最近邻法的正确率比Fisher低，且正确率依赖于随机抽取的训练样本，波动较大。Sonar由结果可知，在特征向量维数较高时，用最近邻法则的正确率较高，但其正确率依赖于随机抽取的训练样本，波动较大。Fisher判别准则的正确率比Fisher低，但较稳定。代码为：Wdbc:clc;totalsum1=0;totalsum2=0;truerate=zeros(2,10);for ii=1:10 data=load(wdbc.txt); data1=data(1:212,2:32);% 任取w1类数据中的106组 rbow1=randperm(212); trainsample1=data1(rbow1(:,1:106),1:31); rbow1(:,107:212)=sort(rbow1(:,107:212));%剩余的106组按行下标大小顺序排列 testsample1=data1(rbow1(:,107:212),1:31); data2=data(213:569,2:32);%任取w2类数据中的178组 rbow2=randperm(357); trainsample2=data2(rbow2(:,1:178),1:31); rbow2(:,179:357)=sort(rbow2(:,179:357)); testsample2=data2(rbow2(:,179:357),1:31); trainsample=cat(1,trainsample1,trainsample2);%包含284组数据的样本集 testsample=cat(1,testsample1,testsample2);% 包含285组数据的测试集 newchar=zeros(1,285);sum=0; [i,j]=size(trainsample);%i=284,j=31 [u,v]=size(testsample);%u=285,v=31 result=0; min=1000000000; true1=0; error1=0; for x=1:u%最近邻法 for y=1:i for z=2:31 result=result+((testsample(x,z)-trainsample(y,z))^2);%欧氏距离 end; result=sqrt(result); if resultmin lab=y; min=result; end; end; if testsample(x,1)==trainsample(lab,1) true1=true1+1; else error1=error1+1; end; end; truerate(1,ii)=true1/285; disp(sprintf(第%d次最近邻分类识别率为%4.2f,ii,truerate(1,ii))); totalsum1=totalsum1+truerate(1,ii); mm1=zeros(1,30);%Fisher线性准则 mm2=zeros(1,30); true2=0; error2=0; trainsample11=trainsample1(