- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
西电模式识别大作业
题 目: 模式识别 学 院: 电子工程学院 专 业: 智能科学与技术 学生姓名: **** 学 号: 02115*** 模式识别大作业问题描述分别用近邻法和Fisher线性判别准则对Wdbc和sonar数据进行分类并计算识别率。二、算法介绍近邻法假定有c个类别W1,W2,…,Wc的模式识别问题,每类有标明类别的样本Ni个(i=1,2, …,c),我们规定Wi类的判别函数为 若 则决策 x∈WjFisher线性判别假设有一集合包含N个d维样本,其中N1个属于类的样本记为子集X1,N2个属于类的样本记为X2。若对Xn的分量做线性组合可得标量这样便得到N个一维样本yn组成的集合,并可分为两个子集Y1和Y2。定义各类样本均值向量mi:样本类内离散度矩阵Si和总类内离散度矩阵Sw:样本类间离散度矩阵Sb:我们希望投影后,在低维空间里个样本尽可能的分开些,即希望两类均值(m1-m2)越大越好,同时希望各类样本内部尽量密集,即Si越小越好。因此,我们定义Fisher准则函数为:采用Lagrange乘子法求解它的极大值我们很容易得到忽略比例因子R/,得 这就是我们Fisher准则函数取极大值时的解。三、实验数据 表1 实验数据类别数特征维数样本个数Wdbc230M:212B:357sonar260W1:98W2:110 表2 实验结果(准确率%)不降维(最近邻法)降维(Fisher判别)Wdbc78%96%sonar73%69%四、实验结果Wabc由结果可知,在特征向量维数较低时,用Fisher判别准则的正确率较高且比较稳定。最近邻法的正确率比Fisher低,且正确率依赖于随机抽取的训练样本,波动较大。Sonar由结果可知,在特征向量维数较高时,用最近邻法则的正确率较高,但其正确率依赖于随机抽取的训练样本,波动较大。Fisher判别准则的正确率比Fisher低,但较稳定。代码为:Wdbc:clc;totalsum1=0;totalsum2=0;truerate=zeros(2,10);for ii=1:10 data=load(wdbc.txt); data1=data(1:212,2:32);% 任取w1类数据中的106组 rbow1=randperm(212); trainsample1=data1(rbow1(:,1:106),1:31); rbow1(:,107:212)=sort(rbow1(:,107:212));%剩余的106组按行下标大小顺序排列 testsample1=data1(rbow1(:,107:212),1:31); data2=data(213:569,2:32);%任取w2类数据中的178组 rbow2=randperm(357); trainsample2=data2(rbow2(:,1:178),1:31); rbow2(:,179:357)=sort(rbow2(:,179:357)); testsample2=data2(rbow2(:,179:357),1:31); trainsample=cat(1,trainsample1,trainsample2);%包含284组数据的样本集 testsample=cat(1,testsample1,testsample2);% 包含285组数据的测试集 newchar=zeros(1,285);sum=0; [i,j]=size(trainsample);%i=284,j=31 [u,v]=size(testsample);%u=285,v=31 result=0; min=1000000000; true1=0; error1=0; for x=1:u%最近邻法 for y=1:i for z=2:31 result=result+((testsample(x,z)-trainsample(y,z))^2);%欧氏距离 end; result=sqrt(result); if resultmin lab=y; min=result; end; end; if testsample(x,1)==trainsample(lab,1) true1=true1+1; else error1=error1+1; end; end; truerate(1,ii)=true1/285; disp(sprintf(第%d次最近邻分类识别率为%4.2f,ii,truerate(1,ii))); totalsum1=totalsum1+truerate(1,ii); mm1=zeros(1,30);%Fisher线性准则 mm2=zeros(1,30); true2=0; error2=0; trainsample11=trainsample1(
文档评论(0)