朴素贝叶斯处理鸢尾花数据集分类.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
朴素贝叶斯处理鸢尾花数据集分类 ⼀、实验 ⽬的 (1) 掌握贝叶斯算法原理 ; ( ) 掌握朴素贝叶斯原理 ; (3) 使⽤朴素贝叶斯处理鸢尾花数据集分类 ⼆、实验内容 (1)导⼊库,加载鸢尾花数据,输出样本和鸢尾花特征 ()数据分割,数据分割,形成模型训练数据和测试数据 (3)⾼斯贝叶斯模型构建 (4)计算预测值并计算准确率 (5)画图 三、实验代码 import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib as mpl from sklearn.preprocessing import StandardScaler, MinMaxScaler, PolynomialFeatures from sklearn.naive_ bayes import GaussianN from sklearn.pipeline import Pipeline from sklearn.metrics import accuracy_score from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier data = pd.read_csv(iris.csv,header=None) x = data.drop([4],axis=1) x = x.drop([0],axis=0) x = np.array(x,dtype=float) print(x) y=pd.Categorical(data[4]).codes print(data[4]) y=y[1:151] print(y) p=x[:,2 :5] x_train1,x_test 1,y_train1,y_test 1=train_test_split(x,y,train_size=0.8,random_state=14) x_train,x_test,y_train,y_test=x_train1,x_test 1,y_train1,y_test 1 print(训练数据集样本数 ⽬:%d ,测试数据集样本数 ⽬:%d%(x_train.shape[0],x_test.shape[0])) clf=GaussianN () ir=clf.fit(x_train,y_train) y_ pred=ir.predict(x_test) acc = np.sum(y_test == y_ pred)/x_test.shape[0] print(测试集准确度 :%.3f% acc) y_ pred = ir.predict(x_train) acc = np.sum(y_train == y_ pred)/x_train.shape[0] print(训练集准确度 :%.3f% acc) print(选取前两个特征值) p=x[:,:2] p_train1,p_test 1,y_train1,y_test 1=train_test_split(p,y,train_size=0.8,random_state=1) p_train,p_test,y_train,y_test=p_train1,p_test 1,y_train1,y_test 1 print(训练数据集样本数 ⽬:%d ,测试数据集样本数 ⽬:%d%(p_train.shape[0],p_test.shape[0])) clf=GaussianN () ir=clf.fit(p_train,y_train) y_ pred=ir.predict(p_test) acc = np.sum(y_test == y_ pred)/p_test.shape[0] print(测试集准确度 :%.3f% acc) y_ pred = ir.predict(p_train) acc = np.sum(y_train == y_ pred)/p_train.shape[0] acc = np.sum(y_train == y_ pred)/p_train.shape[0] print(训练集准确度 :%.3f% acc) p1_ max,p1_ min = max(p_test[:,0]),min(p_test[:,0]) p2_ ma

文档评论(0)

151****0181 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档