朴素贝叶斯处理鸢尾花数据集分类.pdfVIP

下载本文档

34
0
约6.99千字
约 6页
2022-11-25 发布于湖北
举报
版权申诉

朴素贝叶斯处理鸢尾花数据集分类.pdf

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

朴素贝叶斯处理鸢尾花数据集分类⼀、实验⽬的 (1) 掌握贝叶斯算法原理； ( ) 掌握朴素贝叶斯原理； (3) 使⽤朴素贝叶斯处理鸢尾花数据集分类⼆、实验内容（1）导⼊库，加载鸢尾花数据，输出样本和鸢尾花特征（）数据分割，数据分割，形成模型训练数据和测试数据（3）⾼斯贝叶斯模型构建（4）计算预测值并计算准确率（5）画图三、实验代码 import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib as mpl from sklearn.preprocessing import StandardScaler, MinMaxScaler, PolynomialFeatures from sklearn.naive_ bayes import GaussianN from sklearn.pipeline import Pipeline from sklearn.metrics import accuracy_score from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier data = pd.read_csv(iris.csv,header=None) x = data.drop([4],axis=1) x = x.drop([0],axis=0) x = np.array(x,dtype=float) print(x) y=pd.Categorical(data[4]).codes print(data[4]) y=y[1:151] print(y) p=x[:,2 :5] x_train1,x_test 1,y_train1,y_test 1=train_test_split(x,y,train_size=0.8,random_state=14) x_train,x_test,y_train,y_test=x_train1,x_test 1,y_train1,y_test 1 print(训练数据集样本数⽬：%d ，测试数据集样本数⽬：%d%(x_train.shape[0],x_test.shape[0])) clf=GaussianN () ir=clf.fit(x_train,y_train) y_ pred=ir.predict(x_test) acc = np.sum(y_test == y_ pred)/x_test.shape[0] print(测试集准确度：%.3f% acc) y_ pred = ir.predict(x_train) acc = np.sum(y_train == y_ pred)/x_train.shape[0] print(训练集准确度：%.3f% acc) print(选取前两个特征值) p=x[:,:2] p_train1,p_test 1,y_train1,y_test 1=train_test_split(p,y,train_size=0.8,random_state=1) p_train,p_test,y_train,y_test=p_train1,p_test 1,y_train1,y_test 1 print(训练数据集样本数⽬：%d ，测试数据集样本数⽬：%d%(p_train.shape[0],p_test.shape[0])) clf=GaussianN () ir=clf.fit(p_train,y_train) y_ pred=ir.predict(p_test) acc = np.sum(y_test == y_ pred)/p_test.shape[0] print(测试集准确度：%.3f% acc) y_ pred = ir.predict(p_train) acc = np.sum(y_train == y_ pred)/p_train.shape[0] acc = np.sum(y_train == y_ pred)/p_train.shape[0] print(训练集准确度：%.3f% acc) p1_ max,p1_ min = max(p_test[:,0]),min(p_test[:,0]) p2_ ma