Python机器学习应用之朴素贝叶斯篇

作者:柚子味的羊 时间:2024-01-02 23:11:15 

朴素贝叶斯(Naive Bayes,NB):朴素贝叶斯分类算法是学习效率和分类效果较好的分类器之一。朴素贝叶斯算法一般应用在文本分类,垃圾邮件的分类,信用评估,钓鱼网站检测等。

1、鸢尾花案例


#%%库函数导入
import warnings
warnings.filterwarnings('ignore')
import numpy as np
# 加载莺尾花数据集
from sklearn import datasets
# 导入高斯朴素贝叶斯分类器
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import train_test_split
#%%数据导入&分析
X, y = datasets.load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
#%%查看数据集
print(X)#特征集
print(y)#现象
#%%模型训练
# 假设每个特征都服正态分布,使用高斯朴素贝叶斯进行计算
clf = GaussianNB(var_smoothing=1e-8)
clf.fit(X_train, y_train)
#%%模型预测
# 评估
y_pred = clf.predict(X_test)
acc = np.sum(y_test == y_pred) / X_test.shape[0]
print("Test Acc : %.3f" % acc)

# 预测
#对第一行数据预测
y_proba = clf.predict_proba(X_test[:1])
#使用predict()函数得到预测结果
print(clf.predict(X_test[:1]))
#输出预测每个标签的概率,预测标签为0,1,2的概率分别为数组的三个值
print("预计的概率值:", y_proba)

运行结果

Python机器学习应用之朴素贝叶斯篇

2、小结

predict()函数和predict_proba()函数的区别: predict()函数用于预测标签,直接得到预测标签。predict_proba()函数得到的是测试集预测得到的每个标签的概率。如果测试集一共有30个数据集,数据原本有3个标签,那么使用predict()函数将会得到30个具体预测得到的标签值,是一个【130】的数组,使用predict_proba()函数得到的是30个数据集分别取得3个标签的概率,是一个【303】的数组。

我又回来了,继续更新~ 欢迎交流

来源:https://blog.csdn.net/qq_43368987/article/details/122297194

标签:Python,朴素贝叶斯,机器学习
0
投稿

猜你喜欢

  • Python selenium环境搭建实现过程解析

    2023-10-06 06:18:48
  • 用户体验设计中用到的统计学方法

    2009-07-12 08:26:00
  • Python实现的序列化和反序列化二叉树算法示例

    2021-06-11 07:14:23
  • SQL 2005 sa islock用户不能正常登录的现象

    2008-12-05 15:49:00
  • SQL Server数据库对服务器的需求

    2010-06-11 13:52:00
  • 在XPath查询中指定轴(转自MSSQL手册)

    2008-09-04 14:23:00
  • Python爬虫Requests库的使用详情

    2023-05-22 20:15:52
  • Python合并字符串的3种方法

    2021-08-13 00:33:33
  • PHP json格式和js json格式 js跨域调用实现代码

    2023-11-22 05:20:18
  • 如何用ASP.NET连接MS SQLServer数据库?

    2010-06-11 19:27:00
  • php基础知识:类与对象(5) static

    2023-07-24 03:01:30
  • Python中staticmethod和classmethod的作用与区别

    2022-03-12 21:30:00
  • laravel多视图共享数据实例代码

    2023-06-19 01:34:14
  • python能否java成为主流语言吗

    2022-10-16 18:34:11
  • python执行scp命令拷贝文件及文件夹到远程主机的目录方法

    2023-07-10 09:12:19
  • Python Flask前端自动登录功能实现详解

    2021-12-13 17:36:17
  • golang gorm中格式化时间问题详解

    2023-07-12 09:45:21
  • MySQL (root@%) does not exist的问题

    2011-03-16 15:31:00
  • Python面向对象class类属性及子类用法分析

    2021-07-22 03:04:46
  • Mootools 1.2教程(1)——MooTools介绍

    2008-11-12 13:01:00
  • asp之家 网络编程 m.aspxhome.com