基于鸢尾花数据集的逻辑回归分类实践

作者：谁偷走了我的奶酪2024.01.29 09:28浏览量：12

简介：本文将通过使用鸢尾花数据集，演示如何实现逻辑回归分类，并通过实例代码和图表解释整个过程。

千帆应用开发平台“智能体Pro”全新上线限时免费体验

面向慢思考场景，支持低代码配置的方式创建“智能体Pro”应用

在机器学习中，逻辑回归是一种常用的分类算法。它通过将线性回归的输出转换为概率形式，实现对二分类或多分类问题的处理。在本次实践中，我们将使用鸢尾花数据集，它是机器学习领域中非常经典的数据集之一。我们将通过实例代码和图表，解释整个逻辑回归分类的过程。
数据集准备
首先，我们需要导入必要的库和模块，包括pandas用于数据处理，matplotlib用于数据可视化，以及sklearn中的LogisticRegression用于逻辑回归分类。

import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn import metrics

接下来，我们将使用pandas从sklearn中读取鸢尾花数据集。该数据集包含了150个鸢尾花样本，每个样本有四个特征：萼片长度、萼片宽度、花瓣长度和花瓣宽度。目标变量是鸢尾花的类别标签，其中0表示山鸢尾，1表示杂色鸢尾，2表示维吉尼亚鸢尾。

iris = pd.read_csv('iris.csv')

数据预处理
在训练模型之前，我们需要对数据进行预处理。首先，我们将缺失值处理为该列的平均值。然后，我们将目标变量转换为独热编码格式，以便能够处理多分类问题。

# 填充缺失值
iris.fillna(iris.mean(), inplace=True)
# 转换目标变量为独热编码格式
from sklearn.preprocessing import OneHotEncoder
encoder = OneHotEncoder(sparse=False)
iris['target'] = encoder.fit_transform(iris['target'].values.reshape(-1, 1))

划分训练集和测试集
接下来，我们将数据集划分为训练集和测试集，以便评估模型的性能。我们将使用train_test_split函数进行划分。

X = iris.drop('target', axis=1)  # 特征矩阵
y = iris['target']  # 目标变量
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)  # 划分训练集和测试集

模型训练
现在我们可以开始训练逻辑回归模型了。我们将使用LogisticRegression类来创建模型对象，并使用训练数据对其进行拟合。

model = LogisticRegression()  # 创建模型对象
model.fit(X_train, y_train)  # 使用训练数据拟合模型

模型评估
为了评估模型的性能，我们将使用测试集进行预测，并计算分类准确率、混淆矩阵和精度等指标。

y_pred = model.predict(X_test)  # 使用模型进行预测
accuracy = metrics.accuracy_score(y_test, y_pred)  # 计算分类准确率
print(f'分类准确率: {accuracy}')  # 输出分类准确率

发表评论

开发者关注产品榜

最热文章

关于作者

谁偷走了我的奶酪

1815524被阅读数
21被赞数
12被收藏数

开发者热搜

基于鸢尾花数据集的逻辑回归分类实践

千帆应用开发平台“智能体Pro”全新上线限时免费体验

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

千帆大模型服务与开发平台ModelBuilder

千帆大模型应用开发平台AppBuilder

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者

谁偷走了我的奶酪

基于鸢尾花数据集的逻辑回归分类实践

千帆应用开发平台“智能体Pro”全新上线 限时免费体验

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

千帆大模型服务与开发平台ModelBuilder

千帆大模型应用开发平台AppBuilder

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者

谁偷走了我的奶酪

千帆应用开发平台“智能体Pro”全新上线限时免费体验