logo

Python中进行二项Logistic回归分析案例

作者:沙与沫2024.02.23 21:09浏览量:5

简介:介绍如何在Python中使用sklearn库进行二项Logistic回归分析,通过一个实际的案例进行演示。

在Python中,我们可以使用sklearn库来进行二项Logistic回归分析。下面是一个简单的示例代码,展示了如何使用sklearn进行二项Logistic回归分析。

首先,我们需要导入所需的库:

  1. import numpy as np
  2. import pandas as pd
  3. from sklearn.model_selection import train_test_split
  4. from sklearn.linear_model import LogisticRegression
  5. from sklearn.metrics import accuracy_score

接下来,我们加载数据集。这里我们使用的是著名的Iris数据集,它是一个多类分类问题,但我们可以将其转换为二项Logistic回归问题。这里我们只使用前两个特征(萼片长度和萼片宽度)和目标变量为是否为Setosa(一种鸢尾花)。

  1. # 加载数据集
  2. data = pd.read_csv('iris.csv')
  3. X = data[['sepal length (cm)', 'sepal width (cm)']]
  4. y = data['species'] == 'setosa' # 只考虑是否为Setosa

接下来,我们将数据集分为训练集和测试集。

  1. # 划分训练集和测试集
  2. X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

然后,我们创建Logistic回归模型,使用训练集对其进行训练。

  1. # 创建Logistic回归模型并训练
  2. model = LogisticRegression()
  3. model.fit(X_train, y_train)

接下来,我们使用测试集对模型进行评估。这里我们使用准确率作为评估指标。

  1. # 预测测试集结果并计算准确率
  2. y_pred = model.predict(X_test)
  3. accuracy = accuracy_score(y_test, y_pred)
  4. print(f'Accuracy: {accuracy}')

在这个例子中,我们使用了二项Logistic回归来解决一个分类问题。通过使用sklearn库,我们可以方便地实现二项Logistic回归分析,并对模型进行评估。在实际应用中,我们还可以使用其他评估指标和优化方法来改进模型性能。

相关文章推荐

发表评论