当前位置：首页 > news >正文

0304考试通过-逻辑回归实战-机器学习-人工智能

news 2025/7/13 16:20:14

开始通过预测

基于examdata.csv数据，建立逻辑回归模型，评估模型表现
预测Exam1=75,Exam2=60时，该同学能否通过Exam3
建立二阶边界模型，重复1、2

Examdata.csv示例数据如下：

Exam1,Exam2,Pass
34.62365962,78.02469282,0
30.28671077,43.89499752,0
35.84740877,72.90219803,0
60.18259939,86.3085521,1

以下是结合数据可视化的完整代码，包含数据点、决策边界及新样本的标记：

import matplotlib
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.preprocessing import PolynomialFeatures, StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import make_pipelinematplotlib.use('TkAgg')
# 设置 Matplotlib 使用支持中文的字体
plt.rcParams['font.sans-serif'] = ['Noto Sans CJK SC']  # 根据字体名称调整
plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示问题# 读取数据
data = pd.read_csv('examdata.csv')
X = data[['Exam1', 'Exam2']].values  # 关键修改：转为 numpy 数组
# print(X)
y = data['Pass'].values
# print(y)# 创建模型流水线
model = make_pipeline(PolynomialFeatures(degree=2, include_bias=False),StandardScaler(),LogisticRegression(penalty='l2', solver='lbfgs')
)
model.fit(X, y)# 生成网格点
x_min, x_max = data['Exam1'].min() - 5, data['Exam1'].max() + 5
y_min, y_max = data['Exam2'].min() - 5, data['Exam2'].max() + 5
xx, yy = np.meshgrid(np.linspace(x_min, x_max, 500),np.linspace(y_min, y_max, 500))# 预测网格点的分类结果
Z = model.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)# 可视化
plt.figure(figsize=(10, 6))
# 绘制决策边界
plt.contourf(xx, yy, Z, alpha=0.3, cmap='coolwarm')
# 绘制原始数据点（通过 numpy 布尔索引）
plt.scatter(X[y == 0, 0], X[y == 0, 1],c='red', label='Failed', edgecolors='k')
plt.scatter(X[y == 1, 0], X[y == 1, 1],c='blue', label='Passed', edgecolors='k')
# 标记新样本
plt.scatter(75, 60, c='green', s=200, marker='*',label='New Sample (75, 60)')plt.xlabel('Exam1 Score')
plt.ylabel('Exam2 Score')
plt.title('Logistic Regression with 2nd-Order Boundary')
plt.legend()
plt.grid(True, linestyle='--', alpha=0.5)
plt.show()