当前位置：首页 > news >正文

【学习笔记】机器学习(Machine Learning) | 第五章(2)| 分类与逻辑回归

news 2025/7/4 12:21:31

机器学习（Machine Learning）

简要声明

基于吴恩达教授(Andrew Ng)课程视频
BiliBili课程资源

文章目录

机器学习（Machine Learning）
- 简要声明
二、决策边界
- 决策边界的数学表达
- 线性决策边界示例
- 非线性决策边界
- 非线性决策边界的示例

二、决策边界

在逻辑回归中，决策边界是模型用于划分不同类别样本的边界。对于二分类任务，决策边界通常是一个阈值，例如 0.5。当模型输出大于等于 0.5 时，我们预测样本属于正类（1）；当模型输出小于 0.5 时，我们预测样本属于负类（0）。

决策边界的选择对于模型的性能至关重要。在实际应用中，我们可能需要根据具体问题调整决策边界，以平衡精度和召回率。

决策边界的数学表达

决策边界的数学表达式为：

$f_{\overrightarrow{w}, b}(\overrightarrow{x}) \geq 0.5$

根据 Sigmoid 函数的性质，当且仅当线性组合 $\overrightarrow{w} \cdot \overrightarrow{x} + b \geq 0$ 时， $\geq 0.5$ 。因此，决策边界可以表示为：

$\overrightarrow{w} \cdot \overrightarrow{x} + b = 0$
在这里插入图片描述

线性决策边界示例

假设我们有一个二维特征空间，其中 $x_1$ 和 $x_2$ 是两个特征。决策边界可以表示为：

$w_1 x_1 + w_2 x_2 + b = 0$

例如，假设 $w_1 = 1$ , $w_2 = 1$ , $b = - 3$ ，则决策边界为：

$x_1 + x_2 - 3 = 0$

即：

$x_1 + x_2 = 3$

这个决策边界将特征空间划分为两个区域：当 $x_1 + x_2 \geq 3$ 时，预测 $\hat{y} = 1$ ；否则预测 $\hat{y} = 0$ 。
在这里插入图片描述

非线性决策边界

逻辑回归模型也可以处理非线性决策边界。通过引入多项式特征，我们可以构造更复杂的决策边界。例如：

$z = w_1 x_1^2 + w_2 x_2^2 + b$

决策边界为：

$w_1 x_1^2 + w_2 x_2^2 + b = 0$

例如，假设 $w_1 = 1$ , $w_2 = 1$ , $b = - 1$ ，则决策边界为：

$x_1^2 + x_2^2 - 1 = 0$

即：

$x_1^2 + x_2^2 = 1$

这个决策边界是一个半径为 1 的圆，将特征空间划分为内部和外部两个区域：当 $x_1^2 + x_2^2 \geq 1$ 时，预测 $\hat{y} = 1$ ；否则预测 $\hat{y} = 0$ 。

非线性决策边界的示例

考虑一个更复杂的非线性决策边界：

$z = w_1 x_1^2 + w_2 x_2^2 + w_3 x_1^3 + w_4 x_1 x_2 + w_5 x_2^3 + b$

决策边界为：

$w_1 x_1^2 + w_2 x_2^2 + w_3 x_1^3 + w_4 x_1 x_2 + w_5 x_2^3 + b = 0$

这个决策边界可以是椭圆、圆形或其他复杂的形状，具体取决于参数的选择。

决策边界是逻辑回归模型用于划分不同类别样本的边界。对于线性可分的数据，决策边界是一个线性方程；对于非线性可分的数据，可以通过引入多项式特征来构造非线性决策边界。

在实际应用中，合理选择决策边界对于提高模型的分类性能至关重要。通过调整模型参数，我们可以使决策边界更好地适应数据的分布。

continue…

查看全文

http://www.xdnf.cn/news/250651.html

第 12 届蓝桥杯 C++ 青少组中 / 高级组省赛 2021 年真题

Python3 基本数据类型

Python 常用内置函数详解（八）：对象属性操作getattr()、setattr()、delattr()、hasattr()、vars()函数详解

【经管数据】上市公司企业资本要素和劳动要素投入数据（2000-2022年）

Memory Bank 不够用？Cline 全新 CRCT：省 token，依赖关系自行追踪

如何解决 H5 远程收款的问题呢？

目标文件的段结构及核心组件详解

多线程系列二：Thread类

Window通过虚拟机17安装Ubuntu20.04并安装相关的插件（胎教级教程）

回归树：从原理到Python实战

【C语言】文本操作函数fseek、ftell、rewind

详细介绍Python-pandas-DataFrame全部功能函数

存储器层次结构：理解计算机记忆的金字塔

23页PDF | 数据治理实施方案：规划、执行、评价、改进四步走的管控模式

【Machine Learning Q and AI 读书笔记】- 03 小样本学习

数字智慧方案6178丨智慧医院医疗信息化建设之以评促建（61页PPT）（文末有下载方式）

微型计算机串行通信实验三全解析：从原理到实践的探索之旅

《数字图像处理（面向新工科的电工电子信息基础课程系列教材）》章节思维导图

【验证技能】文档要求和好文档注意点

Python实现简易博客系统

Linux——线程（3）线程同步

✨从噪声到奇迹：扩散模型如何“想象“出世界