当前位置: 首页 > web >正文

【感知机】感知机(perceptron)学习算法的对偶形式

感知机( perceptron )是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1 和-1二值。感知机对应输入空间(特征空间)中将实例划分为正负两类的分离超平面,是一种判别模型。感知机是神经网络与支持向量机的基础

感知机学习旨在求出将训练数据进行线性划分的分离超平面。

感知机学习思路:

1.导入基于误分类的损失函数

2.利用梯度下降法对损失函数进行极小化

3.代入参数得到感知机模型。

感知机学习算法分类:

原始形式、对偶形式。

感知机学习算法的对偶形式

感知机学习算法的原始形式和对偶形式与支特向量机学习算法的原始形式和对偶形式相对应

输入:训练数据集T=\left \{ (x_1,y_1),(x_2,y_2),...,(x_N,y_N)\right \},其中x_i\in\mathbb{R}^{n},y_i\in\left \{ +1,-1 \right \},学习率\eta \left ( 0<\eta \leq 1 \right )

1.\alpha \leftarrow 0,b\leftarrow 0其中\alpha =(\alpha _1,\alpha _2,...,\alpha _n)^{T}

2.任意顺序遍历i,计算y_i (\sum_{j=1}^{N} \alpha _jy_jx_j\cdot x+ b),当y_i (\sum_{j=1}^{N} \alpha _jy_jx_j\cdot x+ b)\leq 0,转到步骤3;若对任意iy_i (w\cdot x_i+b )> 0,转到输出

3. \alpha_i\leftarrow \alpha_i+\eta,   b\leftarrow b+\eta y_i,转到步骤2

输出\alpha ,b;感知机f(x)=sign(\sum_{j=1}^{N} \alpha _jy_jx_j\cdot x+ b)

对偶形式的基本想法:将wb表示为实例x_i和标记y_i的线性组合的形式,通过求解其系数来求解wb

基于原始形式,可设 w_0=0,b_0=0,则迭代n次后,设第I个实例点由于误分而更新的次数为n_i,令\alpha_i=n_i\eta,有w=\sum_{i=1}^{N}\alpha_iy_ix_i,b=\sum_{i=1}^{N}\alpha_iy_i

注意:实例点更新次数越多,意味着它离分离超平面越近,意味着越难分类。这样的实例点对于学习结果的影响最大。

Gram矩阵:对偶形式中的训练实例仅以内积的形式出现,将实例间的内积计算出来并以矩阵的形式储存,G=[x_i\cdot x_j]_{N\times N},称为Gram矩阵

上篇:【感知机】感知机(perceptron)学习算法的原始形式

下篇:【感知机】感知机(perceptron)学习算法的收敛性

http://www.xdnf.cn/news/17380.html

相关文章:

  • 专题二_滑动窗口_长度最小的子数组
  • OpenAI推出开源GPT-oss-120b与GPT-oss-20b突破性大模型,支持商用与灵活部署!
  • AI代码审查大文档处理技术实践
  • Express框架
  • 机器学习之随机森林(Random Forest)实战案例
  • 一种基于CEEMDAN-小波阈值联合降噪-快速谱峭度(FSK)/基尼谱Ginigram/Autogram的故障诊断 Matlab
  • 动手学深度学习(pytorch版):第一章节——引言
  • Linux---第三天---权限
  • Ethereum: 像Uniswap V3贡献者一样开发,克隆、编译与测试v3-core
  • 二叉树算法之【中序遍历】
  • 最新教程 | CentOS 7 内网环境 Nginx + ECharts 页面离线部署手册(RPM 安装方式)
  • Kotlin中String的==相等比较符
  • TCP 如何保证可靠性
  • 深入解析嵌套事务:原理与应用
  • uniapp vue3中使用pinia 和 pinia持久化(没有使用ts)
  • Java NIO 核心原理与秋招高频面试题解析
  • Gitee上免费搭建博客
  • 嵌入式学习---在 Linux 下的 C 语言学习 Day10
  • 《C语言》指针练习题--2
  • Redisson中的分布式锁
  • uni-app vue3 小程序接入 aliyun-rtc-wx-sdk
  • Vscode Data Wrangler 数据查看和处理工具
  • 如何为WordPress启用LiteSpeed缓存
  • Linux 限制 root 登录 IP 地址的方法
  • Activiti 中各种 startProcessInstance 接口之间的区别
  • Java——详解形参实参方法的重载
  • .NET PDF处理组件IronPDF:如何通过 AI 简化开发人员处理 PDF的方式
  • platform总线简介和使用场景说明
  • 设计模式-装饰模式 Java
  • Web开发-JS应用WebPack构建打包Mode映射DevTool源码泄漏识别还原