当前位置: 首页 > news >正文

python学智能算法(三十六)|SVM-拉格朗日函数求解(中)-软边界

【1】引言

前序学习进程中,已经对常规SVM拉格朗日方程求解展开了探索。
但面对软边界SVM拉格朗日方程,对求解提出了新的要求。

【2】方程求解

软边界拉格朗日方程表达式为:
L(w,b,ξ,α,μ)=12∣∣w∣∣2+C∑i=1nξi−∑i=1nαi[yi(w⋅xi+b)−1+ξi]−∑i=1nμiξiL(w,b,\xi,\alpha,\mu)=\frac{1}{2}||w||^2+C\sum_{i=1}^{n}{\xi_{i}}-\sum_{i=1}^{n}\alpha_{i}[y_{i}(w\cdot x_{i}+b)-1+\xi_{i}]-\sum_{i=1}^{n}\mu_{i}\xi_{i}L(w,b,ξ,α,μ)=21∣∣w2+Ci=1nξii=1nαi[yi(wxi+b)1+ξi]i=1nμiξi

【2.1】对www求偏导数

L对wL对wLw的偏导数为0:
∂L∂w=w−∑i=1nαiyixi=0\frac{\partial L}{\partial w}=w-\sum_{i=1}^{n}\alpha_{i}y_{i}x_{i}=0wL=wi=1nαiyixi=0
获得:
w=∑i=1nαiyixiw=\sum_{i=1}^{n}\alpha_{i}y_{i}x_{i}w=i=1nαiyixi
可见,超平面的法向量www可以由样本xix_{i}xi,标签yiy_{i}yi和乘子αi\alpha_{i}αi线性表示。

【2.2】对bbb求偏导数

L对bL对bLb的偏导数为0:
∂L∂b=−∑i=1nαiyi=0\frac{\partial L}{\partial b}=-\sum_{i=1}^{n}\alpha_{i}y_{i}=0bL=i=1nαiyi=0
获得:
∑i=1nαiyi=0\sum_{i=1}^{n}\alpha_{i}y_{i}=0i=1nαiyi=0
可见,标签yiy_{i}yi和乘子αi\alpha_{i}αi的加权和为0。

【2.3】对ξi\xi_{i}ξi求偏导数

L对ξiL对\xi_{i}Lξi的偏导数为0:
∂L∂ξi=C−αi−μi=0\frac{\partial L}{\partial \xi_{i}}=C-\alpha_{i}-\mu_{i}=0ξiL=Cαiμi=0
获得:
μi=C−αi\mu_{i}=C-\alpha_{i}μi=Cαi
可见,乘子μi\mu_{i}μi可以由CCCαi\alpha_{i}αi表示,因为前序已经规定μi≥0\mu_{i}\geq0μi0αi≥0\alpha_{i}\geq0αi0,所以有:
0≤αi≤C0\leq\alpha_{i}\leq C0αiC

【2.4】将偏导数结果代入原方程

首先是www项:
12∣∣w∣∣2=12(∑i=1nαiyixi)(∑j=1nαjyjxj)=12∑i,j=1nαiαjyiyj(xi⋅xj)\frac{1}{2}||w||^2=\frac{1}{2}(\sum_{i=1}^{n}{\alpha_{i}y_{i}x_{i}})(\sum_{j=1}^{n}{\alpha_{j}y_{j}x_{j}})\\= \frac{1}{2}\sum_{i,j=1}^{n}\alpha_{i}\alpha_{j}y_{i}y_{j}(x_{i}\cdot x_{j})21∣∣w2=21(i=1nαiyixi)(j=1nαjyjxj)=21i,j=1nαiαjyiyj(xixj)
然后是ξi\xi_{i}ξi项:
C∑ξi−∑αiξi−∑μiξi=C∑ξi−∑αiξi−∑(C−αi)ξi=0C\sum{\xi_{i}}-\sum\alpha_{i}\xi_{i}-\sum\mu_{i}\xi_{i}\\=C\sum{\xi_{i}}-\sum\alpha_{i}\xi_{i}-\sum(C-\alpha_{i})\xi_{i} \\=0Cξiαiξiμiξi=Cξiαiξi(Cαi)ξi=0
整理后获得的方程为:
L(w,b,ξ,α,μ)=∑αi−12∑i,j=1nαiαjyiyj(xi⋅xj)L(w,b,\xi,\alpha,\mu)=\sum{\alpha_{i}}-\frac{1}{2}\sum_{i,j=1}^{n}\alpha_{i}\alpha_{j}y_{i}y_{j}(x_{i}\cdot x_{j})L(w,b,ξ,α,μ)=αi21i,j=1nαiαjyiyj(xixj)

【3】总结

学习了SVM软边界拉格朗日方程求解的基本方法。

http://www.xdnf.cn/news/1267381.html

相关文章:

  • 算法题(183):质量检测
  • Java异常:认识异常、异常的作用、自定义异常
  • 扣证件照要点
  • 全栈:JDBC驱动版本和SQLserver版本是否有关系?怎么选择JDBC的版本号?
  • 数据结构—二叉树及gdb的应用
  • WebGIS视角下基孔肯雅热流行风险地区分类实战解析
  • 开源智能手机安全相机推荐:Snap Safe
  • Python如何将图片转换为PDF格式
  • PDF编辑工具,免费OCR识别表单
  • 论文阅读-ZeroDCE和ZeroDCE++
  • 【Spring Boot 快速入门】八、登录认证(二)统一拦截
  • elementui input无法输入问题
  • 202506 电子学会青少年等级考试机器人一级理论综合真题
  • 【n8n教程笔记——工作流Workflow】文本课程(第二阶段)——5 自动化业务工作流——0 用例 (Use case)
  • 阿里云 ECS 怎么用 nginx 部署80端口多个网站
  • 大语言模型提示工程与应用:前沿提示工程技术探索
  • Baumer高防护相机如何通过YoloV8深度学习模型实现输电线路塔电缆检测分割(C#代码UI界面版)
  • 图片拆分工具,自定义宫格切割
  • AI 算法优化实战指南:从理论到部署的全流程优化策略
  • Python樱花树
  • 创业者焦虑与转型决策分析
  • Kafka服务端NIO操作原理解析(二)
  • 通用AGI到来,记忆仍需要一点旧颜色
  • Express中间件和路由及响应方法
  • 【阿里巴巴大数据实践之路学习记录】第十章-维度设计
  • 【Linux】Socket编程——UDP版
  • redis8.0.3部署于mac
  • ELK常见的问题
  • 如何在linux(CentOS7)上面安装 jenkins?
  • AI_RAG