当前位置：首页 > ai >正文

python学智能算法（二十二）|SVM-点与超平面的距离

ai 2025/7/18 19:08:36

引言

前序学习进程中，了解了向量、向量点积运算、超平面、感知机等知识点。
SVM算法最核心的目标是通过规划租号的分割超平面，来使得超平面附近的点到超平面的距离和达到最大值。
那点和超平面的距离如何计算，就是今天学习的重点。

点与超平面的距离

前述学习进程中，已知超平面的常规表达为： $w⋅x+b=0w\cdot x+b=0$

对于任何一个点(x,y)，实际上可以直接带入上式，定义： $β=w⋅x+b\beta=w\cdot x+b$
当点(x,y)位于平面上时，显然会有β=0，其余情况β≠0。
当超平面确定，对于数据集中的每个点，都要计算β，并且取最小的β为点到超平面的距离，也就是取最近的点；
对于多个超平面，会获得多个β，取最大β对应的超平面为最佳分割超平面。
**但当β<0时，绝对值越大的β实际上距离越远，但在数学的对比中反而越小，这就导致最近的点实际上取成了最远的点，也就是取到错误的点。
为此，一个新的最近点判断依据出现： $F=min⁡i=1...myi(w⋅xi+b)F=\min_{i=1...m}y_{i}(w\cdot x_{i}+b)$
当F>0，表明点的位置分类正确；
当F<0，表明点的位置分类错误。
这里可以对上述判别进行说明：
当超平面是一条线的时候，对于一个在超平面上的点(x0,y0)，一定满足超平面的常规表达式： $β=w⋅x=w1x0+w2y0+b=0=w1x0−y0+b=0\beta=w\cdot x=w_{1}x_{0}+w_{2}y_{0}+b=0=w_{1}x_{0}-y_{0}+b=0$
当一个点不在超平面上，取d>0：
有点(x0,y1)，且满足y1=y0+d，点在分割线的上方，此时代入超平面的常规表达式会有：
$β=w⋅x=w1x0+w2y1+b=0=w1x0−y1+b=−d<0\beta=w\cdot x=w_{1}x_{0}+w_{2}y_{1}+b=0=w_{1}x_{0}-y_{1}+b=-d<0$
如果y0>0，则F<0，与β<0一致，容易把最近的点取成最远的点，出现分类错误；
如果y0<0，且y1>0，则F<0，与β<0一致，容易把最近的点取成最远的点，出现分类错误;
如果y0<0，且y1<0，则F>0，与β<0相反，且F=-d(y0+d)，F越大，偏离超平面的距离也就越远，所以此时不会犯分类错误;
当一个点不在超平面上，取d>0：
有点(x0,y1)，且满足y1=y0-d，点在分割线的下方，此时代入超平面的常规表达式会有：
$β=w⋅x=w1x0+w2y1+b=0=w1x0−y1+b=d>0\beta=w\cdot x=w_{1}x_{0}+w_{2}y_{1}+b=0=w_{1}x_{0}-y_{1}+b=d>0$
如果y0>0，且y1>0，则F>0，与β>0一致，且F=d(y0-d)，F越大，偏离超平面的距离也就越远，所以此时不会犯分类错误；
如果y0>0，且y1<0，则F<0，与β>0相反，容易把最近的点取成最远的点，出现分类错误；
如果y0<0，则F<0，与β>0相反，容易把最近的点取成最远的点，出现分类错误。