python学智能算法(二十二)|SVM-点与超平面的距离
引言
前序学习进程中,了解了向量、向量点积运算、超平面、感知机等知识点。
SVM算法最核心的目标是通过规划租号的分割超平面,来使得超平面附近的点到超平面的距离和达到最大值。
那点和超平面的距离如何计算,就是今天学习的重点。
点与超平面的距离
前述学习进程中,已知超平面的常规表达为:w⋅x+b=0w\cdot x+b=0w⋅x+b=0
对于任何一个点(x,y),实际上可以直接带入上式,定义:β=w⋅x+b\beta=w\cdot x+bβ=w⋅x+b
当点(x,y)位于平面上时,显然会有β=0,其余情况β≠0。
当超平面确定,对于数据集中的每个点,都要计算β,并且取最小的β为点到超平面的距离,也就是取最近的点;
对于多个超平面,会获得多个β,取最大β对应的超平面为最佳分割超平面。
**但当β<0时,绝对值越大的β实际上距离越远,但在数学的对比中反而越小,这就导致最近的点实际上取成了最远的点,也就是取到错误的点。
为此,一个新的最近点判断依据出现:F=mini=1...myi(w⋅xi+b)F=\min_{i=1...m}y_{i}(w\cdot x_{i}+b)F=i=1...mminyi(w⋅xi+b)
当F>0,表明点的位置分类正确;
当F<0,表明点的位置分类错误。
这里可以对上述判别进行说明:
当超平面是一条线的时候,对于一个在超平面上的点(x0,y0),一定满足超平面的常规表达式:β=w⋅x=w1x0+w2y0+b=0=w1x0−y0+b=0\beta=w\cdot x=w_{1}x_{0}+w_{2}y_{0}+b=0=w_{1}x_{0}-y_{0}+b=0β=w⋅x=w1x0+w2y0+b=0=w1x0−y0+b=0
当一个点不在超平面上,取d>0:
有点(x0,y1),且满足y1=y0+d,点在分割线的上方,此时代入超平面的常规表达式会有:
β=w⋅x=w1x0+w2y1+b=0=w1x0−y1+b=−d<0\beta=w\cdot x=w_{1}x_{0}+w_{2}y_{1}+b=0=w_{1}x_{0}-y_{1}+b=-d<0β=w⋅x=w1x0+w2y1+b=0=w1x0−y1+b=−d<0
如果y0>0,则F<0,与β<0一致,容易把最近的点取成最远的点,出现分类错误;
如果y0<0,且y1>0,则F<0,与β<0一致,容易把最近的点取成最远的点,出现分类错误;
如果y0<0,且y1<0,则F>0,与β<0相反,且F=-d(y0+d),F越大,偏离超平面的距离也就越远,所以此时不会犯分类错误;
当一个点不在超平面上,取d>0:
有点(x0,y1),且满足y1=y0-d,点在分割线的下方,此时代入超平面的常规表达式会有:
β=w⋅x=w1x0+w2y1+b=0=w1x0−y1+b=d>0\beta=w\cdot x=w_{1}x_{0}+w_{2}y_{1}+b=0=w_{1}x_{0}-y_{1}+b=d>0β=w⋅x=w1x0+w2y1+b=0=w1x0−y1+b=d>0
如果y0>0,且y1>0,则F>0,与β>0一致,且F=d(y0-d),F越大,偏离超平面的距离也就越远,所以此时不会犯分类错误;
如果y0>0,且y1<0,则F<0,与β>0相反,容易把最近的点取成最远的点,出现分类错误;
如果y0<0,则F<0,与β>0相反,容易把最近的点取成最远的点,出现分类错误。
总结
学习了点与超平面的距离的计算。