1 minute read

起手式:

minimizew,b12|w|2(1)subject toy(i)(wTx(i)+b)1,i=1,,n

考虑到 y(i)=±1,所以 |wTx(i)+b| 代表了 xi 的 functional distance。

简单一点考虑,我们的 margin 画在 x=1x=1,然后要求 y(i)(wTx(i)+b)1 就相当于 wTx(i)+b 不是在 (,1] 就是在 [1,+)

我们这里引入一个概念上的函数 dist(x) 来表示越 margin 的 distance,举几个例子:

  • dist(xi)=1.2 表示 xi 在 margin 外 0.2
  • dist(xi)=1.0 表示 xi 在 margin 上,i.e. xi 是 support vector
  • dist(xi)=0.8 表示 xi 在 margin 内 0.2
  • dist(xi)=0 表示 xi 在 hyperplane 上
  • dist(xi)=0.8 表示 xi 超过 hyperplane 0.8,i.e. 在对面 margin 内 0.2
  • dist(xi)=1.0 表示 xi 超过 hyperplane 1.0,i.e. 在对面 margin 上
  • dist(xi)=1.2 表示 xi 超过 hyperplane 1.2,i.e. 在对面 margin 外 0.2

这样我们引入的 slack variable ξi 就可以定义成:

(2)ξi={0,dist(xi)11dist(xi),dist(xi)<1

ξi 可以理解成 “xi 越过 margin 的量”:

  • 如果你是老老实实在 margin 外,僭越量就是 0
  • 超 margin 0.2,僭越量 0.2
  • 在 hyperplane 上,僭越量 1.0
  • 在对面 margin 上,僭越量 2.0
  • 依此类推

我们只限定僭越总量,i.e. 限定 i=1mξiCC 是常量。至于这个总量你怎么使用,那是你自己的事情,你可以一个 ξi 就全部用完,也可以每个分别用一点,甚至一点也不用也可以。

这样一来,我们的优化问题转成:

minimizew,b12|w|2+Ci=1mξisubject toy(i)(wTx(i)+b)1ξi,i=1,,n(3)ξi0,i=1,,n

Comments