python机器学习理论与实战(五)支持向量机

作者:marvin521 时间:2021-11-27 11:36:30 

       做机器学习的一定对支持向量机(support vector machine-SVM)颇为熟悉,因为在深度学习出现之前,SVM一直霸占着机器学习老大哥的位子。他的理论很优美,各种变种改进版本也很多,比如latent-SVM, structural-SVM等。这节先来看看SVM的理论吧,在(图一)中A图表示有两类的数据集,图B,C,D都提供了一个线性分类器来对数据进行分类?但是哪个效果好一些?

python机器学习理论与实战(五)支持向量机

(图一)

        可能对这个数据集来说,三个的分类器都一样足够好了吧,但是其实不然,这个只是训练集,现实测试的样本分布可能会比较散一些,各种可能都有,为了应对这种情况,我们要做的就是尽可能的使得线性分类器离两个数据集都尽可能的远,因为这样就会减少现实测试样本越过分类器的风险,提高检测精度。这种使得数据集到分类器之间的间距(margin)最大化的思想就是支持向量机的核心思想,而离分类器距离最近的样本成为支持向量。既然知道了我们的目标就是为了寻找最大边距,怎么寻找支持向量?如何实现?下面以(图二)来说明如何完成这些工作。

python机器学习理论与实战(五)支持向量机

(图二)

假设(图二)中的直线表示一个超面,为了方面观看显示成一维直线,特征都是超面维度加一维度的,图中也可以看出,特征是二维,而分类器是一维的。如果特征是三维的,分类器就是一个平面。假设超面的解析式为python机器学习理论与实战(五)支持向量机,那么点A到超面的距离为python机器学习理论与实战(五)支持向量机,下面给出这个距离证明:

python机器学习理论与实战(五)支持向量机

(图三)

在(图三)中,青色菱形表示超面,Xn为数据集中一点,W是超面权重,而且W是垂直于超面的。证明垂直很简单,假设X'和X''都是超面上的一点,

python机器学习理论与实战(五)支持向量机

因此W垂直于超面。知道了W垂直于超面,那么Xn到超面的距离其实就是Xn和超面上任意一点x的连线在W上的投影,如(图四)所示:

python机器学习理论与实战(五)支持向量机

套进拉格朗日乘子法公式得到如(公式五)所示的样子:

python机器学习理论与实战(五)支持向量机

(公式五)

        在(公式五)中通过拉格朗日乘子法函数分别对W和b求导,为了得到极值点,令导数为0,得到

python机器学习理论与实战(五)支持向量机

 ,然后把他们代入拉格朗日乘子法公式里得到(公式六)的形式:

python机器学习理论与实战(五)支持向量机

(公式六)

     (公式六)后两行是目前我们要求解的优化函数,现在只需要做个二次规划即可求出alpha,二次规划优化求解如(公式七)所示:

python机器学习理论与实战(五)支持向量机

(公式七)

         通过(公式七)求出alpha后,就可以用(公式六)中的第一行求出W。到此为止,SVM的公式推导基本完成了,可以看出数学理论很严密,很优美,尽管有些同行们认为看起枯燥,但是最好沉下心来从头看完,也不难,难的是优化。二次规划求解计算量很大,在实际应用中常用SMO(Sequential minimal optimization)算法,SMO算法打算放在下节结合代码来说。

参考文献:

     [1]machine learning in action. Peter Harrington

     [2] Learning From Data. Yaser S.Abu-Mostafa

来源:http://blog.csdn.net/marvin521/article/details/9286099

标签:python,机器学习,支持向量机
0
投稿

猜你喜欢

  • PHP伪静态页面函数附使用方法

    2023-11-22 06:25:42
  • 实现SQL Server到DB2连接服务器很简单

    2010-08-08 15:24:00
  • python读取dicom图像示例(SimpleITK和dicom包实现)

    2023-07-06 14:08:10
  • Python代码缩进和测试模块示例详解

    2021-08-31 06:49:10
  • 一个ASP站内搜索的实例源代码

    2007-09-21 12:13:00
  • 关于超级链接的一些问题

    2007-12-07 14:00:00
  • asp中将有双引号标题入库的方法

    2023-07-09 15:24:56
  • python实现可视化动态CPU性能监控

    2023-08-08 10:23:52
  • Mysql远程访问的开启

    2009-12-17 12:27:00
  • PHP常用字符串函数小结(推荐)

    2023-06-14 00:18:50
  • 交互设计杂七杂八

    2010-09-25 18:41:00
  • Python解析多帧dicom数据详解

    2022-08-13 21:16:13
  • 解决“引入同一个JS文件在非IE6中正常,但IE6报错”的问题

    2009-04-03 11:42:00
  • 在Oracle 8x实现自动断开后再连接

    2010-07-26 13:03:00
  • Jsp+Servlet实现文件上传下载 删除上传文件(三)

    2023-06-27 16:29:29
  • 使用python爬取taptap网站游戏截图的步骤

    2021-09-17 07:44:34
  • asp获取远程网页的指定内容的实现代码

    2011-02-16 10:41:00
  • SQL Server 2005中利用xml拆分字符串序列

    2009-01-06 11:30:00
  • PHP自动生成月历代码

    2023-11-18 09:22:52
  • PL/SQL数据类型及操作符

    2009-02-26 11:17:00
  • asp之家 网络编程 m.aspxhome.com