基于经典的支持向量机算法完成鸢尾花的分类问题( 四 )

错误项的惩罚系数。 C越大，即对分错样本的惩罚程度越大，因此在训练样本中准确率越高，但是泛化能力降低，也就是对测试数据的分类准确率降低。相反，减小C的话，容许训练样本中有一些误分类错误样本，泛化能力强。对于训练样本带有噪声的情况，一般采用后者，把训练样本集中错误分类的样本作为噪声。
当c大的时候的效果为：
svc = svm.SVC(kernel='linear',C=1e3)

本文插图
可以看出当c很大的时候，会发现它的泛化效果不太好
当c小的时候的效果为：
svc = svm.SVC(kernel='linear',C=1e-1)

本文插图
可以看出其实泛化效果也不是太好，可能是测试数据集不多的原因。
支持向量机的有个好处是对于许多数据集，默认参数'C=1'其实工作得很好。
核方法
采用核方法，能够很方便地产生非线性分类边界。
linear ，线性核，会产生线性分类边界。一般来说它的计算效率最高，而且需要数据最少。 poly，多项式核，会产生多项式分类边界。 rbf ，径向基函数，也就是高斯核，是根据与每一个支持向量的距离来决定分类边界的。它的映射到无线维的。它是最灵活的方法，但是也需要最多的数据。
演示：
svc = svm.SVC(kernel='linear')线性核

本文插图
svc = svm.SVC(kernel='poly', degree=4)多项式核：

本文插图
svc = svm.SVC(kernel='rbf', gamma=1e2)高斯核

本文插图
这就是三种不同核方法的拟合效果

基于经典的支持向量机算法完成鸢尾花的分类问题( 四 )

推荐阅读

「元芳你怎么看」晕晕乎乎给媳妇打电话，竟然是一个男的接的！，【搞笑】：喝多了

娜娜时尚达人深蓝色毛衣配黑色长裤成五五分，却意外时髦，王菲身材好就是任性

|房子装修不要把洗衣机放阳台了，我家不懂做错，住进去肠子都悔青

在美国生活有哪些方面不如国内

新疆卫健委：喀什新增137例无症状感染者，已启动一级响应

兰州古建筑“守护者”：日行2万步巡山护“古韵”

楚汉|朱元璋走路摔倒，大臣袖手旁观，他赶紧来扶，朱冷笑：拖出去斩了

90美搜|这组窗帘礼裙也太太太魔性了吧！我又不懂时尚了

陈少侃时尚|工装马甲、针织马甲和内衣马甲的穿搭指南，请收藏！

中国日报网|外媒:强劲出口将提振中国经济

揭秘开店流程及费用？如何开一家淘宝店

「骨盆」小腹凸凸？早晚各做30秒这个动作，骨盆正了就会瘦

这些看着很体面，但实际工资不高的工作，你都知道么？

白萝卜|明日白露，这白色食物别忘了吃，才1元钱一斤，简单一蒸，特鲜美

15038957898|累积上完笔订单，一年净落3000万！，90后河北妹子做跨境电商

卡尔·安东尼·唐斯|留着没用！名记建议森林狼交易状元签，老板更直接：我们有唐斯

要对象有啥用

蛋黄的食疗价值

银河系|你知道地球在宇宙中的真正地位吗？看完也许会颠覆你的世界观

华为畅享9e返回键在哪里华为手机怎么返回主界面