本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】机器学习模型出错的四大原因及如何纠错(2)

时间:2017-01-05 08:40来源:报码现场 作者:开奖直播现场 点击:
召回率则用来测量实际上的正类别多常被准确预测, 以计算真正与假负(false negative, 例如预测邮件为非垃圾邮件,但事实上邮件是垃圾邮件)的总和里有

  召回率则用来测量实际上的正类别多常被准确预测, 以计算真正与假负(false negative, 例如预测邮件为非垃圾邮件,但事实上邮件是垃圾邮件)的总和里有多少个真正而得出。

  另一种理解精确率与召回率区别的方法是,精确率测量的是对正类别的预测中有多少比例成真,而召回率则告诉你预测中多常能真正捕获到正类别。因此,当正类别预测为真的情况很少时, 就出现了低精确率,当正类别很少被预测到的时候,就出现了低召回率。

  一个良好的机器学习模型目标在于,通过试图最大化“真正”的数量以及最小化“假负”和“假正”的数量来实现精确率与召回率的平衡(如上图所示)。

  5 种改进模型的方法

  

wzatv:【j2开奖】机器学习模型出错的四大原因及如何纠错

  如果模型面临高偏差 vs. 高方差的问题,或者在精确率和召回率之间难以平衡,有几种策略可以采用。

  比如机器学习模型出现高偏差时,你可以试试增加输入特征(input feature)的数量。上文已讨论过,高偏差出现于模型对背后的数据欠拟合时,在训练集和测试集都会出现高失误率。如果把模型的失误以基于输入特征个数的函数画出(见上图), 我们发现特征越多,模型的拟合度越好。

  同理,对于高方差,你可以减少输入特征的数量。如果模型对训练数据过拟合,有可能是你用了太多特征,减少输入特征的数量会使模型对测试或者未来数据更灵活 。同样,增加训练样本的数量对高方差也是有益的, 这会帮助机器学习算法建出一个更通用的模型。

  对要平衡低精确率与低召回率的情况,你可以调整区分正负类别的概率临界值(probability threshold)对低精确率可以提高概率临界值,以使模型在指定正类别时更为保守。反之,遇到低召回率时可以降低概率临界值,以能更常预测到正类别。

  经过足够迭代,就很有可能找到一个能平衡偏差与方差,精确率与召回率的合适的机器学习模型了。

  本文是基于 Andrew Ng 在 Coursera 上的斯坦福机器学习课程笔记里教授的概念。

  原文地址:

新智元招聘

  职位 运营总监

  职位年薪:36- 50万(工资+金)

  工作地点:北京-海淀区

  所属部门:运营部

  汇报对象:COO

  下属人数:2人

  年龄要求:25 岁 至 35 岁

  性别要求:不限

  工作年限:3 年以上

  语 言:英语6级(海外留学背景优先)

  职位描述

负责大型会展赞助商及参展商拓展、挖掘潜在客户等工作,人工智能及机器人产业方向

擅长开拓市场,并与潜在客户建立良好的人际关系

深度了解人工智能及机器人产业及相关市场状况,随时掌握市场动态

主动协调部门之间项目合作,组织好跨部门间的合作,具备良好的影响力

带领团队完成营业额目标,并监控管理项目状况

负责公司平台运营方面的战略计划、合作计划的制定与实施

  岗位要求

大学本科以上学历,硕士优先,atv,要求有较高英语沟通能力

3年以上商务拓展经验,有团队管理经验,熟悉商务部门整体管理工作

对传统全案公关、传统整合传播整体方案、策略性整体方案有深邃见解

具有敏锐的市场洞察力和精确的客户分析能力、较强的团队统筹管理能力

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容