违规提示

请您遵循相关法律法规,避免再次出现类似问题

如有任何疑问,请联系support@tmtpost.com

关闭
第六课:机器学习存在万能的模型吗?
陈雨强 / 人工智能在工业界应用的必经之路
第六课:机器学习存在万能的模型吗?

第六课:机器学习存在万能的模型吗?

小欣:本期课程的最后一节,陈雨强老师会为我们讲解机器学习是否存在万能的模型。

陈雨强:其实并没有哪个模型在所有的情况下都更好,换句话说,机器学习并没有免费的午餐也不会存在万能的模型。没有免费午餐定理是由两位数学家在95年提出来的,他们证明了任何的算法不会严格优于另一个算法。

这个告诉了我们什么呢?所有的机器学习模型都是偏置,这个偏置代表你对数据的假设。偏置本身并不会有哪个更好,所以说你既可以使用更多的模型假设使用更少的数据,也可以使用更少的模型假设使用更多的数据,这都是能使得最终的模型效果变好的方式。总结起来,对于我们工业界来说,机器学习并没有免费的午餐,一定要做出对于业务合适的选择。

追求高VC维有两条路:一个是走宽和离散的路,比如说谷歌那条路。另一条是走深的那条路,比方说雅虎news或者是bingads的路。这就是宽与深的大战。因为宽与深在工业界都有非常成功的案例,所以坚信宽的人和坚信深的人在很长一段时间内,都是互相不能理解的。

坚信深度学习复杂模型的人认为宽度模型实在太简单了,20年前模型已经被研究非常透彻没有什么更多的创新。对于坚持宽度模型的人来说攻击深度学习的点也非常的简单,深度学习从来就没有真正的把所有的数据都用好过,从来没有真正发挥过所有数据的全部价值,没有真正做到过真正的个性化。因为确实深度模型在推理上做得很好,但是在个性化、记忆方面其实相比于宽度模型会差很多。

非常有幸的是我之前在两边都做过比较多的实际的探索和研究。其实宽和深都有各自的好处的。宽度模型和深度模型有非常强的融合趋势。不同的业务应该使用不同的模型,不同的模型也会有不同的特点。所以我们看一看深度模型和宽度模型分别有什么样的特点,分别适合什么样的业务和应用。

宽度模型是有比较准确的记忆能力,而深度模型是有很强的推理能力;宽度模型的泛化是靠层次化的特征进行泛化,深度模型是靠模型本身的叠加进行泛化;宽度模型有很强的可解释性,比如说一个线性的模型我可以非常容易的知道每个特征的权重是多少,以及一每个特征是如何去影响最终的结果,而对于一个深度模型来说,我们是非常难理解原始的输入和最终的输出是怎么样一个对应的关系。

宽度的模型对平台工程要求是更高的,因为我们除了需要对数据进行并行,还需要对模型进行并行.而深度的模型对平台工程的要求相对更低一点,他的模型基本上都是单机可加载的。

还有对于选型很关键的一点。宽度模型这条路上特征工程的创新是提升效果的关键,业务的知识是很容易加入建模的,所以说在宽度模型这条路上业务专家是非常容易产生价值的,并且非常容易的可以参与到整个模型的优化之中的。而相比来说,深度模型的创新主要来自于模型本身的结构的创新。这样的创新基本上都来自于学术界和研究的专家,每种业务知识的加入可能都意味着是一种新的模型。所以说这两种模型的选型代表着不同的人来优化你的系统。

宽度和深度的大战在我看来,各自有各自的优缺点可以取长补短,对他们进行一些融合。现在宽和深的融合也就是所谓的第四象限已经逐渐成为了一个研究的热点。谷歌在去年4月份发表了一篇论文,介绍他们最新的工作Deep & Wide Model,这样的模型分成deep的部分和wide的两部分。它对细的特征有很好的记忆,也有很好的推理能力,我们认为将来的方向都应该朝这条路上走。

小欣:非常感谢陈雨强老师的讲解,这期课程就到这里了。如果您喜欢这期课程就请大力点赞收藏或转发~还可以在下方评论中留下您想要交流的想法和对本课程的建议~当然也欢迎嘉宾推荐或自荐,咱们下期再见!

【版权归钛媒体所有,未经许可不得转载】

分享课程:
大家都在学
72问 有声书系列 / 中国经济2021
精品小课 揭秘黄金投资:2022年以来上涨表现最好的资产之一
精品小课 阿里人力资源体系课

Oh! no

您是否确认要删除该条评论吗?

全部课程 ( 6 )
倒序播放

00:00
/
00:00
X1.0

注册邮箱未验证

我们已向下方邮箱发送了验证邮件,请查收并按提示验证您的邮箱。

如果您没有收到邮件,请留意垃圾邮件箱。

更换邮箱

您当前使用的邮箱可能无法接收验证邮件,建议您更换邮箱

账号合并

经检测,你是“钛媒体”和“商业价值”的注册用户。现在,我们对两个产品因进行整合,需要您选择一个账号用来登录。无论您选择哪个账号,两个账号的原有信息都会合并在一起。对于给您造成的不便,我们深感歉意。