账号合并
经检测,你是“钛媒体”和“商业价值”的注册用户。现在,我们对两个产品因进行整合,需要您选择一个账号用来登录。无论您选择哪个账号,两个账号的原有信息都会合并在一起。对于给您造成的不便,我们深感歉意。
第四课:如何从模型角度提高VC维?
小欣:这节课,陈雨强老师会为我们讲解如何从模型角度提高VC维。
陈雨强:主要的思路是:先观察问题,得到一些思考和假设后我们把思考和假设通过建模的方式加入新的结构和参数,重新拟合我们的数据,最后得到一个新的模型和新的验证。
以时序动态的协同过滤为例,我们这里引用的是Koren、Yehuda发表的论文‘Collaborative filtering with temporal dynamics’,这是这个领域被引用最多的一篇经典论文。在这篇论文里面我们首先有一个低秩的假设:我们认为一个矩阵是被分解成两个更低维的矩阵相乘的结果。就比方说4×4的矩阵就被分解为了两个:一个4×2的矩阵,一个2×4的矩阵。这两个低维的矩阵一个是user的隐变量,一个是Item的隐变量。
另一个作者发现的打分问题,比如MDB电影的打分会随着时间的推移而不断地上升,所以他设计了一系列的线性模型来拟合这样的趋势。他会设计一个User打分的时间,第一次打分的时间的偏置乘一个斜率是他打分的偏置,同时他对每一个电影设计的打分偏置,考虑到每个Item随着时间的影响受到的打分的波动。
时间的波动不会是一个纯的线性关系,所以作者用非线性的方式进行分段的拟合。但是不管怎么说,这样一个模式是比较清晰的,也就是说我们首先观察数据,从数据中得到一些假设然后根据假设设计一个模型。这个模型会有几个未知的参数,我们通过机器学习的方式拟合这样的参数,最后得到一个模型,在新的数据上进行验证看它的效果如何。
小欣:下节课,陈雨强老师会为我们讲解可以提高VC维的另一角度。
【版权归钛媒体所有,未经许可不得转载】
Oh! no
您是否确认要删除该条评论吗?