叶荫宇：国内机器人商用的瓶颈不是单体性能，而是通盘调配能力

运筹学是一种研究优化的学问，就是怎么能够在有约束的实际生活中，把事情做到极致。而所谓“优化”，就是量化我们的很多决策。

斯坦福大学 K.T.Li 讲座教授、杉树科技首席顾问叶荫宇

钛媒体注：本文整理自叶荫宇在“AI 大师圆桌会”上关于“运筹学与人工智能”的演讲。叶荫宇是斯坦福大学 K.T.Li 讲座教授，是杉数科技（创办于2016年7月，曾获真格基金、北极光创投的天使投资）的首席科学顾问，同时也是美国运筹与管理学会最高奖——冯·诺依曼理论奖迄今唯一华人获得者。
“AI 大师圆桌系列”是钛媒体联合杉数科技举办的深度 AI 系列论坛，也是钛媒体大师圆桌会的重要组成部分（点击报名参加AI大师圆桌会）。在大数据初创公司杉数科技的支持下，2017年系列“AI 大师圆桌会”邀请到了人工智能、运筹学等专业领域具有极高话语地位的多位国际知名学者和教授来到中国，巡回北京、上海、深圳三地，旨在共同探讨 AI 对产业的颠覆性影响。

在人工智能的商业应用中，越来越凸显出运筹学的重要性。

那么运筹学是什么？

运筹学是20世纪30年代初发展起来的一门新兴学科，其主要目的是在决策时为管理人员提供科学依据，是实现有效管理、正确决策和现代化管理的重要方法之一。它诞生的时间要比 AI 早，但却与 AI 的关系密切。

叶荫宇教授作为钛媒体“AI 大师圆桌会”·北京站最受期待的分享嘉宾，在这一学科深耕三十余载，深知机器学习与运筹学之间密不可分的关系。无论是物流仓储，还是风险保障，运筹学都在其中扮演着重要的角色。

事实上，运筹学中“优化”这一概念对于机器学习本身也是适用的——比如说算法方面。随着计算能力的提升和大数据时代的来临，利用算法提高机器学习的能力成为了目前业界的焦点之一。而运筹学插上机器学习的翅膀，适用范围和能力也变广变强了。

那么这两者相结合，都有哪些具体的案例可循呢？哪些方面又得到了改进呢？叶教授在演讲中给出了生动的案例，同时，他也通过大型仓储智能化、机器人化的案例，一针见血地指出了目前国内在人工智能的商业应用中遇到的问题：过于重视机器人本身的能力，而在通盘调配和统筹如何优化上依然是弱项。

钛媒体在7月、8月将继续举办“高维预测和大数据处理”、“人工智能：在不确定中博弈”、“AI创业与硅谷”、“AI社交网络”共四场与大师面对面的机会
点击图片或下面链接进入AI大师圆桌会·上海站、深圳站报名地址：

https://www.tmtpost.com/event/2017/ai/

以下为叶荫宇在钛媒体联合杉树科技举办的“AI 大师圆桌会”上的演讲实录：

我长期从事运筹学的，我 1982 年刚到美国读书的时候 AI 就非常热，但是那个时候很多年轻人不知道什么是AI，那个时期也没有很多的数据，有些（结论）就总结不出来，AI 就慢慢的没落下去了。我个人比较喜欢数学，就从事了运筹学。

运筹学是如何诞生的？运筹学是一种研究优化的学问，就是怎么能够在有约束的实际生活中，把事情做到极致。不简单是找一个可行的方案，而且是一定要找到最优的方案。

Nothing at all takes place in the Universe in which some rule of maximum or minimum does not appear. ——数学家欧拉

那么这种理论呢，也是基于自然形成也是在所谓的一个平衡，也是能量函数，到了极值。

运筹学的起源，是一部分数学统计那个时候还没有计算机，数学怎么能接地气，怎么落到实地，怎么真正起到应用的对人们生活产生一些影响，这样的数学家们就开始寻求这样的方案。也有一些紧迫感，在二次大战的时候，如何研究盟军配置，还包括一些博弈问题。

标志性的结果就是 1947 年 George Dantzig 提出线性优化的单纯形法，为优化中最经典的算法。其实美国早在 20 世纪就提出来了，但是那个时候没有算法，那个时候也不需要算法。因为那个时候没有计算机，把最优解选出来很慢，能不能有数学的这个记忆依靠这个逻辑来算出来，这就是里程碑的意义，虽然他自己因为搞数学，没有得诺贝尔奖。

后来运用到经济发展中，运筹学得到很大的发展。特别是之后计算机的高速发展，以前可能需要 1 个小时解出来的，现在不到 1 秒钟就可以解出来，这既有硬件的提升，也有算法的提升。所以我们可以预见运筹学要比 AI，机器学习更老，但 AI 和机器学习又给予我们更多的机会。不过，我认为无论是哪一种，很多都需要依靠优化。

整体而言，所谓“优化”就是——量化我们的很多决策。

满足一定的约束条件下，使某一个函数最大，这就是优化问题。量化一件事物，就需要建模。一般优化过程就是从建模到求解，然后再到决策，最后我们需要一套算法来求解。

把实际问题变成数学问题，变成优化问题，然后来求解。我认为大数据就是，达到可以量化的数据。当数据量化之后，我们可以用数学的方程、公式来描述它，然后来决策变成一个量化的决策问题。我认为数据量大再加上机器学习，能把问题更加量化。这其中，优化问题是各行各业都不可或缺的，这其中又涉及到很多算法方面的问题。

怎样理解“AI 是大数据时代的商务决策”呢？我们需要运用到很多计算机，信息学方面的知识手段，然后通过机器学习做一些规律性的分析，然后就是建模、决策。数据采集从中医的角度来说，有点像拉脉一样，拉了脉以后老中医有一个判断，接下来就是 prescrptive，也就是决策，中医来说就是开药，开处方。而在这个过程中如何判断准确，然后开什么处方，开的好，这也要看情况。有些东西要用三钱有些东西要四钱，但是有些中医搞的不好就是比较模糊，比如当归少许这个就不清楚。我觉得日本人搞的比较好，就能够把它刻画出来。我到日本学习的时候，日本人教烹调非常非常的细致，不是说少许而是多盐或者简单说两句。

机器学习与运筹学如何结合？

我觉得机器学习在量化，需求管理、规律性分析上面确实做的好。但是怎么决策？这里面都有一些很传统的优化模型和运筹学的模型。

我给大家举几个简单的例子——为什么有些决策模型并不需要深刻的理解就可以得出来？比如说这个选址问题，寻求一个区域内最优的仓库选择，成本最少，我要建五个库，分别建在什么地方？这里面需要权衡的就很多：一次建设费多少？建成之后，我服务区域有多大？那么区域大了，远地方的人运输成本会提高多少？这就需要运用数学工具去计算。

像这个问题，很早来说我们就知道它是一个凸问题：在哪些点上有些是离散变量？那么这样的问题怎么选才好？按照以前的算法，我就把它写成一个整数规划，就去算。现在不行，客户提出的需求，有些算法几个月都算不出解来。现在很多东西，要随时计算。得把它们视为是变化的，进行随时的调配，重新选址，这个时候我的算法就非常的快，然后就会有很多的近似算法。这里面我们也做过一些工作，这就是比较确定性的这个问题。这里面的算法问题，选址的问题，我们杉数在跟国外国内很多大企业合作过程中出现了很多这样的问题。

那么有一个问题就稍微更复杂一点，不是选址。是选择一个仓库，提供一个区域服务——有点像是中转站。航班调运也会面临同样的问题。通常我们把选址的问题，叫作战略性的决策，一旦选了以后几年都不会变。决策也分为战略决策，战术决策，以及经营性决策。经营性决策是指，如果我现在要送货，送到这么多的点上，如何都送出去，然后回到出发的地点使整个距离最小？这叫旅行商问题，这个也是很经典的问题。当然所有的物流公司都是在解决这个问题。

它还有一种变形，叫车辆调度问题。当然实际问题比这更复杂，一辆车不可能跑完所有的地点，几千万辆车要跑哪些区域，又怎么选址？这里面就非常非常复杂了，而且其中还涉及到取货，送货的问题。取货又得必须要保证在某一个时间点上。这个就是运筹学比较擅长的问题。

这有一个简单的解决方案，分而治之。我现在有 5 辆车，我要服务这个区域，首先就建立一个服务区的概念。把这个大的区域分成 50 分，每一个区域选择一个分点。选了以后，我知道我在分这个区域的时候，尽量保证每个区域的工作量均等。同时还要保证这些车辆跑的路线街道总长度不变，这个主要是地图公司做的。

美国有一个很有名的地图公司，后来被诺基亚收购了。我相信大家肯定用过 GPS，它有两个核心技术，一个核心技术也就是卫星定位，经度纬度定位以后，所以地理信息位置，都是搜集过来的。而街道的地理数据，随着城市不断变化，它也会不断变化。所以每次都要派信息采集车辆把这些信息重新采集起来。如何保证最少的车辆能采集完所有街道的信息呢？这样涉及到运筹学的应用。我们要根据这个瞬时情况进行分析。可能原来用 75 辆车现在 60 辆就够了，原来用 2 天时间现在一天半，效率提升了 25%-30%。这个技术诺基亚还在用，同时全世界 26 个国家都在使用。

后来给我们提一个要求：能不能让车辆尽量右转而不是左转？因为考虑到的是完成的时间——左转所要花的时间，要比向右转高 5 到 10 倍。因为有红绿灯，所以我们用运筹学的办法把这个解决掉。这个技术运用很广，被诺基亚买了以后，又转手卖给了西门子赚了一大笔钱。

“路径优化”中凸显出的中国 AI 发展问题

我们再举一个路径优化的问题，比如大家都在搞所谓的无人仓（亚马逊曾重金投入无人仓技术，如今京东也在跟随，钛媒体注）。

有一些小车搬运载有货物的托盘到空闲工作台，然后小车搬运到托盘从工作台回到仓库空储位，这个过程叫回库。然后小车搬运空托盘从工作台到托盘回收处，然后我们叫回收。这里面都是一些货柜，怎么拖起来怎么安排，然后又要保证路径协调。

在研究的过程中呢，我发现一个问题：

在我们国内，研究机器人，研究的比较多提高每个机器人自身的能力，我觉得这很不错，单体能力都非常棒。但是我觉得我们国家，在很多问题上，缺少的更多是通盘调配和安排。

机器人单体那么强，在团队里工作可能就没那么强了。我们比较缺乏统筹的软件决策系统——就像我们中国足球：个人能力不管强弱，在一起就不行。很多情况下中国人都是这样的，我们很注重个人能力的提高，人都不要输在起跑线上。但我觉得我们国家，长期缺乏一种集体的统筹决策能力的开发和提高。

每个机器人都在瞎跑的话肯定不行，包括无人车。很多公司都在考虑无人车的技术多强，但是其实最主要的问题是什么？——是无人车之间的协调、调配和统一指挥。

比如说这里面是工作台，如何分配整个区域的货物？这里面有很多很多的问题。比如说这里面的路径。我指的是，路径有了以后，怎么找路径？从设计上来说，你是设计成单行线还是双程线，这里面有学问。如果设置单行线跑的距离要长，碰撞的可能性就少一些，这里面都可以通过优化来进行解决。

机器人怎么配到货柜，怎么收检这个站？这个方法目前是用机器人去托盘，拖这个货柜，把整个的货柜运到旁边的这个台上，然后又把这个拿下来，再把托盘送回去，大家觉得这个是否适合中国国情？我们中国人就很喜欢把国外的东西搬过来。首先是机器人，把整个的货柜拖起来，可能那个货柜员就检一个东西下来。那么为什么不能货柜不动，而且货源坐在机器人身上然后去检货呢？可能人需要多一点，但是货柜可以装的更高了，空间利用率更高了。

我觉得我们大家可以想到一些更好的，但是这套技术可以用，而且人坐在这个机器上，不仅前后移动还可以升降货柜可以放更高，运行过程中形成三维的仓库而不是平面的仓库，这样我们就可以计算出来，包括货的这个密度，增加多少，仓库的利用率可以增加多少，那么对于像我们国家，人力相对比较便宜，但是房非常贵，是不是就更好一点，但是整个也是靠产品运输来优化问题进行求解。

世事不可预测，但可以进行结果优化

我在国内跟工业界接触也有一段时间，工业界总是觉得我们需要深度学习需要机器学习，需要把预测的精度再提高 1%。我觉得有时候忽略了一点，有个测不准的定律。这个定理到一定时候是不可能提高的，有一个不确定的这个规律在那。如果你能 100%，那就可以预测中国股市了。

然而股票市场存在一两百年，也没有人预测股票市场怎么样。所以在测不准的情况下，在决策上是不是可以做点工作，在知道测不准，可能有不同的这个状况出现的情况下，我的决策是不是可以调整一下，从数据到决策我们是不是也可以做一些工作，比如说我可以保证我在期望值省时一些，但是我保证永远不会破产，防备那些恶性大事件发生。

这里面最典型的问题，就是面库存问题——知道测不准，但怎么能够把局测做到最好，把库存做到最好？

以前早的时候我们没有钛媒体（这样的新媒体），只有报纸，一些小孩特别是一些学生，就去买一些报纸，买了报纸以后在摊位上卖。这就有点像我们零售商一样，这个卖报童就有一个问题：从这个报社买多少报纸？买了 50 张报纸只能卖 50 个人。那个时候还没有深度学习，所以那个时候就决定要买多少报纸。买多了费用就不够，可能卖不出去；买的少可能有一个突发性的新闻，我就错失了很多机会。如何从决策模型上处理这些永远判断不准的数据问题？

比如你是小零售商，你进货进多少？进一个星期的货，但是却不知道这个星期有多少，多的有多的损失，少的有少的损失。运筹学就有一套方法来处理这个问题：最近大家是否听说过美联航上面有一个人，因为机票卖多了，上了飞机被人拖下去，后来被赔了几个亿。为什么说这是典型问题？因为是不确定环境下的决策，飞机上座位是固定的 300 个，你事先只卖 300 张票，不会卖多，来的人都可以登记。

问题是总有 5% 到 10% 的人，因为各种各样的原因是不会来的。那么你卖 300 张票，5% 到 10% 是不会来，那么那部分就会损失，所以航空公司一般都会多卖一点。这个道理是一样的。它也要权衡，它知道有些人不来，我怎么多卖几张，最好的是有些人不来，不来的人数正好是我多卖的人数。但是永远是测不准的，这也就出现美联航的这个问题。

这点我们做过很多实际案例，特别是在我们国内比较大的电商里，帮他安排，通常周转率在 25 天的，现在降到 16.5天。大家也都知道零售商最怕的就是库存周转率太低，买了人家的东西自己又卖不出去。库存金额降 19.2%，现货率也有提升，GMV 上升 1.9%，而周转天数下降到 16.5天。就是说我们主要是在不损失这两个标准的情况下，降低了这部分人力成本。

还有一个办法根据某一类型电商的特点——例如闪购（出一份货卖一个星期就不卖了），那么这个时候，他们通常这个电商把那个星期的预测，需要备多少货就决定下来。我们采取两阶段的策略，首先我有一个总的估量，但是我发货的时候是发三天的货，通过第一天的销量我再决定追不追货。本来一周的需求量是 100，我实际送到前沿仓库送 60 件，头一天的这个销量是够，我是否需要把这 40 件补上去，就看第一天的销量，第一天的销量对后续的这个预测度就更高。

杉数科技的产品经理设计了一个模型叫 Stockgo。根据我们跟电商接触的这个规律，我们觉得应该给每一个中小电商，至少提供一个可能的工具，观察库存的这个周转来确定，帮助他决策。这里面有很多的功能，比如说对目前库存状态的量化评估，对高精度的销量预测，高精度的补货策略，供应链管理的智能化转型，这里面包括很多的机器学习的工具还有深度学习的工具，对你的库存状态进行评估，精确到每一个 SKU，还有补货策略，以及个性化的全云端的解决方案，也可以直接把数据传送到杉数，然后帮你进行诊脉。

如何用运筹学防范风险？

最后我就讲一讲根据我讲的东西，最近还研究一些投资组合，也就是防范风险。

这里面很多情况有一个叫 Markowitz，叫现代投资前沿理论。这个 Markowitz 也是在我们斯坦福工作过一段时间。他把投资组合的问题写成一个二代规划，目标函数不是线性函数是二次函数，所有的约束也都是线性。那么如何解这个问题解的最快？

这个时候我们就有很多的问题，那么这个模型为什么会出现了二次函数呢？大家知道在统计中，二次的 X 的平方通常描述你的变化量，通常我们需要波动不太大，这就是简单的这个二次函数，实际上要解的也就是二次规划，常见的软件有 barra、axioma、ITG、mosek。

mosek 这个公司也是我的一个学生做出来的。他写了几篇如何快速解二次规划的文章。后来他回去之后，由于在丹麦也找不到老婆，做了一段时间之后，干脆出去创业。基于那几篇文章，成立了一个在欧洲大陆上搞软件的公司。然后结果没想到这个公司搞的很成功。现在我听说，华尔街搞风险控制的都是用二次模型，用的求解器不少也就使用的 mosek。我也去过一趟，最近开了一个会，也就是如何解二次模型解的快，实际上也都是这个自动形成，卖多少买多少。

我个人认为高频交易的竞赛也就是算法速度的竞赛。我知道国内有就有用到过这样的模型，自己解需要解 10 秒钟的时间。从 10 秒到 0.04 秒，这里面有算法的模型。

FICO 也是二次规划的问题，很多很多大数据公司，越来越重视优化，我个人认为美国最早的大数据公司就是产生 FICO 的一家公司。国内是征信打分，就是最早的一个公司，把个人所有的信息收集起来给这个人的信誉打一个分。我 1982 年去美国要租房子，到银行开款，人家就必要 FICO，我说我是中国来的没有，到美国租房要担保首先就是看这个 FICO，打这个分。这个公司后来做的很好，大家都用他的 FICO，也就提供这个服务，包括在网上查一查这个征信也都要交钱——这是美国很早的大数据公司，收集很多公司对每个人也都有打分。

因此，国外搞AI（的商业应用）大多数是基于算法的。

国内做AI要避免什么？

但国内不太一样。

国内公司搞AI搞的非常热，趋势跟随很紧，在有些问题上结合中国特色进行研究和开发。我个人在 AI 革命过程中，我看到中国体制的这个优点。

为什么？这可以说是文化上的优点——怎么说呢？深度学习本身还在一个快速发展时期，很多理论问题还没解决，这个过程有点像我们中医，有什么问题它很有效，但是有时候也说不出什么道理来；有的时候也不是 100% 的准确，但是准确起来非常好。比如，一个癌症病人吃了几副药好了，怎么解释？解释不了。

所以我觉得特别适合中国的这个文化——要看疗效。西方在这块反而比较保守的。中国相对来说数据壁垒意识不是那么强，像美国大公司数据绝对不会给你的，所以我觉得为 AI 开辟了很多前途。

但是中国发展过程中忽略了算法的力量。

他们通常是以问题为根本，找了一些参考资料在开源软件中找一个算法进行试一试。开发算法，这是要花非常大的功夫，确实是要耐得住寂寞。但是要用人家的开源软件的话，人家不给源代码的话永远会被牵着鼻子走。我知道其实他们很需要线性规划或者说其他的运营规划，但是你要买人家，出于安全考虑也不行。

比如说 CPLEX，mosek，现在有些大学，包括财经大学，还有杉数科技，不光是做实际应用，也培养自己的算法开发，这样的话就比较有核心技术了。真正的成为技术公司而不是咨询公司。所以大家投资要是很有钱的话，要耐得住寂寞，要有核心的技术等等这样的一些东西。

未来的话，我觉得真是 AI、深度学习和机器学习提供了很多的支撑，模型规模也飞速增长，因为需要超大规模的优化算法。以前我认为我就要搞出个万能的算法，解所有的线性规划都要解得快，但是我后来反观 AI，人的思维。发现它是非常定制的，我可以什么方法对某一类方法用的好就用那个方法，不是追求某一个统一的算法，或者类别法。所以算法是比较定制化的，用中国话，来讲比较实用主义一些。不一定追求理论上的完美，有一个统一的算法，所以这点上，我觉得反过来，AI 对我们的这个东西有很大的促进，什么问题需要什么样的算法，本身需要学习的过程。

总的来说我是搞运筹因为也是搞优化的，1982 年到现在也大半辈子看到学术研究的起伏变化，我原来比较重视理论，很多问题都是写文章，证明一些东西，也小有成就，但是人到年纪大的时候，就会维护自己工作利益所在。我觉得最大的利益还是对一般人生活产生一些影响，谁也不知道那些理论证明的结果有什么东西。

这就是人到一定年龄的时候，就追求鼓励这些年轻人，不光是有一定的学术造诣，把自己的学术成果转化成技术，对人的基本生活产生影响，这才是 OR 的本质，OR 是一个接地气的科学，是一个落地的科学，怎么落地不能云里雾里说了吓死人，经过我们的试验还有杉数这些年轻人都是从斯坦福回来的学生，像运筹学、深度学习、机器学习确实对国内一些大的企业都开始产生一些影响。

所以我就希望大家多支持我们，使得中国的企业从一个比较粗放的形式进一步拓展依赖于大数据、国际技术来进行决策的环境里面。（本文首发钛媒体，整理/唐植潇）