【书评】《暗知识》：机器认知如何颠覆商业和社会-钛媒体官方网站

作者：王维嘉，斯坦福大学电气工程系博士，曾在斯坦福大学师从人工智能鼻祖之一、美国国家工程院院士伯纳德·威德罗教授。
出版社：中信出版集团
出版时间：2019年4月

近年来人工智能逐步走入大众视野，带来了一系列的震撼与神迹，但却少有人能够将人工智能及其背后的逻辑讲得通俗易懂，为什么呢？因为人工智能中确实存在“不可解释性”。

大家知道柯洁和AlphaGo下完棋以后到后台擦眼泪，说根本看不到赢的希望，但让我们吃惊的是不光棋手不理解AlphaGo怎么下的，连设计它的谷歌工程师都搞不清楚它为什么这么走。

谷歌在AlphaGo之后又造了一个AlphaGo 0。AlphaGo是先学人类的残局学棋谱，最后超越了人类。AlphaGo 0不学人类的经验，而是自己和自己对弈，弄个双胞胎兄弟自己打，所以AlphaGo 0的意思就是从零学起。结果七天之后，AlphaGo 0就超过AlphaGo的水平，40天之后就打遍天下无敌手，到今天没有人能打败它。

这件事给我们带来了更大的震撼，我们人类引以为傲积累了两千年的围棋经验，对AlphaGo 0来说一钱不值。不仅一钱不值而且是累赘，学了人类的棋谱后反而受到了限制，水平无法提高了。这两件事的震撼非常大，逼着我们要把这个问题想清楚，想到底学习的本质、知识的本质是什么？

暗知识来袭

一直以来人类的知识可以分为两类：“明知识”和“默知识”（Tacit Knowldge，又称默会知识）。明知识就是那些可以用文字或公式清晰描述和表达出来的知识。默知识则是个人在感觉上能把握但无法清晰描述和表达的知识，也即我们常说的“只可意会，不可言传”的那类知识。

人类发明文字以来，积累的知识主要是明知识，因为只有明知识才可以被记录和传播。一直到70年前，有一个奥匈科学家叫麦克波兰尼发现了另外一种知识：默知识。比如说骑自行车，没有一个人是看着手册学会的，每个人都是先骑到车上，歪歪扭扭摔个跤就学会了。

我们人类的很多其他技能全是这类的，只会意会、不可言传。为什么说不出来？因为这类知识是在我们的大脑里建立了一个非常复杂的神经元的联系，但是我们语言的表达能力又非常弱，比如我们平均每秒钟可以说五个字，语言能表达出来的信息要远远少于我们大脑里面存储的信息。

直到现在，在人工智能特别是其中的一个重要流派——神经网络里，突然发现了海量的、人类既无法感受又无法描述和表达的新知识：“暗知识”——隐藏在海量数据中的相关性，或者万事万物间的隐蔽关系。

什么叫不可感受？就是那些人体感官无法感受的物理量、化学量。像我们眼睛看不到紫外线、红外线、X射线，耳朵听不到超声波。或者是我们感官能感受但大脑没反应，不会建立新的神经元连接，像我们听马路上噪声，什么都听不出来。

什么叫不可表达？就是这些量之间的关系太多太复杂，根本无法用文字或者公式描述。AlphaGo下棋就是这类暗知识。暗知识就是人发现不了，但机器能发现的万事万物间的隐蔽关系。

注意，暗知识不是那些人类尚未发现但一经发现就可以理解的知识。比如牛顿虽然没有发现相对论，但如果爱因斯坦穿越时空回去给他讲，他是完全可以理解的，因为理解相对论用到的数学知识如微积分牛顿都有了。即使在微积分产生之前，如果爱因斯坦穿越2 000年给亚里士多德讲相对论，亚里士多德也能理解，至少能理解狭义相对论背后的物理直觉。

但如果给亚里士多德讲量子力学他就不能理解，因为他的生活经验中既没有薛定谔的猫（用来比喻量子力学中的不确定性，一个封闭的盒子里的猫在盒子没打开时同时既是死的也是活的，一旦打开盒子看，猫就只能有一种状态，要么是死要么是活），他的数学水平也无法理解波动方程。那么我们可以说对亚里士多德来说，量子力学就是暗知识。量子力学因为没有经验基础，甚至和经验矛盾，在刚发现的初期，几乎所有的物理学家都大呼“不懂”，至今能够透彻理解的人也极少。甚至连爱因斯坦都不接受不确定性原理。

人类过去积累的明知识呈现出完美的结构，整个数学就建立在几个公理之上，整个物理就建立在几个定律之上，化学可以看成是物理的应用，生物是化学的应用，认知科学是生物学的应用，心理学、社会学、经济学都是这些基础科学的应用组合。这些知识模块之间有清晰的关系。但是机器挖掘出来的暗知识则像一大袋土豆，每个之间都没有什么关系，更准确地说是我们不知道它们之间有什么关系。

机器如何学习暗知识

人类学习的本质是大脑神经元之间的连接，正是基于这一理解人类才开始模仿人脑，造出了电子神经元和神经网络。

我们可以把大脑看成一个黑盒子。黑盒子上有很多旋钮，每个旋钮就是神经网络中的一个权重。假设我们现在要让这个黑盒子学会识别汽车和猫，黑盒子怎么学呢？

我们先找100张汽车的图片和100张猫的图片，我们在黑盒子的输出端装两个灯泡，第一个灯泡亮表示机器认出了汽车，第二个灯泡亮表示机器认出了猫。现在我们给机器一张张看汽车的图片。一开始，机器不会认，灯是乱亮，可能两个都亮或者两个都不亮，甚至只有第二个灯亮，把汽车认成猫。那我们就慢慢调节旋钮，一直调到只有第一个灯灯亮。把100张汽车图片一张一张给机器看，都是第一个灯亮。然后给机器看猫的图片，耐心调旋钮，一直到只有第二个灯亮。现在我们就说机器训练的差不多了，可以认汽车和猫了。这时候我们还不放心，就再找一些机器没见过的汽车和猫的图片给它看，如果灯亮的都是正确的，我们就说训练成功了。

常说的机器训练需要大量的训练数据就是说的这个过程，所谓训练数据就是那100张汽车和猫的图。当然实际当中训练数据要大得多。听上去很神秘的神经网络，但它的工作原理就是这么简单。

今天，一颗芯片上可以放大概一亿个这样的黑盒子，从1960年到现在，计算机芯片的技术是上千万倍的增长。所以说当神经原多了以后，它就可以识别更复杂的图形，比如说人脸识别，看X光片子等。

神经网络的局限在于不适合发现因果关系，也不会推理。事物间有两类关系：一类是因果关系，一类是相关关系。因果是一件事导致另一件事，比如阳光很毒导致皮肤晒黑；相关是一件事和另一件事同时发生，皮肤晒黑时冰激凌也化了，皮肤晒黑不是冰激凌化了的原因，它们共同的原因可能是阳光很毒。

神经网络最擅长的是，发现事物间隐蔽的相关性，也就是暗知识。数据量越大，相关性越隐蔽，人越头痛，机器越得心应手。但给神经网络一个简单的逻辑推理问题可能就难倒它了。

比如你让它听两个句子：第一个是“餐馆拒绝了这帮学生的订餐要求，因为他们害怕喧哗”，这里的“他们”是指谁？再听个句子：“餐馆拒绝了这帮学生订餐要求，因为他们喜欢喧哗”，这里的“他们”又是谁？对我们人类来说非常简单，第一个“他们”当然指餐馆，第二个指学生，但对机器可就难死了。因为机器首先要理解场景：餐馆是干什么的？喧哗什么意思？为什么餐馆里不能喧哗？餐馆和学生是什么关系？各自有什么权利？一大堆背景常识和一大堆因果关系，这些都不是神经网络擅长的。神经网络虽然在很多方面能远超人类，但在有些方面还是远远不及人。

暗知识可以应用在哪些领域

暗知识是指神经网络或者机器发现的事物间隐藏的关系。理解了暗知识就可以把握人工智能的本质，甄别核心技术，找到创业和投资的最佳领域。

1.人脸识别

现在国内应用最广的就是人脸识别，人脸识别是一个特别适合神经网络的领域。人看东西就是抓取主要特征，在过去几十万年的演化中，所有感观演化就是：第一觅食，第二求偶，第三求生。就这么简单地做出决定，因为没时间观察复杂的东西，所以人类到今天也不善于观察特别复杂的东西。

比如我们看人脸，这个人高鼻梁、大眼睛、方脸盘，感觉都一样。但机器不一样，它可以看得非常细，像一个很有经验的老侦探，看你脸上的皱纹和两眼的距离。因为抓取的特征多，所以机器识别就比人类准。

2.精准医疗

现在的很多人类疾病，比如说血糖高，有很多的原因，可能是遗传、饮食、生活习惯、肾功能、心脏功能等。你要把所有原因列出来，可能有几百个原因，它们之间的关系是非常复杂的，它影响的量也不一样。我们人类的医学对这样一个病的诊断，只能把最重要的原因抓出来。

在北京一个大医院看病，需要花好大的劲才能挂一个专家号，进去以后只有五分钟时间，因为一个医生一天要看很多病人，只能给你五分钟，在看病历和病人对话的过程中，他只可能抓住几个最主要的原因。但应用了人工智能的精准医疗就可以做出非常精细的判断，不光是这样，如果它能够把历史上所有的已知病人的资料都学一遍的话，它就可能成为地球上最有经验的医生，相当于看过一百万个病人的医生。

3.新药研发

新药发现简单来说分成两个阶段：第一个阶段，就是生物学家要发现某种疾病是由哪个蛋白质造成的；第二个阶段是由化学家找到一种化合物和这个蛋白质发生反应，比如说把蛋白质抑制住，这样这个病就治好了。简单粗暴来讲就是这样，当然实际情况比这个复杂。

过去这件事怎么做呢？就是那些很有经验的化学家，看蛋白质的三维结构，然后就在想，我似乎见过类似的东西，我在已知化合物的库里面（这个库有多大呢？现在超过十亿个）挑出一个适合它的。可以想象这需要做多少实验。所以说这个过程大概需要2~3年的试错过程，非常慢。现在机器怎么做？就是把历史上化合物和蛋白质匹配的历史信息全部学一遍，然后就可以在几天之内能算出一个最适合的化合物。所以这个也是在大量的数据里头找到相关性的关系。