苹果、华为接连入局,移动AI芯片成为竞争新焦点

正在被舆论泡沫化的人工智能其实刚上路,端侧人工智能专用硬件AI芯片方案成为优选,华为苹果领先半个身位,未来竞争的关键在于人工智能生态与通信连接升级双领先。

近期,苹果发布 A11 Bionic神经引擎、华为发布麒麟970集成NPU,端侧人工智能成为业内热点,高门槛的人工智能一夜间要飞入寻常百姓家了,对于智能手机人工智能我们应该抱有怎样的期待呢?

正在被舆论泡沫化的人工智能其实刚上路

随着互联网+的大潮/光环/红利的退潮,市场、产业、投资都需要新热点。人工智能被称为是未来十年的热点,是受益于计算能力、大数据集、深度神经网络领域都在取得了超乎寻常的进步,人工智能类新兴技术在Gartner2017新兴技术成熟度曲线上快速移动。

图1:Gartner 2017新兴技术成熟度曲线

一个危险的信号是市场几乎到了不谈AI就是落伍的地步,人工智能投资和舆论正在泡沫化。适度的泡沫利于新兴技术的快速普及与商用化,但当一个概念被热炒天花乱坠后,最大的危机在于不落地用户可感知性不强。

每个厂商都在谈自己的手机人工智能了,云山雾绕,但更多是只闻楼梯脚步声,对于最终消费者而言,也许只是其中的一点(毕竟人工智能的范畴太广),亦或是仅仅是停留在宣传上再包装的换汤不换药。

毕竟,属于人工智能的时代才刚刚开始。

端侧人工智能面临挑战,但也有独特优势,专用硬件AI芯片成为优选

现阶段AI计算主要通过深度学习来进行,分为训练和推断两类。训练主要是云端训练是根据已知数据寻找模型参数的过程,主要依赖于云端海量数据与复杂神经网络结构,计算量巨大。

由于端侧缺乏大规模数据,暂缺乏端侧模型训练。而在云端与终端侧均可进行推断,推断是根据已有模型,对具体某个应用(图片、语音、翻译等)在云端/终端侧进行判断(大量矩阵运算),并返回结果。

云端AI芯片路线基本确立,GPU用于训练,FPGA用于推断,谷歌另辟蹊径开发ASIC(TPU)可同时完成训练和推断。端侧AI芯片则根据不同的终端类型,有着不同解决方案, GPU、FPGA、ASIC、NPU(SoC中AI ASIC)等都有应用。

相比云端训练及推断的蓬勃发展,端智能确实相对滞后,主要受制于手机侧的计算性能,智能手机无论是体积、供电、散热和能耗等方面相比云端服务器计算,在支持AI方面面临着巨大的挑战。

但是相对于云端的人工智能来说,智能终端侧部署人工智能在隐私保护、带宽需求、实时性/低延时、功耗以及体验等众多方面又都更有优势。

手机SoC芯片既要不断追求最好的性能,同时对每一个能力的加入又必须用最高的性能密度和最好的能源效率的方式进行,这对芯片的设计提出了超高的要求。

考虑到前述功耗、带宽、性能、可靠性、安全和延迟方面因素,用硬件来实现机器学习和深度学习,相比软件+云计算方案更有优势,神经网络处理成为人工智能手机SoC的关键处理单元是必然趋势,如同CPU、GPU、音视频编解码器一样,在智能终端侧部署人工智能已经是大势所趋

移动AI芯片成为竞争新焦点,华为、苹果目前领先半个身位,2018年则可能遍地开花

人工智能芯片可以称为芯片发展史上的又一次专业分化,当初GPU也是这么走过来的,主要目标仍是缩短计算时间、降低计算能耗。

ARM

在年初发布针对人工智能及机器学习进行优化的DynamIQ技术,实现了在单一计算集群上进行大小核配置,对每一个处理器进行独立的频率控制以及开、关、休眠状态的控制,可以实现在不同任务间高效无缝切换最合适的处理器。将加入针对人工智能的指令集和优化库,下一代ARM V8.2版本的指令集将支持神经网路卷积运算,提升通用SoC芯片的人工智能和机器学习的效率。

最近,英国ImaginaTIon发布了最新神经网络加速器PowerVR 2NX NNA,相信ARM的专用AI芯片IP大概率会在2018年面世。

高通

高通在2016年发布Zeroth平台时发布了神经处理引擎SDK包,支持主流的深度学习框架Caffe、TensorFlow等。同时,高通收购荷兰机器学习初创公司Scyfer,投资神经科学初创公司Brain Corp,不断强化人工智能方面的布局。在华为、苹果相继推出专用AI芯片单元后,高通旗舰芯片实现AI能力硬化是必然,据传高通已经开始设计制造执行神经网络的专用芯片,焦点可能在于高通是自研还是用哪家的IP。

MTK

据传,联发科已完成了手机芯片内置AI运算单元的设计,预计2018年上市的Helio P70芯片将内建神经网络及视觉运算单元(Neural and Visual Processing Unit,NVPU)。

苹果

苹果iPhone8系列中应用的A11 Bionic应用处理器,引入神经网络处理引擎(NE,Neural Engine),面向特定机器学习算法,处理支持新iPhone中3D Sensor、人脸识别解锁、Animoji等功能。

华为

麒麟970设计了HiAI移动计算架构,首次集成NPU(Neural Network Processing Unit)专用硬件处理单元,其AI性能密度大幅优于CPU和GPU,基于AI实现智能场景识别与对象识别并进行针对性优化,提升用户拍照效果。

可以大胆推测,在2018-19年,旗舰智能手机支持专用AI芯片是大概率事件,能力具备了,但这并不意味着智能手机就真正到了愿景中的人工智能阶段。业内又在寻找基于深度学习的杀手级APP出现,其实也许这就是个伪命题,拍照、面部识别等现有应用体验的优化,更有资格成为首批AI受益应用。

SoC集成专用AI芯片大幅提升计算能力,但移动端AI体验仍任重而道远

传统CPU、GPU和DSP本质上并非以硬件神经元和突触为基本处理单元,相对于NPU在深度学习方面天生会有一定劣势,在芯片集成度和制造工艺水平相当的情况下,理论上表现将逊色于NPU。

据华为官方宣称,麒麟970相较于四个Cortex-A73核心,在处理同样的AI应用任务时,新的异构计算架构拥有大约25倍性能和50倍能效优势。以图像识别速度为例,麒麟970可达到约2005张/分钟。

严格意义上讲,现阶段我们或许并不应该期待人工智能产生全新的应用,更多应该期待的是通过人工智能技术,让现有的应用效率更高、能效更低、体验更好。目前最成熟的两个AI应用领域是语音识别和图像识别,而苹果和华为的专用AI芯片也均选择在两个领域进行突破,提升用户最常用应用的体验。

图像识别:华为的AI+慧眼、苹果的FaceID解锁

拍照现在用户最关注的体验,通过AI提升体验是个感知度高的选择。华为麒麟970通过AI实现拍照过程中场景识别、对象识别然后进行智能优化。场景识别比如运动场景、夜间环境等,提升优化运动场景下的定格清晰度与暗光拍照效果。对象识别比如人脸识别,针对不同肤色、帽子、眼睛、口罩、遮挡、侧脸等多种复杂的人脸场景进行智能检测,针对性的改善人脸部信息的色彩和补光、人脸追焦的优化等。相当于把已有的专业级拍照模型(知识库)通过AI芯片应用于用户的拍照过程中,而无需再去学习专业的拍照技能。

iPhone X在图像识别方面的面部识别解锁极具炫耀性体验,终端侧基于结构光方案建立用户脸部3D数据,解锁比对通过A11芯片中的神经网络模块神经引擎(Neural Engine )进行处理。

语音识别:AI降噪提升语音识别率、siri升级版

麒麟970A芯片I降噪是通过应用人工智能噪声模型替换传统的反相技术消噪模型,抑制非稳态噪音,增强语音信号,把高速、车内噪声大环境下的语音识别率从80%提升到92%(华为实验室官方数据)。

作为普及人工智能的启蒙应用,siri居功至伟,在新iPhone发布会上,Siri相比前几代也有明显的提升,想必也用到了苹果机器学习博客中提到的新AI技术,并进一步扩展siri的服务能力。

其他的AI应用体验,诸如,照片应用的图像识别,相册归类;听歌推荐,通过对用户听歌记录的学习来调整作出相应的推荐;智能回复/推荐,基于云端知识库预测用户的信息回复与情绪表达;续航优化,基于用户使用行为的机器学习进行调整电池管理等,都是实用性很强的AI体验。

显然,人们对于人工智能手机的期望不只是这些。整体而言,人工智能技术是一种基础能力属于使能层,集成专用AI芯片,突破的是性能瓶颈,而未来的AI体验仍将是应用场景驱动。无论是模型还是知识库还是基于AI应用,都有赖于生态合作,有赖于第三方应用开发者调用AI芯片开放的能力进行开发,进而发挥AI芯片的算力。

展望未来,移动芯片的引领制胜法宝则是人工智能、5G两翼齐飞不瘸腿

1、AI芯片成功的关键是人工智能应用生态的构建

华为与苹果几乎同时推出专用AI处理单元芯片,考虑到18个月的芯片设计周期,需要给华为麒麟芯片点赞。SoC芯片集成专用AI芯片堪称端侧人工智能里程碑,并有望快速普及,但只是人工智能的第一步,远谈不上胜利,我看到的更多是挑战。

未来AI芯片的竞争,不仅仅取决于芯片厂商自身的技术研发,更取决于生态运作能力包括垂直领域的知识库/模型合作以及第三方应用开发者,看谁的生态能够提供的应用更丰富、体验更好。对于华为而言,挑战更甚于当初在基带领域的单点突破到不断引领。

华为显然意识到了这一点,宣称将把麒麟970作为人工智能移动计算平台开放给更多的开发者和合作伙伴,提供完善的多应用模式和机器学习框架的支持,让开发者可以用自己最习惯的方式获得麒麟970的AI算力。

对于人工智能的云+端布局而言,谷歌+苹果的混合体或许是华为应该学习的榜样。

2、SoC芯片通信连接能力的提升不应被AI掩盖光芒

AI大热下,通信不再是聚光灯下的焦点,但通信连接能力的提升不应被舆论低估和遗忘。以麒麟970为例,10nm工艺、业界首款支持cat18的SoC,FDD LTE下仪表测试1.2Gbps下载速率、5CC(国内尚看不到有需求,在频谱更离散的区域有需求比如美国AT&T)、4X4MIMO与256QAM(媒体应该相对熟悉了),放在以往都是大新闻,但是今年几乎无人问津。

如果跳出移动AI芯片领域,在人工智能竞争战场上,蜂窝连接芯片是英伟达们染指蜂窝智能终端领域蛋糕的最大障碍,自然也就是移动SoC芯片商的竞争壁垒。从这个角度看,未来智能终端SoC芯片的引领之争,仍属于苹果(传在进行modem自研)、华为、高通们。

本文系作者 程贵锋gui 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

扫描下载App