在钛媒体Pro专业用户和付费用户专享的“钛坦白”在线课堂第29期,我们请来了三位钛客,给大家讲讲人工智能在医疗领域的应用。本期钛客之一、科大讯飞智慧医疗事业部副总经理鹿晓亮,加盟科大讯飞已11年,主导了科大讯飞各代语音识别引擎的设计及研发。2014年,“面向海量语音数据的识别、检索和内容分析技术研发及应用”获得北京市科学技术奖一等奖。2015年开始在科大讯飞组建智慧医疗团队,致力于将人工智能应用于医疗,目前在医疗影像、机器辅助诊断等方面都取得了较好的成果。
本文节选自鹿晓亮在钛坦白的分享。如果您还不是钛媒体Pro用户,希望查看钛坦白所有干货,进入钛坦白九个专业群交流,并查看更丰富的专业数据和信息,可点击:https://www.tmtpost.com/pro 注册。
以下是鹿晓亮在钛坦白的分享:
我是科大讯飞的鹿晓亮,今天跟大家分享一下讯飞在智慧医疗的布局和实践。
科大讯飞在人工智能领域的进展
对于科大讯飞,大家比较了解的是在智能语音领域的工作,讯飞确实在语音技术领域代表了比较高的国际水平。讯飞不仅承担了国家工程实验室类似的三大国家级的平台,还从2003年开始负责牵头制定一些国家语音标准。目前讯飞是中国语音跟人工智能领域唯一的上市公司,也是亚洲最大的语音跟人工智能上市公司。另外根据赛迪顾问的调研,讯飞在语音和人工智能领域的市场占有率超过73%。
现在讯飞整个人员规模是6000人左右,其中专业人才超过3200人,全公司50%以上都是研究、研发人员。大家都知道,百度跟华为每年在技术方面的投入比较大,大概每年十几个百分点的投入在研发,其实讯飞在研发方面的投入更大,我们每年大概有百分之二十多利润投在研发。所以说讯飞的专业人才比较多。
讯飞最早做的技术是语音合成,在该技术的表现力方面讯飞已经做到非常惟妙惟肖了。提到语音合成,这里不得不提一个国际非常有名的比赛,叫暴风雪。每年都会有像微软、IBM、卡耐基梅隆这样的著名公司或者大学参加,比赛语音合成的效果。讯飞是从2006年开始参加这个比赛,到2016年为止,我们已经是十一联冠了。
跟语音合成相对的一个技术是语音识别。现在有很多厂商都在做这方面的事情,但是对语音识别来说挑战最大的还是高噪音下的语音识别,比如在汽车里面的应用。2015年4月份还有2016年5月份,宝马、大众在全球遴选中文语音技术提供商,讯飞都是以远超第二名大概十几个点这样的比例胜出。目前在汽车方面,国内品牌的前装的市场几乎全部被讯飞占领了。
前面跟大家介绍的都是智能语音方面的进展,确实大家以前听说讯飞都是听说讯飞做语音技术比较多,其实讯飞从2014年开始就在转型,讯飞对自己的定位从“让机器能听会说”到“让机器能理解会思考”,就是说讯飞除了智能语音技术之外,正在拓展更多的人工智能技术,特别是认知智能等更高级的人工智能技术。
我们跟科技部一起启动了一个中国人工智能的重大项目就是类人答题机器人,说白了就是高考机器人,我们希望我们的机器人通过不管是深度学习也好,不管是其他的训练方式也好,能够有自己的语言理解的能力,有自己的知识表示的体系,并且能够做到自主学习、联想推理。我们的目标是,到2020年的时候它能够考上一本,到2025年的时候它能够考上清华、北大。
其实不仅是中国科技部启动了高考机器人项目,在日本、在美国,都有非常多的研究机构在做类似的事情。我觉得科技部启动这样一个重大项目,肯定不是说,就是为了研究出一个系统去参加高考,而是因为高考机器人这样的一个技术路线或者是应用场景,代表了人工智能发展的一个非常重要的阶段。如果我们的机器人或者是系统能够通过高考,比如说考上了一本,那就代表了中国人工智能发展达到非常高的程度和水平。
当然这样一个项目,挑战非常大,不是讯飞一家在做。讯飞是一个总牵头的单位,我们联合了全国大概有二十多家大学或者是研究机构一起来做这件事,讯飞的执行总裁胡郁是这个重大项目的首席科学家。
当然了这个系统确实是很难,但是讯飞也会采取很多沿途下蛋的方式,把研发项目里边的很多技术,逐渐的沿途落地,孵化出一些产品出来。比如说我们的口语翻译的技术,现在已经达到英语6级的水平。我们在2014年11月份首次参加国际口语机器翻译评测大赛就拿到了冠军,2015年的2月份美国的NIST又组织了一次国际机器翻译评测大赛,讯飞以远超第二名很多得到第一名。
除了翻译之外还有一项技术现在已经产品化,在很多地方应用,就是普通话评测。以前我们考试普通话的时候都是考生前面坐几个老师,然后老师来评测你这个考生普通话的等级水平。现在几乎各地的普通话考试,都是由讯飞的机器在做评测。机器比老师做得更客观一点,毕竟人类或多或少都会受到主观因素的影响。除了普通话考试,比如说广东高考的英语的口语考试,也是在用讯飞的机器评分。
另外讯飞还有很多的黑科技,现在也在逐步落地,比如说我们的OCR识别技术已经取得了非常大的突破,离线手写体识别方面做到97%以上的准确率,现在我们也把这样的技术应用在作文的自动评测。就是说可以帮老师改纸质的卷子。对于笔试考试,有两类题目,第一类是客观题,另外一类是主观题,客观题比如说选择题、填空题对人工智能没有太多挑战,但对于一些主观题目来说,那挑战比较大了。比如对于一篇作文需要从很多的维度来评测,语句通顺不通顺,中心思想是什么,这些对于人工智能系统确实是挑战非常大的。
现在作文自动评测技术已经用在了安徽省,比如合肥市、安庆市的会考,机器的表现更客观,更标准一些。当然这倒不是说,人工智能技术在阅卷方面已经可以完全替代老师了,我们也做了很多分析,会考并不影响一个考生的升学,老师在改卷子的时候相对就会比较随意,所以说在这种场景下,机器是胜过人类老师的。但是随着技术的成熟,我们也会把这样的技术应用在利害性更大的一些场景,比如说高考,现在我们正在跟江苏高考那边在讨论,要把讯飞的人工智能阅卷技术应用在2017年江苏的高考。
除了上面我提到的人工智能技术的进展,讯飞的认知智能在常识推理方面也取得了一些新的突破,比如说我们最新的技术成果在winograd比赛获得了第一名。在这个比赛中有很多题目,比如:
爸爸没法举起他的儿子,因为他很重。
问:谁重?答:儿子
爸爸没法举起他的儿子,因为他很虚弱。
问:谁虚弱?答:爸爸。
其实对于我们人类来说,因为有足够的常识和推理能力,这个问题非常简单,但是对机器来说,首先他没有我们人类的这种常识,另外推理能力本身也是一个很大的挑战。
另外NIST还有一个非常重要的比赛KBP,这个比赛里边,会给我们的系统很多语料,系统学习之后,要能够找出语料里面出现各种实体之间的关系。比如下面这张图里就是美国大选期间,特朗普炮轰杰布布什“伊拉克战争都是你哥哥的错”,系统通过学习之后,要能理解这句话的意思,就是美国前总统布什发动的伊拉克战争。
其实讯飞是一个非常典型的技术驱动型的公司,讯飞有个理念就是“顶天立地”,顶天就是我们会投入巨大的资金和人力进行核心技术研究,立地就是要把技术应用到各个领域里去。
科大讯飞在做智慧医疗领域战略规划时的想法
其实讯飞启动做医疗,并不是非常自然而然就切入到人工智能+医疗这个领域里,当时我们做了很多的商业分析和战略分析。
讯飞要做医疗,第一个想到的就是医疗信息化,比如说医院的信息化系统——HIS、EMR,甚至包括区域卫生平台这样的项目。其实拿2015年的数据,整个医疗信息化的市场,其实不是特别大,大概260多个亿,包括硬件、软件和服务。如果把硬件给去掉的话,纯软件和服务的市场也就大概73个亿的规模。这样的市场规模,有很多传统的医疗信息化的厂商在里边拼杀,比如东软,东华、卫宁、天健等很多在这个行业做了一二十年的公司。讯飞要进入这样一个市场,显然想象空间不是很大的。
其实还有另外一个数据,就是医疗卫生的总费用4万个亿,占中国GDP的接近6%,这对于讯飞来说才有更大的想象空间。
从另外一个维度来说,现在中国有一个非常严重的现象,就是看病难看病贵。很多人看病想去知名医院找专家,这就造成了,知名医院里边病患会非常非常多,而在下级的医院病患相对比较少。我们的政府包括卫计委其实也想改善这样的就医现状,想引导一种就医的新秩序,就推出了分级诊疗政策,最核心的点就是基层首诊、双向转诊、急慢分治、上下联动。
这样一个制度的推行需要一个非常完善的全科医生制度以及一个非常强大的全科医生的团队。但中国的全科医生(家庭医生)制度是缺失的,全科医生队伍也是非常不健全的,基层医生的能力相对还是比较欠缺的,难以起到健康守门员的作用。
现在很多地方也开始采用医保这个杠杆来强制推行分级诊疗的政策,比如说很多地方就会规定某些病种你到三级医院去看就不给你报销,只有到社区医院去看才会报销。可是按我的理解,很多人把疾病当做一个黑匣子,生了病就去找专家,去知名医院看病。另外确实现在很多人也不差钱,特别是孩子生病的时候,熬夜排队也会带他去大医院,找比较知名的医生。
所以说,很多因素综合起来,导致分级诊疗这样一个非常理想、非常美好的政策很难推行下去。其实再深究一下,中国看病难看病贵,最根本的原因就是医疗资源,特别是优质的医疗资源比较缺乏。在这种情况下,通过信息化的手段,其实很难从本质上解决问题。解决这个问题的最终极方法就是培养更多优秀的医生,但是这是相对非常漫长的过程。
如果我们能够以人工智能帮助医生,提升他的工作效率,增强他的能力,比如说通过机器辅助阅片帮助提升我们医生阅片的能力,通过一些辅助诊断技术,在医生诊断跟治疗的过程中,给他提供一些建议和方案,分级诊疗才有可能早日到来。
科大讯飞在人工智能+医疗的具体实践
大的战略方向确定了,就到具体的产品方向的规划了。现在我们在产品方向上规划了三大方向,分别是智能语音技术在医疗中的应用、智能影像辅助诊断、辅助诊疗系统。
- 智能语音技术在医疗中的应用
其实智能语音的应用在美国跟欧洲其实已经是非常稀松平常的事情了,美国有一个叫NUANCE的公司也在做智能语音技术,也是个上市公司,大概每年是20亿美金的收入,其中有十个亿的美金来自医疗方向。NUANCE给医生提供语音转写的服务,医生在看完病人之后可以直接拿着设备通过录音把患者的情况记录下来,然后后台通过人工+机器的方式,给医生形成一个比较完整的结构化的电子病历。
其实在语音识别进入到医疗之前,美国的医生已经开始通过录音的方式记录病患的信息,只不过当时是后台通过人工的方式来帮他转成文字,再转成最终结构化的电子病历。讯飞是一个以智能语音起家的公司,也希望把中文语音识别应用到医疗中去。
我们跟北大口腔合作了一个语音电子病历系统,在口腔医生工作的过程中,他们会佩戴一个讯飞专门定制的一个麦克风,这个麦克风的定向性和降噪性会非常强。语音识别把医生口述的内容全部转成文字,这样还不够,医生最终需要的其实是一个结构化的电子病历,所以我们除了语音识别,还加入了更多的人工智能的处理的技术,最有代表的就是自然语音理解,我们会把医生口述的现病史、既往史、检查结果给结构化分段出来,形成一个最终的结构化的电子病历。
当然除了在口腔门诊这样一个应用场景之外,在很多场景比如病理、影像等也可以使用讯飞的智能语音技术来书写电子病历。
- 智能影像辅助诊断
说到影像,其实本期钛坦白第一场的陈博士(相关文章:https://www.tmtpost.com/2568282.html),还有第二场的刘圣总(相关文章:https://www.tmtpost.com/2569006.html),也谈到了这方面的事情。我还想跟大家提一下深度学习。
从2006年HINTON发表了一篇非常重要的文章,验证了深度学习的重要性,之后就开始在其他很多领域里尝试使用,其实到目前为止,深度学习最成功的两个领域,一个是语音识别,一个是图象识别。对于图象识别来说,确实最近几年的进展非常非常大,在一些人脸识别的国际比赛的任务中,很多系统都已经超过我们人类的分辨率了。所以说计算机在识别一些细节方面,确实是比我们人眼准确率更高。
那自然而然的,我们就想到,要把这样的技术应用在医疗影像的识别里去。我们访谈过很多影像科的医生,他们真的是非常非常的辛苦,早上七八点开始上班,一直工作到下午七八点,每天就是对着屏幕,每天最重要的任务就是对着屏幕看影像里边有没有结节,有没有病灶。很多医生告诉我们,他们每天上午精力还比较充沛,准确率还会比较高,但是到下午,注意力往往有些分散,他们在看影像的时候一些比较小的病灶有可能会被遗漏掉。
讯飞第一代医疗影像识别系统前段时间已经做出来了,这个系统的任务就是识别CT影像里边的结节。我们每做一次CT,比如做一次肺部CT,大概要拍几百张图片,医生就要从几百张图片里面来找哪张图片里有什么结节,有什么病灶。我们通过基于深度学习的影像识别方案,可以很容易地帮医生定位到一些比较细小的结节或者病灶上面去,给医生的工作效率带来很大提升,也可以帮助医生极大地降低漏诊率。
当然除了肺部结节之外,其他一些产品,包括X光目靶的乳腺癌,包括脑部的核磁共振,也包括上场钛坦白刘圣总说的病理的智能分析和识别,在陆续开发出来。
- 辅助诊疗系统
我们还有一个更大的梦想,就是希望构建一个人工智能的辅助诊疗系统,类似ifly doctor这样的概念。其实类似的人工智能的辅助诊疗系统,现在很多大的机构也在做,比如IBM Watson。IBM Watson从2015年开始成立了一个叫Watson Health的部门,就开始大力投入医疗。IBM Watson号称已经在美国,包括纪念斯林凯特林癌症中心等几大癌症中心学习了几年,已经可以开始帮助医生治疗癌症了。
讯飞的技术路线其实跟IBM的比较相似,都是基于认知计算。其实人工智能辅助诊疗系统,还有另外一个学名就叫CDSS,也就是临床决策支持系统,这样的一个系统,上个世纪70年代就已经有第一代的系统出来了。但是当时的系统,主要是通过专家系统的方式来构建的,就是说构建辅助诊疗系统的时候我需要很多专家来整理出非常结构化的知识,然后让机器去学习。基于专家系统最大的一个问题就是知识库维护成本太高了。所以说虽然七十年代的时候已经有第一代的辅助诊疗系统面世,当时在业界引起了非常大的轰动,最后却没有得到非常好的推广,基于专家系统的这样一个技术的短板是一个非常大的原因。
而我们现在要构建的这样一套辅助诊疗系统是基于认知技术的方案,我们希望机器能够读懂教科书,能够读懂各种医疗的文献,然后形成自己的知识体系,他在面对一个新的病患的时候,能够根据这个病患的数据做推理,在自己的知识库体系里边形成他的诊断、治疗建议。
当然我们跟IBM沃森的定位还是不一样的,IBM沃森现在是专注在癌症治疗,我们希望能够帮助基层的医生。就像我最开始说的那样子,我们的政府在推分级诊疗的政策,而分级诊疗的最核心的一点就是要加强基层。
我觉得这样一套系统真的应用到临床里边,有两大挑战:第一个是在技术方面,我们的机器要有自主学习、推理、理解各种医疗文献的能力;另外一个挑战是在产品设计方面,怎么无缝地切入到医生的工作流里边去,因为我们的这个系统的定位还是辅助诊疗,并不是代替医生的,而且要给医生的诊断和治疗提供一些建议和帮助。
讯飞在清华大学有个联合实验室,他们在承建讯飞的辅助诊疗系统的研发。
以上就是讯飞在医疗方面的一些实践。讯飞在做人工智能+医疗方面是有非常大的优势的,比如说在人工智能方面有很多积淀,当然也有非常大的短板,就是讯飞没有医疗的储备。所以在这方面,我们开始推进非常广泛的战略合作,包括北大口腔、安徽省立、上海六院,大家一起来推进人工智能+医疗的发展。我们还会跟协和医学院共建一个医疗人工智能研究中心,讯飞会帮助协和医学院在全球遴选研究中心的带头人。
钛坦白群友交流:
群友:鹿总,我有个问题请教,从现有人工智能水平来看,它适合做什么,不适合做什么?就医疗领域来说,您认为适合人工智能的具体应用有哪些?
鹿晓亮:随着技术的进步,构建一套面向基层医生的辅助诊疗系统是可能的,近期我们已经将人卫出版社的部分科室的电子书导给机器去学习,另外,也辅助加了很多典型的病历分析报告。但是除了技术之外,还有很多工作要做,比如跟政策相关的,比如如何利用已有技术设计一套无缝切入医生工作流的产品,这些都是需要逐步完成的工作。另外,除了面向基层医生的辅助诊疗系统外,人工智能技术用于某些专科或者单病种,进行比如急性肾衰竭的预测等方面也是一种比较好的应用场景。AI+医疗是个大方向,有广阔的前景,刚需在那里了,就看技术和产品了。
群友:是的,医疗市场很大,除AI技术之外,还有一些其他科技新技术也在应用,比如CT等诊断仪器小型化,血液化验等检测仪器智能化,都有很广阔的前景,极大提高基层医疗单位的医疗能力。
鹿晓亮:所有方向里边,我最不看好互联网+医疗,因为互联网链接一切的特性没能解决医疗资源缺乏的根本问题。
群友:同意鹿总观点,技术创新优于模式创新,现阶段科学技术创新发展大潮已来临,是一个极好的机会,但是要有自己的核心技术。
(本文独家首发钛媒体,根据科大讯飞智慧医疗事业部副总经理鹿晓亮在钛坦白上的分享整理)
……………………………………
钛坦白第29期,人工智能在医疗健康领域的应用,三晚上的分享已经结束。
看干货:https://www.tmtpost.com/tag/1508094
钛坦白第30期预告:跑步和相关赛事运营
时间:2月20日、21日、22日,每晚7点开始
地点:钛坦白|体育(微信群)
报名听课、参与互动:
钛坦白目前有医疗健康、人工智能、文娱社交、VR/AR、区块链、支付创新、体育、云计算、SaaS等九个专业交流群。
1、钛媒体Pro专业版用户,可以点击链接https://www.tmtpost.com/pro,登录账号,点击进入“在线课堂”,在线免费、任意选择自己要进入的群,按提示操作;
2、非钛媒体Pro专业版用户,可以添加微信号taitanbai0,在通过好友后,发99元红包给小钛,你将有权利从九个群中任选一个群进入,长期听课、交流。请告诉小钛你要进入哪一个群,然后等待小钛拉你入群~
推荐钛客、赞助、合作:
请与钛坦白负责人佳音联系,邮箱jiayinge@tmtpost.com
根据《网络安全法》实名制要求,请绑定手机号后发表评论
厉害了,一直在用讯飞的灵犀语音助手,感觉很赞!
現在不管什麼設備,只要有語音交互功能,我做的第一個事情就是關掉它,用語音識別做自動數據收集可以,用於和人交互,還差得很遠。
厉害了