这是钛媒体专业用户和付费用户专享的“钛坦白”公开课第29期,我们请来了三位钛客,给大家讲讲人工智能在医疗领域的应用。本文根据本期钛客之一、前麦肯锡资深咨询师、DeepCare 羽医甘蓝科技创始人、CEO刘圣的分享整理。
如果您还不是钛媒体Pro用户,希望查看钛坦白所有干货,进入钛坦白九个专业群交流,并查看更丰富的专业数据和信息,可点击:https://www.tmtpost.com/pro 注册。
以下是刘圣在钛坦白的分享:
我叫刘圣,我们公司叫DeepCare,就是deeplearnig和heachcare两个单词的组合,我们主要做的是把深度学习运用在医疗影像的识别上。
市场的需求
病理被称为是医生的医生,服务对象其实不是病人,而是临床医生。也就是说,病理医生会诊断出病人罹患的是良性的肿瘤还是癌症,如果是癌症,会给癌症分期分型,然后把这个诊断交给临床医生。临床医生会根据这个诊断来给病人制定治疗和用药的方案。
讲到这里,我来问大家一个问题,大家都知道现在看病很难,不知道有哪位朋友花钱买过黄牛的票呢?我们买专家号看到的医生和我们挂普通号看到的医生,在诊断大病上的精确度到底有多大的差距呢?
两个月前,我们做了一个实验,请了北京的特级三甲、普通三甲和地方上的三甲医院的一共四名医生看70张乳腺癌转移的片子。这四名医生的年资分别是40年经验、30年经验、20年经验和10年经验。70张乳腺癌的片子有30张是阴性的,就是说没有癌细胞的,有40张是阳性的就是有癌细胞的。
我们请这四位医生看这70张片子,那位40年经验的医生的准确率达到了98%以上,剩下的三位病理医生,他们的平均准确率在70%左右。
就这个实验来说,专家和普通医生差距确实还是挺大的,怪不得黄牛号这么贵。我们做这个实验,一方面是为了比较不同的医生看病理切片的诊断会有多大的差异,另外一方面,我们用我们的算法也对同样的70张片子进行了诊断,当时我们的准确率是93%,那是在两个月以前,现在我们准确率已经超过了95%。
从这个实验也可以看出,一方面,中国的医疗资源确实是非常不平均,专家和普通医生之间的差距确实非常的大;另一方面,在一个定义非常明确的问题之上,算法其实可以做到比人或者是比一般人更好,可以无限接近最厉害的或者是最强的那个医生的水平。
我们现在在做的事就是和北京的这些病理科,全国最强的科室的医院合作,开发出智能算法,然后把这些算法运用到基层医院和三四县城市当中去。
下面这张图片,左边是属于正常的细胞,右边属于癌变后的细胞。为什么一个病理医生这么难培养?因为有上千种疾病可能有上万种不同的变化,这些变化让任何一个人用人脑来记都是非常非常困难的。
一张病理切片里面包含的信息是非常大的,有十几亿个像素点,一张压缩过的图片大概也有几个G的大小,这么大量的信息让人的眼睛来观察,可以说非常辛苦,这种工作其实是非常适合计算机来做的。
在中国病理医生非常的缺乏,大概平均七万中国人一位病理医生,而在美国是平均两千人一位病理医生。中国如果想达到美国的这个数字,按照中国现在培养病理医生的速度大概要200年。我们在做的事情就是用人工智能的方式来弥补这个供需上的不平衡。
算法上的实现
下面这张图片是我们诊断的流程。我们会把处理切片的算法分成三步:
- 第一步,预处理。就是把含有组织的这个部分从切片上面挑出来;
- 第二步,神经网络的处理分类。先把这些挑出来有组织的部分切成小块,大家看这个图的右上角,每一个小块有一定大小,模拟医生在显微镜下看到的大小,然后把每一个小块放到显微镜神经网络里面,判断这个小块里边是否含有癌细胞。大家可以看到,下面中间的这个蓝色的图就是最后结果的一个可视化的表达,它其实是一个热力图;
- 第三步,后处理。就是从一个热力图得到最后的诊断报告。
我们的很多技术壁垒都是在第三步,这里有很多的医生的先验知识,比如我们希望能把医生脑袋里边的算法变成电脑的算法,所以在这个里边,我们一共从大概六十几个不同的维度,有医学方面的维度,也有非医学方面的维度,共同来处理热力图,最后把它变成一句话的诊断,比如说这是什么癌,什么类型。
我们打算分成三步实现:
- 第一步,勾画病灶。我们会先在切片当中勾画病变的区域,像下面这张图表现的一样。
- 第二步,分型。我们会对勾画的区域进行判定,比如说肺癌分成五个比较大的亚型,它是哪一种亚型,乳腺癌分成四个亚型,它是哪种亚型。
- 第三步,分期。比如乳腺癌分成三期,国际上通用的标准叫做诺丁汉分期,病人属于不同期,临床大夫的治疗方案是完全不一样的,比如说级别高的就要进行化疗,级别低的可以保守治疗或者用激素治疗。
产品化的一些想法
很多朋友一定会问,算法要多准才可以用?要怎么样用?大家可以看看下面这张图:
最左边就是病理切片的图片;
中间这张图的纵轴叫敏感性,横轴叫特异性。敏感性、特异性是两个相对的指标,敏感性指的是查全率,特异性指的是准确率。比如咱们一百个人里面有十个坏人,敏感性衡量的是我有没有把这十个坏人都找到,特异性衡量的是这十个坏人有没有抓对。比如说从敏感性来讲,我如果只找到了九个坏人,我的敏感性就是90%,那从特异性来讲,如果我抓了20个人才把这十个人都抓对,我的特异性就是50%。
这张图就表现了一个比较可能的场景,就是说当它的敏感度已经达到99%以上的时候,它的特异性可能是在50%到60%,也就是说我确定每一个坏人我都会抓到,但是我大概只有60%的可能性抓到的是正确的坏人。其实在医疗行业里边,敏感性是更重要的,特别是对于我们这样的人工智能的算法来讲,敏感性一定是要在99%以上,就是我不能够错放任何一个坏人,但是我可以抓错,因为最后还是要医生来看。
其实有很多的切片是阴性的切片,意思就是说它其实是没有癌细胞的。比如卵巢癌的患者,因为卵巢有一对,所以可能会有很多取材的点,有一些病人可能取得多会有三四十张切片,三四十张切片里面可能只有大概两三张会有癌细胞,可是病理医生他还是得看完所有的三四十张才可以最后得出个结论。我们想要使用这个产品的一种方式就是像下面这张图表示的,我们先把阴性的片子(减号的片子)全部筛出来,这些片子医生就不用再看了,医生只要看阳性的片子就可以了。
我们刚才看到的其实都是H&E染色的切片,这种切片是最常见的切片,在这之后,近几年像免疫组化、分子病理其实非常的流行,这些都和图像相关,就是说病理医生会根据图像来判断病人的分子变异的靶点,比如说蛋白子变异的靶点。
我们接下去会一步一步的往下延伸,就是除了我们从病理切片开始入手,接下去像免疫组化、分子病理,我们未来都可以涉足。
我们的第一个产品主要是针对乳腺癌的识别和分析、分期、分型。国家在推两癌筛查,一个是乳腺癌,一个是宫颈癌,乳腺癌对于很多女性朋友来讲其实是治愈率非常高的一个病种,在美国的五年存活率大概95%,可是在中国这个数字只有百分之七十几。在全癌种来讲,美国的五年存活率在60%多,中国这个数字才百分之三十几。我们希望通过我们自己的一点点努力,可以让中国的乳腺癌患者甚至是所有癌症患者的存活率可以有一些提高。提高的方式就是及早发现癌变。
我们现在的这个产品已经在二十多家医院里进行试用了,主要都是在三四线城市和县城里边,一些二甲及二甲以下的医院。
国家卫计委在去年年底和今年年初连发了两道红头文件,大力推动了把四个科室独立出来,包括影像科、检验科、病理科和血液透析科,进行集团化或者是公司化运营。这种独立诊断中心在美国占市场的份额大概是40%,在日本占的是70%,在中国大概只占到4%左右。未来,独立的病理中心、影像中心必然成为趋势,我们这个算法以后一定会借着这股政策上的东风,很快地普及到基层医院里面去。
钛坦白群友Q&A:
1、请问刘大大,这套识别流程对其他疾病的识别是不是也能复用呢?
刘圣:每个疾病都要重新训练,所以只能一个疾病一个疾病来。主要是数据的标注,技术路线是一样的。
2、请问刘总,目前你的商业模式是和医院的病理科合作,通过承接他们的图像分析,获得收益?
刘圣:其实我们急着产品化,但是不急着商业化。所以目前医院都是免费试用,未来我相信只要创造出价值,一定可以找到商业模式。医疗是个慢生意,人工智能也是个慢生意,两个加一起就更慢了。
3、刘总你好,卷积神经网络构建后通用性较为强,现在,在CT、MRI影像领域比较多。不知道,在心电图辅助诊断、内窥镜这些小众领域,是否有价值?
刘圣:内窥镜一定可以,我们之前有做过。心电图也有可能,但是一般的心电图其实不需要CNN来做,冠状造影可能更可以发挥CNN的优势。
(本文独家首发钛媒体,根据DeepCare 羽医甘蓝科技创始人、CEO刘圣在钛坦白微信交流课上的分享整理)
………………………………………………
钛坦白第29期,人工智能在医疗健康领域的应用,三晚上的分享已经结束。
干货会陆续发布:https://www.tmtpost.com/tag/1508094
钛坦白第30期预告:跑步和相关赛事运营
时间:2月20日、21日、22日,每晚7点开始
地点:钛坦白|体育(微信群)
报名听课、参与垂直人群互动:
钛坦白目前有医疗健康、人工智能、文娱社交、VR/AR、区块链、支付创新、体育、云计算、SaaS等九个专业交流群。
1、钛媒体Pro专业版用户,可以点击链接https://www.tmtpost.com/pro,登录账号,点击进入“在线课堂”,在线免费、任意选择自己要进入的群,按提示操作;
2、非钛媒体Pro专业版用户,可以添加微信号taitanbai0,在通过好友后,发99元红包给小钛,你将有权利从九个群中任选一个群进入,长期听课、交流。请告诉小钛你要进入哪一个群,然后等待小钛拉你入群~
推荐钛客、赞助、合作:
请与钛坦白负责人佳音联系,邮箱jiayinge@tmtpost.com
根据《网络安全法》实名制要求,请绑定手机号后发表评论
不急着商业化,如何支撑!?人工智能现在算是在一个资本市场的风口上,但是不能尽快得到商业模式的实践,还是比较难长期的运作!
我觉得跟医疗相关的话,还是更加谨慎点比较好,如果出事情了,谁也担不起,像siri,灵犀语音助手这样可以娱乐和服务性质为主的人工智能玩玩还不错,其他的还是等更成熟点吧。