IBM Watson被曝给出错误癌症治疗建议,是悲剧还是误会?

文 / 科技云报道
2018-08-24 20:22
科技云报道原创。

“曾经是公众心目中“人工智能”代名词的IBM Watson,在近4年砸下几百亿美元的研发投入后,前景反而愈发暗淡。医生抱怨Watson给出错误判断,多家医院终止了与Watson肿瘤相关项目,Watson真的能治病吗?”

近日,外媒Stat News爆出了IBM的一份内部文件,其中提及Watson计算机经常给出错误的癌症治疗建议,比如给一个已经大出血的癌症病人开了有可能会导致出血的药。

不过,不久后一位来自Watson合作方之一——Memorial Sloan Kettering癌症中心的发言人解释道,这其实是个假设的情况,并未真的发生在患者身上。

IBM随后回应称,Watson已经为超过8.4万名患者提供了帮助,而且它也在继续训练、学习,但这显然无法消灭一些人的怒火。美国媒体Gizmodo发文称 Watson“一无是处”,佛罗里达州Jupiter医院一名医生甚至炮轰Watson简直就是“一坨狗屎”。

Watson医疗重金入场 四年发展前景不明

在IBM的认知解决服务方案中,Watson医疗占了很大一块,与政府、医院、药企和其他健康机构倾力合作。

Watson医疗是如何工作的呢?简单说来,在医生输入患者的医疗记录后,这款超级计算机会从已经发表的研究成果里搜索与该病例相关的信息、对这些信息进行分析,然后提出治疗建议。

2015年,Watson杀入健康医疗领域的时候曾经许下豪言:Watson将惠及十亿人,能够解决、诊断和治疗80%的癌症种类中的80%的病患。

从Watson大手笔进军医疗行业起,就迅速受到广泛关注:一方面IBM对Watson的付出可谓不遗余力,大手笔招兵买马、把相关企业尽收囊中,还有无处不在的IBM Watson广告,六年间砸下数百亿美元;另一方面,Watson也顺利拿到了和诸如MD Anderson癌症中心等世界顶级肿瘤治疗与研究机构合作的机会。研发方面,单是2015年,IBM在Watson上的投入就是150亿美元。

现在,4年过去了,几百亿美元砸下,而Watson的前景却似乎越来越糟。

2016年11月,研究机构MD Anderson癌症中心,宣布停止与IBM Watson的合作。主要原因是:

1. 肿瘤专家顾问研究方向不确定:一开始定位于白血病,后来转向肺癌。因为该项目对研究方向处于评估阶段,项目投入和方向多次变化。

2. 电子病历系统对接:肿瘤专家顾问是基于MD Anderson老系统训练的,在开发期间,MD Anderson更换了电子病历系统。新电子病历系统与IBM系统不能对接。

3. 肿瘤专家顾问没有成功推广到其他医院:MD Anderson给了普华永道两千三百万美元,让后者做了一份商业计划,将肿瘤专家顾问推广到其他医院并产生收益。但其他医院对此缺乏兴趣。

4.预期收益没实现:MD Anderson在整个项目上花费了六千两百万美元,却没有见到回头钱。

简而言之,MD Anderson项目中止是因为理想和现实差距太大,投入过高没有收益。

除了MD Anderson,还有十几家IBM的合作伙伴和客户终止或缩减了与Watson癌症分析诊疗相关的项目。有十几位使用过Watson的机构和医生向WSJ记者反馈,Watson癌症应用收效甚微,某些情况下还会出错。

今年5月24日,Watson传出其医疗部门进行了大幅度裁员,范围覆盖北卡罗来纳州、德州、密西根州、俄亥俄州和科罗拉多州多处办公室,规模占总员工比例50%至70%。这场裁员发生的非常突然,行业内一片哗然,众多媒体以“医疗AI泡沫破灭”来形容这次悲剧。

Watson仅为辅助治疗 技术尚待成熟

但Watson医疗并不是所有项目都失败,另外一家与MD Anderson齐名的肿瘤医院Memorial Sloan-Kettering Cancer Center也在和Watson合作,研究肿瘤辅助系统。美国临床肿瘤学会(ASCO)每年都会发布该系统的研究进展,自2014年以来,在肿瘤多个领域都证明了AI可以提升临床决策和科研水平。

ASCO2017年显示,该系统已经运用于超过55家医院,分布在美国、中国、印度、泰国、韩国等多个国家。美国佛罗里达州的Jupiter Medical Center在2017年2月宣布引入该系统用于本院肿瘤疾病诊治,而且Watson还被用于药物研发和基因研究等多个领域。

其实,不论 Watson还是其他AI项目,难免在发展中遇到质疑。Watson技术核心是自然语言处理,以此给医院提供CDSS(Clinical Decision Support System,临床决策支持系统)。说白了,Watson就是要通过学习极大量的过往病例,给出辅助医生做决定的信息。

在Watson的报告里,Watson会给出15-20种诊疗方案。需要注意的是,这些诊疗方案里既包括推荐采用的药物、治疗方式(比如介入、手术、放化疗),也包括流程上的建议(比如建议病人直接转诊到相关其他科室)。换句话说,并不是 Watson直接给出病人诊断和治疗上的决策。

Watson把这15-20种治疗方案分成三个级别:推荐、中性、有风险不推荐。在“有风险不推荐”里,有些是FDA正在审批、但还未上市的药品,患者可能可以通过参加志愿者的实验去尝试这些还未获批的药品,也许能获得一些意外惊喜,这也是 Watson 报告里最有价值的一页。而这厚厚报告的其他部分,都是为了佐证这些治疗指导意见而给出的信息源。

Watson给出的报告,是为医生提供辅助诊断的建议。不论中国还是美国,最后做出治疗决定并承担后果的都是医生。于法、于理、于情, 医生都只会把 Watson 当成一种重要的、能够弥补医生知识或经验不足的辅助工具,绝不会把它当成可完全依赖。

在媒体渲染及IBM对Watson的大力宣传下, 大家对Watson的期待过高,甚至把 Watson拔高到了“能取代医生”的程度,导致现在发现AI真正水平不及预期后,产生很大落差。其实任何新技术走入成熟期、应用期前,都会有这个过程。

综合来看,仅凭Watson给出的结论中有错误就说其是“庸医”,其实有失公平。目前AI医疗可能更适合解决那些琐碎、重复度高的医疗工作,比如誊写病历、看X光片、检查化验单等等,这些工作可以把医生的时间解放出来。让AI本身去治疗重大疾病,无论是技术能力还是安全风险上都无法承担。

【科技云报道原创】

微信公众账号:科技云报道