天使轮就拿到2200万融资 数坤科技开发出国内首款冠心病全自动化诊断产品
作为公司的CEO及创始人,在动脉网之前,马春娥还没有接受过任何一家媒体的专访。
马春娥 数坤科技CEO
“刚开始成立时,我们还什么都没有,远毅资本的投资,主要看重的还是团队。”
据了解,数坤科技的创始团队成员均来自于知名企业或者世界顶级科研机构如IBM、Alibaba、GE Health等,曾从事IBM Waston、云平台、自动驾驶、生命科学、医疗服务等产品的研发和销售,具有深厚的人工智能产品和医疗服务销售的经验。
国内首款冠心病全自动化辅助诊断产品CHD-AI
和大部分医疗人工智能企业不同,数坤科技的第一款产品瞄准了心血管领域,开发了一款全自动化的冠心病智能辅助诊断系统Coronary Heart Disease AI (下简称CHD-AI)。
据马春娥称,我国每年有2到3亿的心血管患者,全球有将近2000万的患者死于心血管疾病。和肺癌、肺结节等疾病不同,心脏病的诊断流程更加复杂,CT图像需要经过复杂的三维重建,进而诊断出血管的起源、走形、血管壁的斑块、管腔狭窄等情况。
过去,医生需要先花费20到30分钟在CT后处理工作站(Workstation)进行图像三维重建,再根据重建的图片完成诊断报告。
国际SCCT规定,13个血管、18个分段,每一个分段都要分别描述,医生耗费在报告上的时间约为15到20分钟,这样算下来,一份病历整体耗时超过40分钟。
数坤科技的CHD-AI能够做到从病人原始CTA图像输入到输出符合SCCT标准的智能结构化报告,整个过程完全自动化,用时仅1分钟。
CHD-AI
据马春娥介绍,CHD-AI是数坤科技与安贞医院、北京大学第一医院、友谊医院等大型心血管病专科医院和大型综合三甲医院联合开发的一款面向临床的AI产品,同时,它还是目前行业中首个能够实现冠心病全自动化诊断的AI产品。
在友谊医院,数坤科技已经将CHD-AI接入到临床流程中,与CT、PACS、RIS等设备和系统完成对接,病人一拍完CTA片子,就会推送到CHD-AI服务器上开始自动三维重建,并自动生成符合SCCT标准的智能结构化报告。
医生只需要打开生成的三维重建图像和报告,做最后的确认即可,这极大地提高了临床报告书写的效率。
在处理一些回顾性病例时,如果出现CHD-AI的结果与医院报告不一致的情况,数坤科技的团队会和医院的专家进行反复论证,进而得出正确的结果,保证数据的准确性和符合临床标准。
此外,CHD-AI还引入了置信度机制。如果一份报告的置信度达到或者超过95%,就说明这类报告医生需要手动修改的地方几乎没有,只需要最后的检查即可输出报告。
“图像质量好且没有严重钙化的情况,数坤科技的CHD-AI在自然分布的病历中,置信度95%的病历已经达到80%。如果图像质量好、且无病情,置信度达到95%的病历则已超过90%。”马春娥告诉动脉网。
置信度较低的病历,CHD-AI会反馈给医生,提醒医生将错误或者遗漏的地方重新标识生成ground truth(正确的标注),以形成新的数据集,模型重新迭代一次,如此反复。
模型迭代需要的新增病历数目和算法复杂度有很大关系。以判断血管起源算法为例, 10个新的病历对算法就能产生改进效果;但如果是分割算法(冠脉树提取算法),由于该算法非常复杂,50个以上的新增病历才能产生改进效果。
CHD-AI的数据迭代过程
据动脉网了解,产生Bad Case的原因主要是CHD-AI当前处理能力尚待提升,以弥漫性严重钙化为例,它是心血管疾病中诊断难度较高的病情,钙化伪影会极大影响医生对血管狭窄程度地评估。
为了提升CHD-AI针对这种病情的处理能力,让算法真正做到“见多识广”,数坤科技已和北京、华北、西北、华中、华东、华南等大区的几十家医院均开展了合作,充分收集相关病例,提高算法的鲁棒性和泛化能力。
毫无疑问,这是一个不断打磨、不断进化的过程。
这个过程中,图像的处理和深度学习算法都对分布式系统和高性能计算有非常高的要求。对此,数坤科技的数据中心和云计算平台提供了强有力的保证,提供了高性能、高可用性的平台级支持。
数坤科技的团队中有大量云计算的专家,有前IBM云平台的资深平台架构师,核心开发人员,有开源PaaS标准社区的核心贡献者,他们持续活跃在各种分布式技术、容器技术、service mesh的前沿,是国内外首屈一指的云计算团队。
作为一款冠心病类人工智能产品,CHD-AI几乎可以给出所有的解剖学评价:如基于深度学习方法的冠脉树自动提取、血管自动分段命名、血管冠脉起源、斑块定性定量分析、循环类型、管腔管壁的评价。
除了解剖学指标,功能性评价指标对临床诊断和治疗也有很强的提示意义。
功能性指标包括钙化积分、FFR分数等。在与其他传统风险因子的评分系统(如佛明翰风险评分,FRS)联合使用时,CAC在预测未来心脏事件和生存率上表现出显著优越性。
同时,CAC能够将中度风险人群重新划分为较低风险组和较高风险组。较高风险组,如糖尿病患者,CAC较高预示着短期内心血管事件风险较高,而其中钙化积分为零的人群与非糖尿病患者一样很少发生心血管事件。
英国临床实践指南(NICE)中,钙化积分是否为零可作为急诊胸痛患者是否需要进一步观察的标准。而FFR分数的高低,决定着患者血管的狭窄程度是否导致心肌缺血。如果分数较高,说明狭窄没有很大程度上影响患者心肌的供血量,可能就不需要接受支架等治疗方式。
不同的场景,CHD-AI获得的采纳率也不同,患者无疾病且图像质量较高的病历,医生采纳率在80%以上;如果患者心血管出现钙化但不严重的情况CHD-AI的普遍采纳率为60%,严重钙化的情况,普遍采纳率为20%。
2017年10月,数坤科技的CHD-AI正式提交了三类医疗器械的CFDA申请(由于审批标准待制定完善,所以尚未有企业获得审批)。
“未来,我们希望能够基于心血管的研究,通过一些迁移学习和增强学习,逐步扩展到脑血管等相关的血管疾病领域。”马春娥说。
除了冠心病之外,在乳腺癌方面,数坤科技也推出了一款名为乳腺癌智能辅助筛查诊断系统Mammary Cancer AI(下简称:MC-AI)的产品。
目前,数坤科技已联合全国多家肿瘤医院构建了多中心的多模态乳腺数据库,包括超声、钼靶、MR、病理和临床数据。MC-AI实现了乳腺癌预防、筛查、诊断、治疗、预后的完整生命周期管理,现也进入CFDA的申请流程中。
医生的科研工具:深度学习科研平台
数坤科技的深度学习平台,是把深度学习的能力提供给医生的一款人工智能工具。
医生只要上传数据,就可以通过深度学习模型(疾病大脑模型),得出评估结果,包括数据的敏感性、特异性这两类国际上通用的评估指标,以及分割后的图像对比结果。心血管、乳腺乃至腹部盆腔这几类病历图像,医生都可以基于医疗数据云,利用疾病大脑模型进行科研研究。
数坤科技的深度学习平台
顶级算法科学家+顶级医疗专家 = 可临床落地的机器智能
机器智能最终要为人类服务,协助人类专家做得更快更好才有社会意义。人机协智,使得人们对疾病的认识逐渐深入。所以,要真正做一个可以临床落地的人工智能产品,需要算法专家和医疗专家的协力参与。
对此,数坤科技以疾病为中心,由算法科学家和行业医疗专家组成了疾病专家委员会,如心血管专家委员会、乳腺专家委员会。
目前,心血管专家委员会已经有将近20位来自于全国顶级医院的心血管主任医师。再加上数坤科技的技术团队成员,双方共同参与到具体的应用场景中。
专家委员会的职责主要包含四大层面:
1、定义有价值的临床问题。
2、制定数据规范、标注标准、验收标准。
3、临床打磨,提高算法临床指标
4、接入临床流程,算法指标进一步提高
“我们不会为了科研而科研,很多公司都在公用数据集上训练模型,但那算不得真正的临床数据,基于那个做出来的模型根本没办法落地,专家委员会定义有价值的临床问题,这是最核心的任务。”
原始数据的加工过程
获取脱敏数据之前,数坤科技会先经过医院伦理委员会的批准。一般来说,伦理委员会批准后,医生会将脱敏后的原始数据拷贝至医院的硬盘中,再提交给数坤科技的工作人员。工作人员将硬盘中的数据上传到云计算平台中,从而进行下一步数据处理。
参与数据标注和质检的人员,都是通过数坤科技资格和实名认证的主治医生及以上级别的医生,并且整个过程采用完全匿名的形式。数据验收及入库的环节,则是由数坤科技的算法组成员来完成。
在数据标注和质检方面,数坤科技与30多家医院、100多位医生进行合作。参与标注或质检的医生根据任务类型和难易程度不同,获得相应的酬劳。
据马春娥介绍:“拿到原始数据后,从加工到入库,整个数据的迭代周期差不多耗费三天时间。星期一早上我们发布众包任务,星期二数据就能加工好,星期二晚上系统跑算法,星期三早上新的模型就能训练出来。”
商业模式:在探索,但前景很美好
商业模式方面,数坤科技一方面通过跟医院医生进行科研合作,达到临床指标后进行成果转化,进而申请CFDA认证。另外,数坤科技还计划帮助政府打造人工智能的医疗产业园。
基于公司的器械团队的背景,数坤科技已经和GE、飞利浦等大型医疗设备厂商展开了战略合作,未来有望实现产品的上下游联动。
“目前整个行业还处于比较初级的阶段,需要更多的医学专家和人工智能专家的参与,才能将行业推动起来。作为计算机背景的创业者,我买了一大堆医疗相关的书籍,每天一有时间就会看,学得越多,就越清楚数坤科技能在哪些方面能够产生临床价值。”马春娥说。
文|郝雪阳
本文首发于微信公众号:动脉网。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。