本次大会共汇集了人工智能领域的国际知名企业高层、行业资深专家、专家分析机构等数千位精英,用全新视角透析行业动态,解读人工智能领域本年度海内外最值得关注的学术与研发进展。
在8月31日分论坛:AI+医疗专场上,上海交通大学生物医学工程学院特别研究员、博导钱晓华为现场观众带来了《医学影像信息系统:辅助检测、诊断和探索》主题演讲,从人工智能技术在医学领域的发展现状、人工智能以及医学影像信息系统结合应用等多个角度进行了具体探讨。
上海交通大学生物医学工程学院特别研究员、博导钱晓华
钱晓华从多个角度说明了目前人工智能在医疗领域的技术应用和发展前景。钱晓华认为,人工智能技术的发展极大推动了医疗产业进步,但医疗人工智能在本质上不可能取代医生,只能应用于医疗辅助领域。
演讲中,钱晓华还提到了过去与美国医生合作关于理解脑胶质瘤手术后真假进展问题的研究。在他看来,过去的医生认为人工智能技术发展尚未成熟,且对于人们来说人工智能就是个黑匣子,其难以理解的知识和特征阻碍了人们医疗科技的进展。因此钱晓华的团队就项目中的深度学习环节进行了特征可解释性研究,将深度学习中的抽象特征解析成医生能够理解的知识和特征,医生通过解释过的知识和特征来判断评估人工智能的诊断结果,以此推动人工智能技术在医疗领域的发展。
以下为钱晓华先生的现场演讲内容,OFweek医疗科技网作了不改变原意的整理和编辑:
接下来由我给大家做一个报告,题目是《医学影像信息系统:辅助检测、诊断和探索》。首先,我认为医疗人工智能是不可能替代医生的,只能应用在辅助领域。我简单做个自我介绍,我在去年加入上海交大生物医学工程学院,组建了自己的医学影像处理团队,目前初具规模,总共有七名研究生,合作的医院也包括瑞金医院、华山医院六院、胸科医院以及北京朝阳医院。接下来我将从以下几个方面展开今天的演讲主题。
第一,是基于非增强型缺血性脑中风的早期检测系统,工作的目标是对缺血性中风的早期预警和量化诊断。在科研上或者在后期的诊断中可以用多种模态核磁共振以及各种方式进行。但在早期检查的过程中都是采用普通CT,比如一个病人去了急诊科,不能未诊断就做核磁共振检查,这个工作是基于临床流程中的需求而进行的。这个工作已经展开了7、8年,目前的工作效果是当这个疑似区和周边区域亦对比度大于5个CT值时,该系统的判断准确率超过80%。
第二,介绍一下计算机辅助手术系统。以幼儿颅脑早闭症为例,幼儿颅脑早闭症的症状是孩子额头部位像"寿星"一样往上凸,这其实是幼儿的脑缝提前闭合,闭合之后会造成其颅内压力升高,影响幼儿智力发育。治疗方案很直接,把融合的缝直接切掉,然后塞入两个弹簧。这个弹簧需要多大的弹力?要由医生的经验来决定,而这份经验则来自以往的小白鼠实验。在美国第一个发明这个手术的医生曾经和我们合作过。他非常迫切的想解决这个问题,希望根据每个孩子的实际情况来定制个性化弹簧。
大家可以看到,这是一个典型的图像处理、机器学习加上优选分析的手术规划系统。整个系统的难点以及关键点在于对脑壳脑缝的分割和提取及特征描述,这个是本项目的最大的难点。人眼是很轻松能看到脑缝,但是计算机不懂,因为脑缝本质上不存在。现在的深度学习依然无法解决这个问题。
这是非常有意思的一个问题,深度学习很多时候需要庞大的样本量。很多疑难杂症本身样本量就少,而你又急需把这个工作客观化,让更多人学习这个系统,那么就需要传统的方式或者其他的方式来完成这项工作。我们提出了一个解决方案:以前没有人进行基于半球投影这项工作,如何将这个看似没有的东西经过投影并在一个封闭区域进行分割和提取是最大的难点。而我们的解决方案在当时获得了美国卫生部250万美元的科研基金支持。
第三个工作,是关于理解脑胶质瘤手术后真假进展问题。脑胶质瘤是一个恶性肿瘤,它的存活期只有18个月,关键问题在于该病症容易复发。它的治疗方式是先手术后放化疗,放化疗会带来一个副作用即假复发。假复发在核磁共振上显示的灰度增强区域会模拟真复发的变化形态。即使是专业的医师也无法通过片子来判断这个病人到底是真的肿瘤复发还是假复发。目前临床上的一个标准是随访,随访通常需要花费六个月以上的时间,根据它的形态变化来判断病人情况。而脑胶质瘤总共才活18个月,你花六个月以上时间去诊断,会严重影响到病人生活。
所以美国医生就找到我们,希望缩短诊断时间。围绕这个需求,我们展开以下三方面工作。第一个是基于图像技术和人工智能技术来开发一个计算机辅助诊断系统,用以提高准确率和诊断效率;第二个是通过图像和基因结合的方式来确定生物标记物,如此一来就能在手术完成后通过生物标记物尽早预测病人病况发展趋势;第三个是探讨一个新的分期方式。前几年我们自主开发了一个字典学习系统做分割,它的准确率在80%至85%之间。这个系统关键不在于系统本身,而是字典学习的可理解化。当时医生认为,人工智能技术再怎么先进,对人们来说不过是个黑匣子,不理解它的特征就不会使用。所以我们对此进行了特征可解释性问题研究。这两年我们通过深度学习的方式来做这个真假复发的诊断。图中显示的诊断系统准确率已经从80%多提高到90%以上。但这个我们仍然不放心。因为这个准确率的本质和内在逻辑与医生的逻辑是不吻合的。所以现在我们做的工作重点在于揭开人工智能黑匣子,看这些抽象特征是否真的符合医生的标准,才能判断该系统是否可靠。
第二个工作是通过图像和基因结合的方式来确定一个生物标记物。因为用相同的治疗手段治疗不同的病人会获得不同的治疗结果。我们认为这是不同的病人的基因组导致,因此要结合图像技术和基因技术对基因进行标记,手术完成后可以通过基因检测来预测这个病人病况发展趋势。
第三个工作,我们把一家医院脑胶质瘤真假复发临床记录进行了统计分析,可以发现真假复发两类病人经过不同治疗后生存时间没有显著差异。这说明两个问题,第一点说明临床上花六个月时间进行诊断是耽误治疗进度。第二点说明目前临床诊断的标准是基于影像判断,而影像的表象不一定真正能反映两类病人的本质差异。所以我们提出把图像技术和基因技术结合起来,构建两年生存风险预测模型。根据该预测模型产生的两年生存值,把病人区分为高低风险病患。这样就可以知道临床上的进一步的治疗诊断走向。
接下来我简单的介绍一下其他工作。首先是具有可理解性的深度学习模型研究。一个调制好的深度学习系统可以提供良好的诊断预测以及高度准确率,但其内在逻辑是否真完全吻合临床标准却不一定。
如图所示,在整个过程中ROC值能达到99%,但是我们经过特征返还查看,发现这些抽象特征贡献最大的区域基本不在主流部分,而是由噪声特征贡献了准确率。所以说深度学习系统和深度学习系统是不完全吻合的,其可靠性主要来自于模型的可理解性,将深度学习中的抽象特征解析成医生能够理解的知识和特征,医生通过解释过知识和特征判断评估黑匣子的诊断结果,这就是我们的工作重点。另外,我们还研发了基于影像和基因组学的脑转移瘤治疗方案决策系统、胰腺癌(早期)智能诊断/预测系统。以上便是我今天带来的演讲内容,谢谢大家!