未来人类如何看病?中国医疗 AI 这一发展趋势你必须清楚

2019-02-22 18:21 来源:丁香园 作者:
字体大小
- | +

开年之作,气魄非凡

北京时间 2 月 12 日,《Nature Medicine》在线刊发了由依图医疗与广妇儿联合科研团队完成的题为《使用人工智能评估和准确诊断儿科疾病》(Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence)的文章。这是全球首次在顶级医学杂志发表有关自然语言处理(NLP)技术基于中文文本型电子病历(EHR)做临床智能诊断的研究成果,也是同类文章迄今为止的最高分。

1.jpg

此篇论文由广州市妇女儿童医疗中心团队、美国加州大学圣地亚哥分校专家团队和依图医疗团队等共同完成。广州市妇女儿童医疗中心主任夏慧敏教授、数据中心梁会营博士博士、医务部孙新主任及儿内科门诊何丽雅主任团队完成了儿科智能辅助诊断的应用场景设计。

作为国内近年来医学 NLP 领域最为重磅的科研成果,消息一经发布即引起多方关注。《人民日报》、《参考消息》、新华社等 100 余家国内知名媒体进行专题报道,引发数百次转载,依图作为中国 AI 企业代表更是一周内 2 次登上《人民日报》,国家对于医疗 AI 产业关注可见一斑。

2.jpg

3.jpg

学术层面,前有 DeepMind 团队 2018 年完成的「Clinically applicable deep learning for diagnosis and referral in retinal disease」,在眼科疾病的 AI 辅助诊断上的突破性进展,后有此次在医学 NLP 领域尤其是 AI 模型的构建上取得了长足进步,医疗 AI 辅诊正在不断取得突破。

这是在智能影像辅助诊断飞速发展之后,NLP 技术在智能辅诊领域内的一次里程碑式的进化,标志着 AI 模拟人类医生进行疾病诊断时代的到来。

「AI 医生」的梦想从未如此靠近现实。

4.jpg

广州市妇女儿童医疗中心主任 夏慧敏教授

夏慧敏教授表示,未来在医院互联互通的趋势下,几个区域性医疗中心数据之间可进行互相比对,从而能够使产品的使用范围更广。到 2020 年,国家卫健委所有三甲医院电子病历达到 4 级以上水平,语言标准统一、标准电子病历互通互联,相信人工智能辅助诊断系统的广泛应用这条路不会太长。但须要清醒认识到,我们仍有很多基础性工作要做扎实,比如高质量数据的集成便是一个长期的过程,因为大数据的收集和分析需要算法工程师、临床医生、流行病学专家等在内的多专家通力合作。此外,人工智能学习了海量数据后,其诊断结果的准确性仍然需要更大范围的数据对其进行验证和比对。

「读懂」136 万份病历   医学 NLP 年度重磅成果问世

5.jpg

依图医疗 CEO 倪浩

在依图医疗 CEO 倪浩看来,这种认可更多来自于对于未知领域的开拓性创新:「我们给出了一套适用于当前临床环境,利用原始电子病历进行智能辅助诊断的一整套理论体系和实践方法,虽然并不完美,但是目前世界上可见的理论体系中相对完整且被证明有效的。」

如同《流浪地球》中高达 1.1 万米的行星发动机的瑰丽想象,采用 AI 替代部分临床工作,乃至替代人类完成诊疗决策一直是众多 AI 学者及医学专家的梦想。然而作为高度复杂的决策过程,「诊断」并不是简单的逻辑推理游戏,它对于决策者的医学知识储备、逻辑分析能力、社会经验、真实案例积累等等都提出了极为苛刻的条件。

以医学 NLP 领域为例,由于诊疗规范程度不一致、书写习惯不同等多种原因,临床上,电子病历不仅格式各异,即便是同一疾病的表述也各有不同,如「发烧」一词就可能有「高热」、「发烧」、「高烧」等多种词汇表达,对于需要精准理解自然文本并进行决策的 AI 模型带来了挑战。

即便是 AI「读懂」了电子病历,想要让 AI 同人类医师一样,从语音及文本中高度智能的提取关键信息,并根据决策需要主动发问,补全决策所需要素,更是难上加难。

联合科研团队在全球范围内率先解决了上述 2 大难题。

为了实现对于电子病历信息的高效治理及分析利用,并以此为基础构建 AI 辅诊模型,依图医疗的科学家们与广妇儿专家团队提出并测试了一个专门对电子医学病例进行数据挖掘的系统框架,将医学知识和数据驱动模型结合在一起。该模型先通过 NLP 对电子病历进行标注,利用逻辑回归来建立层次诊断,从而实现对于常见儿童疾病的 AI 辅诊。

6.jpg

专门对电子医学病例进行数据挖掘的系统框架

自 2016 年 10 月起,联合科研团队针对广州市妇女儿童医疗中心在 2016 年 1 月至 2017 年 7 月间的 567,498 个门诊病人的 1,362,559 次问诊电子病历,抽取到覆盖初始诊断包括儿科 55 种病例学中常见疾病的 1.016 亿个数据点,并将这些信息用于训练和验证系统框架。此次研究同时还基于 NLP 实现了病历的结构化。

研究过程中,拥有超过 25 年临床实践经验的资深主治医师手动注释了 6,183 个图表,然后用 3,564 张人工标注的图表对 NLP 信息提取模型进行训练,并用剩下的 2,619 张图表对模型进行验证。该 NLP 模型总结了代表临床数据的关键概念类别,利用深度学习技术自动将电子健康记录(EHR)注释到标准化词汇和临床特征中,从而允许对诊断分类进行进一步处理。

在广州市妇儿中心医务部主任孙新看来:「专业儿科医生高质量的先验医学知识输入成为这套系统的关键优势」。

7.jpg

训练 AI 理解海量电子病历中的临床特征数据

性能测试中,科研团队抽取了 1.2 万电子病历,并召集 20 位临床医师与之进行性能对照。结果显示,这套基于智能病种库搭建的 AI 辅诊模型在 55 种儿科常见病的诊断准确率已经接近 9 成,部分疾病如急性上呼吸道感染,其诊断准确率已达到 95%,其性能超过低年资儿科医生,接近高年资儿科医生。

8.jpg

AI 模型的平均得分 0.885,高于医生组 1 平均分 0.841 和医生组 2 平均分 0.839

广州市妇儿中心儿内科门诊主任何丽雅认为:在可预见的时期内,这套 AI 模型拥有空前广阔的应用场景,例如在分诊环节,通过记录基础数据让模型产生预测诊疗结果,并通过这个结果评估病人的优先级,以确保医生可以按需就诊。此外,基于 AI 的诊断模型还可以帮助医生诊断复杂或罕见病症,提示可能情况,避免由于医生受限于自身专业或经验,在复杂病症出现时出现误诊。可以预见的是,这个模型不仅能在医疗资源短缺或不均的地区发挥巨大作用,也将为全世界带来重要的普适进步意义。

倪浩透露:「此次成果的核心技术部分,实际上是通过深度学习技术与医学知识图谱,对 EHR 数据进行解构,从而构建了高质量的智能病种库。使得后续可以较容易地利用智能病种库建立各种诊断模型。而诊断模型证明了基于 AI 的系统可以帮助医生处理大型数据和辅助诊断,同时在诊断的不确定性和复杂性上给予临床支持。」

目前,该系统在广妇儿 2019 年的第一季度调用量已经超过了 3 万次,相当于一位儿科副主任医师一年的门诊工作量。

夏慧敏教授对 AI 辅诊未来寄予厚望,他表示:「国家大力推进的人工智能规划,让我们看到了契机,基于信息化产生的优质医疗大数据落地 AI 技术和平台,既能在一定程度上解决医疗服务能力不足的问题,又能提高健康服务的公平性和可及性。我们希望,人工智能 AI 可以帮助边远、基层、年轻的医生,为基层儿科医生和年轻儿科医生提供辅助诊疗服务,为患儿家长提供智能自诊服务和权威的第二诊疗意见,避免误诊、漏诊造成的医疗风险。」

医学 NLP 技术或与语音技术融合

此项研究完成后,依图医疗在儿科领域还会有哪些探索?

对此,倪浩表示,单在儿科领域,依图医疗已经拥有了覆盖「诊前—诊中—诊后」的全链条产品矩阵,如智能导诊、智能预问诊、智能辅诊等多个 AI 产品,并已经在广妇儿、上海儿童医学中心、厦门大学附属中山医院多家三甲医院实现落地试用。未来,依图医疗将致力于与医疗机构展开深入合作,在临床实践中打磨产品,不断提升产品性能,服务临床。

另外,他还透露,未来该 AI 辅诊系统有望与依图的自然语音识别技术进行深度融合,将问诊流程中产生的语音数据实时转化为文字并提供给 AI 模型进行智能分析,问诊完毕后医生获取辅诊结果及检查建议,进一步减少医生负担,提升临床诊疗效率。

世界 AI 看中国

随着中国医疗 AI 技术水平的提升,近年来,越来越多的顶级科研论文开始登陆 CNS(《Cell》、《Nature》、《Science》),同时,各个细分领域的医疗 AI 产品也正在以肉眼可见的速度迅速在各家医院铺开临床试用。

「中国政府对于医疗 AI 行业的大力扶持、海量的高质量医疗数据、丰富的 AI 人才、医疗机构对于 AI 产品的迫切渴求以及临床专家的开放态度等多方面因素共同推动了医疗 AI 行业的兴盛,」倪浩表示,「其中,高质量的医疗数据与医疗机构的开放态度至关重要,在与广妇儿专家团队的合作过程中,医疗机构对于 AI 的开放态度与专业水平令我们备受鼓舞。」

此次研究中,来自横跨 2016-2017 年间创纪录的 136 万份真实病历数据颇为引人注目。中国拥有全球最为丰富的医疗数据资源,并且随着医院信息化的发展和民众诊疗需求的释放仍将持续增长,如何对对临床积累的海量临床医疗数据进行治理?如何挖掘海量数据中的科研价值?如何基于海量数据进行临床质量管理,实现医院管理的智能化升级?成为困扰众多医疗机构的共同难题。

作为 AI 领域先行者之一,华西医院在国内率先开展应用 AI 技术治理医疗大数据,构建智能病种库,并以此进行 AI 应用研发。华西医院院长李为民教授曾表示:中国并不缺数据,真正缺乏的是系统的、标准的医疗大数据,这些没有经过人工智能技术治理的医疗数据标准各异、存储分散、质量参差不齐,并不能称之为真正意义上的医疗大数据,不仅临床研究价值受到限制,更遑论利用这些数据去开发人工智能应用。

2018 年 6 月,依图医疗与华西医院深度合作,共同完成了国内首个肺癌临床科研智能病种库的建设,2 万余例经病理确诊的肺癌患者信息实现全部信息 AI 自动入库,完成了多模态、全周期的数据 (从风险因素到就诊过程,从实验室检验到影像检查再到病理,从诊疗方案到预后信息) 在一个科研数据库中的集成,实现了科研信息的自动化提取与分析,将万量级患者的全维信息提取时间从年级别压缩至月,并成为强大的科研数据质量控制工具。

「智能病种库的诞生对于科研工作者而言是革命性的,无论是信息的自动入库、治理,还是关键信息点的自动提取,以及基于此进行的 AI 模型构建,都将科研工作效率直接提升了一个数量级,科研质量也迅猛提升,」倪浩说,「手工科研与智能化科研之间的差距如同火铳与自动步枪的区别,双方将会产生科研能力上的代差。」

医疗人工智能正在迎来最好的时代

随着越来越多的医疗人工智能产品走进临床,业界对于人工智能产品的性能及前景的认知逐步深入,而暴露出的问题也越来越多,并引发了不少争议,热潮之后,医疗人工智能是否正在撞上「新秀墙」?

「真正沉下心来,专注于医疗 AI 的人工智能企业正在迎来最好的时代,」倪浩表示,「在经历 AI 大发现的狂热之后,医疗人工智能正在从概念走向产品,走出实验室,深入到临床融入工作流,也必然接受临床医生最严苛的考验,在挫折中成长,这个过程是痛苦的,是漫长的,但吹尽黄沙始得金,谁能够真正融入临床工作流,满足临床医师需要,才能够在竞争中生存。」

他强调,医疗人工智能的进步正在为医疗机构创造前所未有的产业升级机遇。随着基础算法及 AI 模型的进步,医疗人工智能正在将越来越多的工作内容定义为基础工作。在繁重的体力劳动上,AI 将比人类更有耐心,更高效,更精准,人类医师逐渐从劳动者转向劳动的创造者与监督者、决策者,熟练掌握 AI 工具的临床医师将在未来具备更强的行业竞争力。

「以肺部结节筛查为例,依图医疗在业内率先完成了从结节筛查的点状任务阶段,向胸部 CT 影像智能诊断的单病种、单科室解决方案的进化,能够在单个病种或者单个科室的应用场景中切实辅助临床医师影像判读效率及质量的提升,」倪浩说,「未来,在经历临床的严酷考验之后,AI 的功能将越来越成熟,性能愈发稳定可靠,真正担当起临床医师的好帮手与第二大脑这一角色定位,协助医疗机构的管理者提升医疗服务质量管理水平,提升医疗机构运行效率,加强科研成果产出能力,成为现代医院的标配。」

编辑: 李婷

版权声明

本网站所有注明“来源:丁香园”的文字、图片和音视频资料,版权均属于丁香园所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:丁香园”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。同时转载内容不代表本站立场。