人工智能诊断正在逐步渗透医疗领域,但人工智能在投入真实临床应用后的准确率是否与研究阶段一致呢?AI医生与人类医生的差异如何?
日前,中山大学中山眼科中心刘奕志和林浩添眼科人工智能团队牵头完成的最新临床多中心随机对照研究显示,人工智能诊断在真实临床门诊中对先天性白内障的诊断准确率为87.4%,与实验训练阶段的准确率98.87%相比有一定的差距,也没有人类专科医生的诊断准确率高。该成果以封面文章的形式正式发表在全球权威医学期刊《柳叶刀》子刊EClinicalMedicine(ECM)最新一期上。
AI医生有临床应用评判标准
CC-Cruiser是中山大学中山眼科中心医学人工智能团队利用深度学习建立的“先天性白内障人工智能诊断决策平台”。该团队开启了全球首个人工智能门诊,并联合全国5家不同地区、不同级别医院的眼科门诊对CC-Cruiser进行多中心随机对照临床研究,验证CC-Cruiser在真实世界临床实践中的有效性和可行性,为医学人工智能从试验训练到临床应用提出了重要的AI临床应用评判方法和标准。
目前医学人工智能多数还在研发和试验训练阶段,还没经历真正的临床验证,而且是依靠单点医疗机构开展工作,难以进行多中心大规模验证。中山大学中山眼科中心作为国内最早的医学人工智能研发和应用单位,率先将人工智能诊断系统CC-Cruiser投入多中心临床验证研究,利用大规模的真实临床患者对CC-Cruiser进行评估。
目前,该成果以封面文章的形式正式发表在全球权威医学期刊《柳叶刀》子刊ECM最新一期上。同期发表的评论文章指出,“研究团队采用了非常实用有效的方法,向我们展示并验证了AI医疗诊断平台对儿童先天白内障诊断在真实世界临床实践中的有效性和可行性。这一开拓创新为我们今后的工作提供了重要的参考”。
AI诊断准确率低于人类医生
研究中,研究团队通过把儿童患者数据随机分两组,分别进入由CC-Cruiser接诊的人工智能门诊和具有5年临床经验的人类眼科医生接诊的专科门诊接受诊断,对比两组医生对先天性白内障诊断的准确性。此外,研究者还对两组门诊的诊断过程进行耗时计算,以及通过问卷调查参与者的主观体验。
通过对比发现,CC-Cruiser在临床门诊中对先天性白内障的诊断准确率为87.4%,与实验训练阶段的准确率98.87%相比有一定的差距,也没有人类专科医生的诊断准确率高,这表明人工智能在实验室试验的训练结果并不能完全代表其真正的诊断能力。
不过,AI诊断所需时间却明显比人类医生短,而且问卷调查的结果显示参与者对人工智能门诊的体验满意度高。研究团队表示,这表明了现阶段人工智能可以在临床上辅助人类医生以提高工作效率。所有AI技术在临床应用前,需要经过严格的随机对照研究作为评判手段和标准。不过,随着AI医生的不断进步,赶超人类医生或许就在不远的将来。(全媒体记者梁超仪通讯员邰梦云、魏春福)
标签阅读: 白内障