随着对使用称为卷积神经网络(CNN)的计算机系统框架来分析医学成像并提供计算机辅助诊断的兴趣的增长,最近的研究表明,AI图像分类可能不会推广到新数据以及通常描绘的。
西奈山伊坎医学院的研究人员评估了AI模型如何在三个医疗机构的158,000个胸部X光片中发现肺炎:美国国立卫生研究院; 西奈山医院; 和印第安纳大学医院。研究人员选择研究胸部X射线肺炎的诊断,因为它在研究界普遍存在,临床意义和流行。
在五分之三的比较中,CNN在诊断自己网络外医院的X射线疾病方面的表现明显低于原始卫生系统的X射线。然而,有线电视新闻网能够以高度准确的方式检测出获得X射线的医院系统,并根据培训机构中肺炎的流行情况对其预测任务作弊。研究人员发现,在医学中使用深度学习模型的难点在于它们使用大量参数,因此难以识别推动预测的特定变量,例如医院使用的CT扫描仪类型和成像的分辨率质量。
“我们的研究结果应该暂停那些考虑快速部署人工智能平台的人,而不是严格评估他们在现实临床环境中的表现,反映出他们的部署地点,”资深作者Eric Oermann博士说,他是伊坎学院神经外科学讲师在西奈山的医学。“经过培训以进行医学诊断的深度学习模型可以很好地概括,但这不能被视为理所当然,因为不同机构的患者人群和成像技术存在显着差异。”
“如果要将CNN系统用于医疗诊断,必须对其进行定制,以便仔细考虑临床问题,针对各种现实情况进行测试,并仔细评估以确定它们如何影响准确诊断,”第一作者John Zech说,西奈山伊坎医学院的一名医科学生。
这项研究建立在今年早些时候发表在放射学和自然医学期刊上的论文的基础上,该论文奠定了应用计算机视觉和深度学习技术(包括自然语言处理算法)的框架,用于识别CT扫描放射学报告中的临床概念。