Nature:为高维度医学成像设计可临床转化的人工(5)
另一方面,激活与临床上已知的重要区域的偏差可能预示着网络正在学习非特异性的特征,使它们不太可能很好地归纳到其他数据集。
机器学习系统学习的特征可能取决于架构的设计。更重要的是,机器学习系统会根据提供给它的训练数据和目标来学习和延续系统性的不平等。随着医疗保健人工智能系统不断向未来的疾病预测发展,必须更加谨慎地考虑到这些群体在获得医疗保健和结果方面的巨大差异。
在最近的评论中,Chen等人深入概述了从问题选择到部署后阶段的潜在偏差来源。在这里,我们重点讨论机器学习系统开发早期的潜在解决方案。一些人主张用一些方法来解释现代机器学习系统的其他 "黑箱 "预测,而其他人则主张一开始就限制使用更可解释的模型。除了在训练整个 AI 系统时结合结构化数据的输入之外,中间方法还涉及使用黑盒模型训练医学成像神经网络。
这可以通过建立 "融合网络 "来实现,其中表格数据被合并到基于图像或视频的神经网络中,或其他具有相同基本目标的更先进的方法(生成组合数据的低维表示的自动编码器)。即使没有将人口统计学输入纳入高维视觉网络,研究小组通过比较不同性别、种族、地域和收入群体的表现来审核他们的模型也很重要。
机器学习系统可能会无意中学会进一步延续和歧视少数民族和有色人种,因此在模型开发过程的早期了解这种偏见是至关重要的。对机器学习系统的信任对于更广泛的采用至关重要,正如探索特定的特征或变量如何以及为什么会导致预测一样,通过结合显著性图和估计特征重要性的模型无关的方法。
另一种方法是在训练逻辑中限制机器学习算法,确保发生优化步骤以控制感兴趣的人口统计学变量。这类似于多变量回归模型,其中感兴趣的风险因素的影响可以独立于基线人口统计学变量来研究。从技术角度看,这将涉及到在训练循环中插入一个额外的惩罚性损失,并牢记与稍低的模型性能的潜在权衡。例如,Fairlearn 是用于评估传统机器学习模型公平性的流行工具包,并且已经开发了基于 Fairlearn 算法 (FairTorch) 的约束优化,这是在训练过程中整合偏差调整的有希望的探索性尝试。有许多开源工具包可以帮助研究人员确定不同变量和输入流(图像预测,以及诸如性别和种族等变量)的相对重要性。这些技术可能允许开发更公平的机器学习系统,甚至可以发现没有预料到的隐藏偏见。
尽管计算架构和获取高质量数据是构建良好模型的关键,但为高维成像模式开发可转换的机器学习系统方面还需要努力,以更好地代表数据的 "视频 "性质。此外还需要在模型开发的早期阶段建立有助于解决偏见、不确定性和可解释性的功能。对医学成像和人工智能的质疑是有益的,而且在大多数情况下具有一定道理。
我们希望,通过建立允许研究人员评估临床表现、医院工作流程中的整合、与临床医生的互动以及社会人口伤害的下游风险的功能,可以在改善人工智能的交付方面迈出有意义的步伐。我们希望研究人员会发现这个观点很有用,因为它概述了在临床部署方面等待他们的潜在挑战,并且在解决其中一些问题时可以发挥指导性意义。
GAIR 2021大会首日:18位Fellow的40年AI岁月,一场技术前沿的传承与激辩
2021-12-10

致敬传奇:中国并行处理四十年,他们从无人区探索走到计算的黄金时代 | GAIR 2021
2021-12-09

时间的力量——1991 人工智能大辩论 30 周年纪念:主义不再,共融互生|GAIR 2021
2021-12-12

未来已来,元宇宙比你想象中来得更早丨GAIR 2021
2021-12-12

文章来源:《中国临床解剖学杂志》 网址: http://www.zglcjpxzz.cn/zonghexinwen/2022/0121/535.html