谷歌AI筛查乳腺癌:比医生更灵敏特异

新知榜官方账号

2023-09-25 18:48:46

谷歌AI筛查乳腺癌:比医生更灵敏特异

乳腺癌是女性癌症死亡的第二大原因,早发现早治疗是改善预后的重要策略。目前很多发达国家都提倡40-50岁的适龄女性进行乳腺癌筛查,在英美两国每年有四百二十万女性接受筛查。乳腺癌筛查的主要方法就是我们都很熟悉的乳房X光造影了。

以往AI取得的成就,奇点糕这里也不再重复叨叨叨了,感兴趣的读者可以去后台搜索以前写过的报道,或者干脆来《医学趋势50讲》一口气听个过瘾。如果在乳腺癌上也能拿下一成,那无疑是能够大大改善好医生短缺和医疗平等的问题。

这个新AI呢,实际上是由三个深度学习模型组合而来的,它们分别针对单个病变、单个乳房和整个病例进行分析,每个模型产生一个乳腺癌风险评分,最终预测结果则是三者的平均值。数据上,研究者们选择了来自横跨大洋的英国和美国的两个大型临床数据集,二者的随访时间都比较长,这样就能够降低无法识别的微小癌灶造成的偏倚。方法上,研究者们设计了三轮对比。

比赛很激烈啊,奇点糕有点兴奋起来了(搓搓手.gif)数据集详情+试验设计先看第一轮结果。在英国,每份X光片会由两名医生解读,也就是临床上说的双重阅片。如果两位医生的解读结果有分歧,那么再引入第三人的意见。第二名医生可以参考第一名医生的意见。和第一名医生对比,AI的特异性绝对值高了1.2%,敏感性绝对值高了2.7%。和第二名医生、以及分歧情况下的第三人相比,AI表现相当。在美国,则由一位医生全权负责阅片,此时AI的特异性绝对值高了5.7%,敏感性则高了9.4%。总结一下,在英国数据集中,AI筛查能够比医生降低1.2%的假阳性、2.7%的假阴性;在美国数据集中,AI筛查能比医生降低5.7%的假阳性、9.4%的假阴性。

简单来说,第二轮就是只用英国数据集训练AI,然后只用在美国数据集中。这个数据就很厉害。即使没有经过美国数据集的调整,AI的表现仍旧超过美国放射科医生的平均水准,降低了3.5%的假阳性、8.1%的假阴性。第三轮,终于到了真人PK了。这一轮的6名医生是由相关委员会认证的符合MQSA资格的放射科医生,“试卷”则是随机抽样的500张X光片。从平均数据来看,AI的性能要大大超过医生们,AUC差异达到了11.5%。三轮全胜,就很赞。

研究者们给出了两个可行的思路。第一,AI可以帮助医生减少阅片工作量。比如说我们刚提到英国是采取双重阅片的,那么如果AI和第一名医生结论一致,我们就可以省下第二名医生的工作量。在实验室模拟中,这种方案能够省下88%的第二次阅片。第二,AI可以帮助快速筛查出需要优先诊断的病例。在英国数据集中,保持99.99%的阴性预测值(NPV)的情况下,AI的特异性仍有41.15%,美国数据也达到了接近的34.79%;另一方面,英国数据集在85.6%的阳性预测值(PPV)下,敏感性能达到41.2%,美国数据集82.4%PPV可实现29.8%的敏感性。这意味着,AI可以快速确定30%-40%需要优先诊断的病例,这部分病例的乳腺癌确诊率预计为5/6。而在目前的临床实践中,X光片异常召回的病例,乳腺癌确诊比例只有22.8%(UK)和4.9%(USA)。

AI在临床上到底能不能也拿高分,看来还得更多时间去验证呀。不如来《医学趋势50讲》观测一下医学AI的大趋势吧!

本页网址:https://www.xinzhibang.net/article_detail-13690.html

寻求报道,请 点击这里 微信扫码咨询

关键词

谷歌AI 乳腺癌 筛查

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯