人工智能与医生:“每个人都赢了”:测试快速、准确、无情,但咨询往往胆怯

先进的人工智能模型在专业医学考试中展现了卓越的表现。那么AI医生在现实场景中可信吗?最新研究表明,虽然人工智能模型可以在帮助检测疾病方面发挥重要作用,但它们在医生最重要的任务上仍然表现不佳,例如与患者沟通、收集病史和做出准确诊断。人工智能加速癌症检测 在德国吕贝克大学 Alexander Katalinich 教授团队领导的迄今为止最大规模的相关研究中,人工智能正在帮助放射科医生每 1000 次筛查测试中多发现一名乳腺癌患者。研究人员与大约 200 名具有专业资质的放射科医生合作,评估了一种可以识别乳腺癌迹象的人工智能模型。该研究纳入了2021年7月至2023年2月期间德国12个乳腺癌筛查中心超过46万名女性的筛查记录。在实际操作中放射科医生可以选择是否使用人工智能来支持诊断。最终,约26万名女性的筛查结果由人工智能和医生共同评估,其余20万名女性的结果仅由医生决定。结果显示,使用AI辅助诊断时,医生每1000人检出6.7例乳腺癌,比医生未使用AI辅助诊断时增加约17.6%。此外,当疑似患有癌症的女性接受活检时,人工智能辅助诊断也更加准确。 64.5% 的活检证实为恶性肿瘤,而没有 IA 的活检为 59.2%。 “HeAI 在提高乳腺癌检出率方面的表现超出了预期,”Katalinich 说。这项研究得到了人工智能公司Vara的技术支持。该公司首席技术官斯蒂芬·邦克表示,这项研究的最初目标是验证人工智能在癌症诊断方面的表现与放射科医生的“相当”,从而证明人工智能有潜力减少医生的工作量。然而,最终的结果表明,AI 的性能在几个方面“优于人类”。尽管人工智能有望在医疗领域得到广泛应用,但它也引发了一些担忧。有专家表示,过度依赖人工智能可能会导致误诊和医疗资源分配不均,只有经济条件较好的患者才有机会获得医生面对面的诊断和治疗。此外,研究发现,当人工智能最初确定特定的医学图像是“正常的”(即不太可能表明癌症风险)时,放射科医生平均只需花费 16 秒的时间来审查这些图像。另一方面,对于AI无法清晰判断的图像,医生平均要花30秒的时间来查看。这提醒人们,人工智能决策可以微妙地影响医生的护理分配。然而,伦敦帝国理工学院的本·格洛克教授认为,研究表明,如果策略使用得当,人工智能是安全有效的。格洛克称赞这项研究让医生可以决定是否使用人工智能,并呼吁在“现实世界”进行更多这样的研究。他指出,仅靠实验室模拟无法充分评估人工智能的临床价值,需要从实际应用中积累更多经验。 “这项研究进一步证明了人工智能在乳腺癌检测方面的好处,也是对政府的另一个警告。”政策制定者应加快相关技术的推广。 “AI医学导致沟通缺失”哈佛大学生物医学信息学系助理教授Pranav Rajpurkar和同事开发了一款名为CRAFT-MD的AI评估工具,该工具基于美国医学执照考试的2000个案例,用于测试临床AI医学模型的推理能力。模拟医患互动场景中的dels。 GPT-3.5和GPT-4、Meta的Llama-2-7b以及法国开源AI公司Mistral-v2-7b在医患交互场景下的诊断性能明显差于基于记录案例的诊断性能。例如,GPT-4 提供结构化的病例摘要,并允许您从多个选项中选择诊断。在某些情况下,诊断准确率可以达到82%,但如果基于与患者的模拟对话进行诊断,准确率就会急剧下降。 Rajpurkar 说:“大型语言模型有利于创建多项选择题,但当你进入动态交互场景时,诊断准确性会显着下降。”此外,这些人工智能模型在对话的大部分时间里无法完全捕捉患者的病史。即使是性能最好的 GPT-4 也只能在 71% 的模拟对话中捕获患者的整个病史s。即使成功收集了相关病史,这些人工智能模型也可能无法始终提供准确的信息。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。

此条目发表在吃瓜热门分类目录。将固定链接加入收藏夹。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注