6. 第五章:科学与医学
合成数据前景广阔
2024 年发布的研究表明 AI 生成的合成数据显示出巨大潜力
帮助模型更好地识别社会健康决定因素 (SDoH)
增强保护隐私的临床风险预测
使用 ADSGAN, PATEGAN, DPGAN 模型预测吸烟者的肺癌风险
合成数据集可以保留统计保真度
支持探索性分析和开发预测模型,无需真实的、可识别的患者数据
促进新药化合物的发现
合成表格数据生成和验证平台
预测和验证基于 AI 生成合成结构的渗透阈值
评估合成心脏病数据集的曲线下面积
医学 AI 伦理出版物增加
医学 AI 伦理方面的出版物数量逐年增加
从 2020 年的 288 篇增加到 2024 年的 1,031 篇,增长了近四倍
AI Index 使用 PubMedCentral 的 API 查询 2020-2024 年间关于 AI, 医学和伦理问题的文章
通过关键词筛选,保留 2,916 篇文章
使用的 AI 关键词包括 "artificial intelligence," " AI," "algorithm," "ML," "machine learning," "deep learning," predictive analytics
使用的医学关键词包括 "medicine," "medical," "health," "healthcare"
使用的伦理关键词包括 "ethic*," "fairness," "bias," "accountability," "transparency," "explainability," "privacy," "trustworthy AI," "bioethics," "ELSI," "autonomy," "equit*," "justice," "beneficence," "non-maleficence," "independent review," "oversight," "racism," "inequit*," community engagement, misuse, dual use
中心法则与蛋白质科学
AI 驱动的蛋白质序列模型
评估 ESM3 模型在原子坐标提示生成蛋白质上的表现
AlphaFold 3: 预测所有生命分子结构和相互作用
由 Google 和 Isomorphic Lab 发布
能更准确地建模蛋白质与关键生物分子 (DNA, RNA, 配体, 抗体) 的相互作用
与 Vina 和 Gnina 等其他顶级对接工具比较蛋白质-配体对接的准确性
准确性以 RMSD (均方根偏差) < 2 Å 的预测百分比衡量
对接工具是预测小分子与靶蛋白如何相互作用的计算程序
图表使用两种颜色区分一般对接准确性 (RMSD < 2) 和更精确的结合位点有效性 (RMSD < 2 and PB-valid)
蛋白质科学公共数据库 (蛋白质数据库 PDB, STRING)
按显微技术分类的基础模型数量 (荧光、电子、光学)
显示了 2023-2024 年的数量变化
临床护理,影像学
数据:来源、类型和需求
训练数据集 token 量:医学与非医学语言和影像模型 (GatorTron, Llama 3 vs RadImageNet, DALL-E)
先进建模方法
扩散模型 (例如,RoentGen, RNA-CDM)
挑战包括数据稀缺、在低资源设置中的泛化能力、计算需求
二维纯视觉基础模型 (例如,CTransPath, Virchow, UNI, MedSAM)
优势包括泛癌检测、生物标志物预测、图像分割、减少标注负担
挑战包括领域泛化、跨模态适应性
多尺度/全玻片模型 (例如,HIPT, MEGT, MG-Trans, HIGT, Prov-GigaPath)
优势包括增强全玻片成像分析、提高诊断保真度和可解释性
临床护理,非影像学
临床知识 (MedQA)
评估 AI 模型医学专业知识的范围
MedQA 数据集来自专业医学委员会考试的 60,000 多个临床问题
AI 在 MedQA 基准上的性能显著提升
Microsoft 和 OpenAI 研究人员测试的 o1 模型达到 96.0% 的新 SOTA 分数
自 2022 年底以来,性能提升了 28.4 个百分点
MedQA 可能正接近饱和点,需要更具挑战性的评估
AI 医生与成本效益考虑
图表显示了 MedQA 基准上的准确性与成本权衡
部署医疗 AI 时需要平衡性能增益和计算成本
LLMs 在医疗保健任务中的评估
PubMed 关于大型语言模型的出版物数量激增
从 2019 年的 1,566 篇增加到 2024 年的 1,210 篇
LLMs 对诊断推理的影响
管理推理和患者护理决策
GPT-4 协助提高医生在患者护理任务上的表现 (随机对照试验结果显示分数提高)
环境 AI 记录员 (Ambient AI Scribes)
临床文档一直是临床医生负担和职业倦怠的来源
环境记录员技术快速发展,将 LLMs 集成到医患录音处理流程中
首个研究发表在 NEJM Catalyst,描述 Kaiser Permanente Northern California 的启动情况 (2023 年底)
该技术在试点结束前被数千名临床医生采用
第二项研究发表在 JAMIA,描述 Intermountain Health 的试点经验
这两项研究基于较早版本技术,尚未完全自动化或集成到 EHR
图表显示环境 AI 记录员对医生 EHR 使用时间和下班后时间的影响 (分钟变化)
2024 年对环境记录员技术的投资据报道达到近 3 亿美元
临床文档是该技术的起点,但乐观者预计其将变得普遍
社会健康决定因素 (SDoH)
从 EHR 和临床笔记中提取 SDoH
帮助医疗保健提供者解决住房不稳定或食品不安全等社会需求
LLMs 有潜力增强 SDoH 文档、资源分配和健康公平
强调需要缓解偏见和采用强大的合成数据方法
不同模型 (BERT-base, Flan-T5) 在 SDoH 提取任务上的性能比较,考虑是否使用合成数据
临床决策支持
电子健康记录 (EHR) 系统
FDA 授权的 AI 医疗设备
数据来源于 FDA 网站
成功用例:斯坦福医疗中心筛查外周动脉疾病 (PAD)
AI 在各医学领域的应用和 SDoH 的整合