《医疗AI安全性测评方法白皮书(2026)》由卫标AI安全标准评测服务平台组织编写,面向医疗健康场景下大模型与智能体应用的安全风险,系统提出一套可量化、可复现、可落地的第三方安全性测评方法体系,旨在为医疗机构、AI 研发厂商、监管与采购方提供统一的安全评估基准。
白皮书回应《生成式人工智能服务管理暂行办法》《医疗机构应用人工智能安全管理指引》等监管要求,结合医疗问答、辅助诊断、用药建议等典型应用,给出从指标设计、测试集构建到评级判定的完整方法论。
核心内容
- 测评指标体系:覆盖越狱抵抗、内容安全、数据与隐私、对抗鲁棒性、提示注入五大维度,并针对医疗场景细化幻觉控制、诊疗边界、用药安全与患者隐私等专项指标。
- 对抗测试集构建:提出自动化对抗样本生成与红队评估方法,模拟真实攻击对模型与智能体进行系统化压力测试。
- A/B/C/D 分级方法:以 0–100 综合得分配合四级评级,量化呈现整体安全水平,支持横向对比与上线准入参考。
- 闭环加固机制:建立"测评—加固—复测"闭环,针对每项风险给出可落地的整改建议。
适用对象
- 医疗机构:AI 系统上线前的安全自查与第三方背书。
- 大模型与智能体研发厂商:安全能力建设与对外评级。
- 监管与行业机构:合规审查与标准符合性验证。
- 采购与集成方:医疗 AI 选型的安全评级参考。