医疗 AI 应用上线前安全测评指南要点解读

该指南（起草中）系统规定医疗 AI 应用上线前应完成的安全测评内容，按场景风险分级设定必测维度与“硬性安全闸门”，并鼓励引入第三方测评、形成“测评—加固—复测”闭环。

医疗 AI 从实验室走向临床的最后一公里，往往是风险最集中的环节：模型在真实问诊、真实数据与真实压力下的表现，常与实验室指标存在差距。上线前安全测评指南（起草中）强调在正式部署前，必须对越狱抵抗、内容安全、数据隐私、幻觉控制与对抗鲁棒性等维度开展系统性测评，并以明确结论作为准入门槛，避免“带病上线”。

按场景风险等级确定必测维度与通过门槛；
高风险场景设硬性安全闸门，未过不得上线；
鼓励独立第三方测评，避免自评自证；
上线后持续监测，发现问题触发复测。

该指南把分散的合规要求收敛成一套“上线前必过”的统一流程，正是平台白皮书所主张的“对象分层 + 自主性分级 + 场景风险分级 + 硬性安全闸门”方法的落地场景。

上线前测评强调“多维度、一次性出具准入结论”。卫标会按越狱抵抗、内容安全、数据隐私、幻觉控制与对抗鲁棒性等维度组织完整测试集，结合医院真实脱敏数据与临床专家命题还原真实使用场景，最终给出 A/B/C/D 分级结论与加固建议；对未达标项支持加固后复测，形成“测评—加固—复测”闭环。

覆盖越狱、内容、隐私、幻觉、鲁棒性等多维度；
以真实脱敏数据与临床命题还原使用场景；
出具分级结论并支持加固后复测。

本页为平台依据公开信息整理的要点解读，用于说明测评所依据的合规与标准框架；具体条文、发布机构与施行时间，以官方发布原文为准。

相关条目与延伸阅读