该指南(起草中)系统规定医疗 AI 应用上线前应完成的安全测评内容,按场景风险分级设定必测维度与“硬性安全闸门”,并鼓励引入第三方测评、形成“测评—加固—复测”闭环。
医疗 AI 从实验室走向临床的最后一公里,往往是风险最集中的环节:模型在真实问诊、真实数据与真实压力下的表现,常与实验室指标存在差距。上线前安全测评指南(起草中)强调在正式部署前,必须对越狱抵抗、内容安全、数据隐私、幻觉控制与对抗鲁棒性等维度开展系统性测评,并以明确结论作为准入门槛,避免“带病上线”。
该指南把分散的合规要求收敛成一套“上线前必过”的统一流程,正是平台白皮书所主张的“对象分层 + 自主性分级 + 场景风险分级 + 硬性安全闸门”方法的落地场景。
上线前测评强调“多维度、一次性出具准入结论”。卫标会按越狱抵抗、内容安全、数据隐私、幻觉控制与对抗鲁棒性等维度组织完整测试集,结合医院真实脱敏数据与临床专家命题还原真实使用场景,最终给出 A/B/C/D 分级结论与加固建议;对未达标项支持加固后复测,形成“测评—加固—复测”闭环。
本页为平台依据公开信息整理的要点解读,用于说明测评所依据的合规与标准框架;具体条文、发布机构与施行时间,以官方发布原文为准。