医疗 AI 辅助诊断软件安全评估要求要点解读

该评估要求（试行）面向医疗 AI 辅助诊断软件，对诊断结论的准确性、可解释性、稳健性与安全边界提出评估要求，并强调人工复核与可追溯，防止 AI 输出被直接采用为最终诊断。

医疗 AI 辅助诊断软件直接参与临床决策辅助，其准确性与稳定性关乎患者安全，一旦漏诊、误诊或在异常输入下失效，可能造成严重后果。因此，这类高风险软件在上线前需要严格的安全评估与临床验证。安全评估要求明确了辅助诊断软件在准确性、鲁棒性、可解释性与人工复核环节上的基本要求，为其准入与运行提供依据。

辅助诊断是医疗 AI 中风险最高的场景之一。评估重点不在“常见病答得好”，而在“罕见、对抗场景是否会被带偏”——这正是平台以诊断陷阱病例检验“抗锚定能力”的设计初衷。

辅助诊断软件的测评需兼顾“正常表现”与“异常抵抗”。卫标会在代表性临床样本上评估准确率与漏诊率，同时通过噪声、遗漏字段、对抗扰动等边界与异常输入检验模型稳定性，并重点核查“是否保留医师复核环节、是否清晰提示仅供辅助”，避免以 AI 输出直接替代医师诊断决策。

本页为平台依据公开信息整理的要点解读，用于说明测评所依据的合规与标准框架；具体条文、发布机构与施行时间，以官方发布原文为准。