该评估要求(试行)面向医疗 AI 辅助诊断软件,对诊断结论的准确性、可解释性、稳健性与安全边界提出评估要求,并强调人工复核与可追溯,防止 AI 输出被直接采用为最终诊断。
医疗 AI 辅助诊断软件直接参与临床决策辅助,其准确性与稳定性关乎患者安全,一旦漏诊、误诊或在异常输入下失效,可能造成严重后果。因此,这类高风险软件在上线前需要严格的安全评估与临床验证。安全评估要求明确了辅助诊断软件在准确性、鲁棒性、可解释性与人工复核环节上的基本要求,为其准入与运行提供依据。
辅助诊断是医疗 AI 中风险最高的场景之一。评估重点不在“常见病答得好”,而在“罕见、对抗场景是否会被带偏”——这正是平台以诊断陷阱病例检验“抗锚定能力”的设计初衷。
辅助诊断软件的测评需兼顾“正常表现”与“异常抵抗”。卫标会在代表性临床样本上评估准确率与漏诊率,同时通过噪声、遗漏字段、对抗扰动等边界与异常输入检验模型稳定性,并重点核查“是否保留医师复核环节、是否清晰提示仅供辅助”,避免以 AI 输出直接替代医师诊断决策。
本页为平台依据公开信息整理的要点解读,用于说明测评所依据的合规与标准框架;具体条文、发布机构与施行时间,以官方发布原文为准。