卫标作为中立第三方,按以下流程承接每一个测评项目。其中咨询立项、评测、反馈、校准调整、出具报告为核心环节,复测验证与采购准入/持续监测为按需衔接的环节。
需求咨询与临床场景界定,明确受测对象(基座模型 / 医疗智能体 / 应用治理)、自主性与临床风险分级,确认测评范围与方案;双方签订协议、正式立项。
依《医疗AI安全性测评方法白皮书(2026)》的四支柱方法,在封存金标准测试集上运行多维度测试,关键安全项实行硬门槛一票否决,按风险加权评分。
向委托方反馈初步测评结果、问题清单与风险发现,就评分口径、场景边界与判定依据进行沟通确认,保证结论透明可核。
委托方依据反馈进行整改与加固;必要时双方校准测试口径与适用边界,剔除环境与口径偏差,确保结果客观、可比、可复现。
对整改项进行加固复测,确认关键安全风险闭环;未通过项可循环“反馈—调整—复测”直至达标。
出具分场景、分维度的结构化测评报告,载明综合评级与各维度得分;通过者颁发安全测评证书,绑定版本指纹,可在平台核验真伪。
报告与证书转化为医院等机构的采购安全准入参考;支持上市后监测与定期复评,跟踪模型迭代与表现漂移。
1-3 个工作日确认范围、方案并签约立项。
5-10 个工作日完成测试、打分与反馈。
据反馈整改、校准口径并加固复测。
出具评级报告,通过者颁发测评证书。
想了解一条测试样本如何被评分、以及评级与采购准入标准?完整示例请查看测评案例 >