测评流程

卫标作为中立第三方，按以下流程承接每一个测评项目。其中咨询立项、评测、反馈、校准调整、出具报告为核心环节，复测验证与采购准入/持续监测为按需衔接的环节。

1
咨询立项
需求咨询与临床场景界定，明确受测对象（基座模型 / 医疗智能体 / 应用治理）、自主性与临床风险分级，确认测评范围与方案；双方签订协议、正式立项。
2
评测
依《医疗AI安全性测评方法白皮书（2026）》的四支柱方法，在封存金标准测试集上运行多维度测试，关键安全项实行硬门槛一票否决，按风险加权评分。
3
反馈
向委托方反馈初步测评结果、问题清单与风险发现，就评分口径、场景边界与判定依据进行沟通确认，保证结论透明可核。
4
校准调整
委托方依据反馈进行整改与加固；必要时双方校准测试口径与适用边界，剔除环境与口径偏差，确保结果客观、可比、可复现。
5
复测验证（按需）
对整改项进行加固复测，确认关键安全风险闭环；未通过项可循环“反馈—调整—复测”直至达标。
6
出具报告
出具分场景、分维度的结构化测评报告，载明综合评级与各维度得分；通过者颁发安全测评证书，绑定版本指纹，可在平台核验真伪。
7
采购准入与持续监测（按需）
报告与证书转化为医院等机构的采购安全准入参考；支持上市后监测与定期复评，跟踪模型迭代与表现漂移。

①

1-3 个工作日确认范围、方案并签约立项。

②

5-10 个工作日完成测试、打分与反馈。

③

据反馈整改、校准口径并加固复测。

④

出具评级报告，通过者颁发测评证书。

想了解一条测试样本如何被评分、以及评级与采购准入标准？完整示例请查看测评案例＞