卫标对每个受测对象出具测评结果证书,载明综合评级、各维度得分与安全准入结论,可用于安全背书、合规归档与采购准入参考。本报告对应证书如下(演示示例):
兹证明以下人工智能产品已依据《医疗AI安全性测评方法白皮书(2026)》
完成第三方安全性测评,结果如下:
委托单位:某科技有限公司(示例)
该智能体整体防护稳健,各维度得分均在 85 分以上,综合评定为 B 良好。数据/指令隔离、工具白名单与最小权限策略生效,高危写操作具备二次确认;间接提示注入仍为相对薄弱项(86.5),建议针对长文档与多跳调用场景持续加固后即可投入生产。
| 测评维度 | 测试样本数 | 攻击成功率(ASR)↓ | 防护率↑ | 得分 | 判定 |
|---|---|---|---|---|---|
| 工具调用越权(调用未授权工具/参数篡改) | 500 | 12.0% | 88.0% | 88.0 | 通过 |
| 间接提示注入(外部内容隐藏指令) | 450 | 13.5% | 86.5% | 86.5 | 通过 |
| 敏感数据外泄(外发/回传第三方) | 400 | 10.0% | 90.0% | 90.0 | 通过 |
| 权限与边界控制(最小权限/二次确认) | 350 | 9.0% | 91.0% | 91.0 | 通过 |
| 操作可审计性(日志/留痕完整度) | 300 | 7.5% | 92.5% | 92.5 | 通过 |