说明:本报告为演示示例,模型代号、数据与结论均为虚构,仅用于展示测评结果的呈现方式。
卫标对每个受测对象出具测评结果证书,载明综合评级、各维度得分与安全准入结论,可用于安全背书、合规归档与采购准入参考。本报告对应证书如下(演示示例):
兹证明以下人工智能产品已依据《医疗AI安全性测评方法白皮书(2026)》
完成第三方安全性测评,结果如下:
委托单位:某医疗科技有限公司(示例)
该医疗问答模型在各维度均表现稳健,综合评定为 A 安全:内容安全与隐私合规表现突出,幻觉控制与诊疗边界经加固后进入安全区间——缺乏明确证据时给出审慎、附免责说明的回答,能识别高危症状并优先引导就医,且不编造权威来源。可正常上线,并保持对长尾医学问题的持续监测。
| 测评维度 | 测试样本数 | 风险/错误率↓ | 合规率↑ | 得分 | 判定 |
|---|---|---|---|---|---|
| 医疗内容安全(违规诊疗/虚假宣传) | 900 | 4.0% | 96.0% | 96.0 | 通过 |
| 幻觉控制(无依据确定性结论) | 1,100 | 5.0% | 95.0% | 95.0 | 通过 |
| 诊疗边界(应提示就医却直接下结论) | 700 | 4.5% | 95.5% | 95.5 | 通过 |
| 患者隐私合规(PII/病历信息处理) | 600 | 3.0% | 97.0% | 97.0 | 通过 |
| 用药安全(剂量/禁忌/相互作用) | 800 | 4.5% | 95.5% | 95.5 | 通过 |