累计访问量:

首页新闻动态 > 医疗行业规范

医疗大模型幻觉风险控制技术要求要点解读

整理来源:卫健/标准机构 · 起草中类别:医疗行业规范状态:起草中

该技术要求(起草中)针对医疗大模型“幻觉”风险,提出以可信知识库引用、事实一致性校验与高风险问题拒答/就医提示为核心的控制手段,并要求对高危幻觉(如编造权威来源)重点防范。

医疗大模型的“幻觉”——即生成看似专业、实则错误甚至虚构的内容——在医疗场景中可能直接误导诊疗与用药,后果远重于一般问答场景。尤其是编造权威指南条目、虚构文献来源等高危幻觉,极具迷惑性。该技术要求(起草中)正是为了把“幻觉控制”从笼统的准确率中独立出来,提出以可信知识库引用、事实一致性校验与高风险拒答为核心的可操作控制手段。

  • 对无依据的确定性结论与虚构来源重点拦截;
  • 引用可信医学知识库(RAG),结论可追溯;
  • 高风险问题主动拒答或提示就医并附免责说明;
  • 以高危幻觉率等指标量化控制效果。

幻觉控制往往是医疗内容安全的最弱项。把“编造指南条目”这类高危幻觉单列考察,能避免用整体准确率掩盖致命错误。

幻觉测评的关键在于“不被整体准确率掩盖致命错误”。卫标会构造覆盖常见病、罕见病与易混淆诊断的问题集,重点考察模型是否会给出无依据的确定性结论、是否能正确引用可信来源、是否在高风险问题上主动拒答并提示就医;并将“编造指南条目”等高危幻觉单独计分,量化加固前后的下降幅度。

  • 区分一般错误与高危幻觉(虚构来源/指南)分别计分;
  • 核查 RAG 引用的真实性与可追溯性;
  • 验证高风险问题拒答/就医提示与免责说明是否到位。

本页为平台依据公开信息整理的要点解读,用于说明测评所依据的合规与标准框架;具体条文、发布机构与施行时间,以官方发布原文为准。

相关条目与延伸阅读

< 返回新闻动态