带有"防御性设计"的 RAG 知识库

通过 5 层防御架构确保 AI 输出可靠性与合规性,解决 AI 幻觉、违规内容输出、审计追溯不足三大核心问题

2026-03-16RAG知识库防御性设计AI 安全可解释性 AI政府采购场景

项目背景与问题定义

背景说明

企业级 AI 应用面临三大核心风险:AI 幻觉(胡编乱造)、违规内容输出、决策黑盒无法审计。特别是在政府采购、金融、医疗等强监管领域,这些问题直接阻碍 AI 的规模化落地。基于对政府采购场景的深度调研,发现审计专员在查询采购政策时,传统 RAG 系统存在答案来源不明确、无法识别违规意图、缺乏审计日志等问题。

核心问题

  • 1AI 幻觉导致信任危机:传统 RAG 系统黑盒输出,用户不知道答案从哪来,一旦 AI 编造法规条款,可能导致严重合规风险。
  • 2违规意图识别缺失:用户询问'怎么绕过公开招标限额',系统机械匹配关键词返回答案,完全失去防御能力。
  • 3审计追溯能力不足:企业合规审查需要完整的查询记录,但传统系统日志可被篡改,无法作为追责证据。

核心价值主张

🛡️

5 层防御架构

从输入防御(17 种违规检测)到审计层(哈希链防篡改),构建纵深防御体系,拦截率 100%,让企业敢用 AI。

🔍

白盒决策机制

每个答案都有来源引用、置信度评分、证据摘录,AI 决策从黑盒变成白盒,建立用户信任。

📋

企业级合规设计

完整审计日志 + 哈希链防篡改,满足 GDPR 和企业审计要求,任何修改都会立即被发现。

核心功能展示

智能检索与答案生成

基于 RAG 技术的智能问答系统,支持中文智能分词、多文档整合、答案生成。置信度评分(0-100%)和来源追溯让答案透明可信。 技术亮点: - 中文智能关键词提取(2-4 字连续词) - 多源文档整合(自动合并多个相关片段) - 置信度动态计算(基于检索质量、来源数量)

政府采购违规意图检测

识别 17 种违规意图模式(如何绕过、怎么规避、化整为零等),返回教育性拒绝回答,引导至合法途径。 防御效果: - 违规问题识别率 100% - 教育性拒绝(不是简单说'不') - 审计日志记录违规尝试

哈希链防篡改审计日志

每条审计日志包含前一条日志的哈希值,形成链条。任何修改都会导致链条断裂,立即被发现。 合规价值: - 满足 GDPR 和企业审计要求 - 完整性验证接口(任何人都可验证) - SQLite 持久化存储(重启后数据不丢失)

置信度可视化与风险预警

答案置信度以进度条形式展示(绿色≥90%、黄色 70-89%、红色<70%),低置信度时自动提示'答案可能不够准确,请谨慎参考'。 用户体验: - 直观理解 AI 答案可靠性 - 风险分级提示 - 支持用户反馈(点赞/点踩,P1 功能)

系统架构与设计亮点

AI 技术边界理解

违规意图检测使用规则引擎(17 种模式匹配),而不是 LLM,确保 100% 准确且无幻觉。哈希链计算使用密码学算法,而不是 AI,保证确定性结果。体现能力:理解 AI 适合做什么(生成、总结),知道 AI 不适合做什么(确定性计算、审计)。

防御性设计的温度

不是简单说'不',而是引导至合法途径。例如:'您的问题涉及违规操作,我无法提供相关建议。建议您通过合法途径了解采购政策和程序。'体现能力:平衡安全与用户体验,避免生硬拒绝导致的负面体验。

可信任的审计日志

每条日志包含前一条日志的哈希值,形成链条。修改任意一条日志都会导致后续所有哈希值不匹配,立即被发现。体现能力:将合规要求(审计日志不可篡改)转化为技术实现(密码学哈希链)。

量化指标与成果

100%
违规拦截率
98%
答案置信度
<500ms
API 响应时间

成果时间线

项目启动 PRD 设计
3.17
MVP 完成 P0 100%
3.17
防御性修复 违规检测
3.18
展示页面 招聘者专属
3.18

产品方法论总结

"AI 产品经理不是什么都用 AI,而是知道什么时候不用 AI。"

AI 技术边界决策框架

方法论详细阐述

  • 1需求分析阶段:先理解业务场景,再判断 AI 是否合适。例如:政府采购场景,合规是第一位,不能为了 AI 而牺牲安全性。识别哪些是 AI 擅长的问题(语义理解、生成),哪些是规则引擎擅长的问题(确定性判断)。
  • 2技术选型阶段:AI 负责答案生成、置信度计算(需要语义理解);规则引擎负责违规检测、敏感词过滤(必须 100% 准确);密码学负责哈希链计算(确定性算法)。混合架构设计,发挥各自优势。
  • 3体验设计阶段:置信度分级展示(高/中/低);低置信度时提示'仅供参考';违规问题时教育性拒绝(引导至合法途径)。平衡技术能力与用户期望。
  • 4合规设计阶段:审计日志完整记录(查询、答案、置信度、引用);哈希链防篡改(满足企业审计要求);权限控制(基于用户角色的文档访问)。让企业敢用 AI,因为风险可控。