政府采购智能合规审计助手

通过 L1 硬规则+L2 RAG+L3 语义+L4 相似度检测四层架构，实现 100% 硬规则召回与 95%+ 语义风险识别，将人工审计效率提升 80% 以上

2026-03-10AI 审计政府采购合规检测RAG语义分析防御性设计可解释性 AI

项目背景与问题定义

背景说明

政府采购审计专员面临三大核心痛点：千页标书人工审核耗时长（单份 2-3 天）、易漏判（特别是隐蔽的排他性条款）、审计结论难以追溯。基于对政府采购场景的深度调研，发现传统人工审核存在效率低下、标准不一、疲劳漏判等问题，而纯 AI 方案又存在幻觉风险、不可解释、合规性不足等缺陷。

核心问题

1人工审核效率低下：一份 500 页标书需要 2-3 天逐页审阅，审计专员疲劳作业时漏判率高达 30%。
2隐蔽风险难以识别：排他性条款（'必须使用 XX 品牌'）、歧视性条款（'仅限 XX 省企业'）分散在文档各处，人工难以全面发现。
3审计结论不可追溯：传统审核缺乏证据链，发现问题后难以快速定位原文，复核成本高。

核心价值主张

🏗️

四层混合架构

L1 规则引擎（100% 准确）+ L2 RAG 完整性检查 + L3 语义分析 + L4 相似度检测，规则与 AI 结合，兼顾准确性与深度洞察。

🎯

风险分级展示

红灯（≥90% 确认风险）、黄灯（70-90% 待复核）、灰灯（<70% 语义模糊），让审计优先级一目了然。

🔗

证据溯源能力

点击风险项直接定位到原文页码并高亮显示，审计结论可追溯、可复核、可解释。

核心功能展示

PDF 智能解析与元数据注入

支持 50-500 页 PDF 标书上传，使用 PyMuPDF 解析为 Markdown 格式，保留标题、段落、表格层级结构。为每段内容注入元数据（页码、章节、类型），为后续精准溯源奠定基础。技术亮点： - OCR 识别率预检（<50% 熔断报警，防止'带病审计'） - 元数据自动注入（page/section/type） - 表格内容结构化提取

L1 硬规则引擎（100% 准确）

资格铁律与形式铁律检查，使用 Python/正则/逻辑判断，不调用 LLM，确保零误报。检查项： - 资质有效期检查（检测'有效期至 YYYY-MM-DD'格式） - 金额超预算检查（比较报价和预算金额） - 关键字段缺失检查（签字/盖章/页码完整性）性能指标： - L1 召回率 100% - 零误报 - 检查速度 <10 秒/标书

L2 RAG 完整性检查

基于 Chroma 向量库的 RAG 检索增强生成，检查技术参数响应完整性，防止漏项。工作流程： - 文档分块存储（按章节分块，保持语义完整性） - 向量检索定位相关条款（Top-5 相关片段） - 基于检索结果生成提示词，调用 Qwen3 API 检查完整性检查项： - 技术参数偏离表完整性 - 工期/交付承诺完整性 - 资格证明文件完整性

L3 语义分析（排他性/歧视性条款检测）

利用 Qwen3.5-plus 的 128k+ 上下文能力，深度语义理解识别隐蔽风险。检测类型： - 排他性条款（'必须使用华为/小米'）、'需与原有系统无缝对接' - 歧视性条款（'仅限进口设备'、'仅限 XX 省企业'） - 内容冲突检测（商务页与技术页公司名不一致） - 隐蔽埋雷识别置信度评分：0-100%，支持红/黄/灰分级展示

L4 相似度检测（防串标）

独立向量数据库存储标书，比对多标书技术方案相似度，发现异常相似文件，防止串标。风险等级： - 高度相似（>90%）：高度疑似串标 - 中度相似（70-90%）：需要进一步核查 - 低相似度（<70%）：正常范围技术实现： - 文本向量化 - 余弦相似度计算 - 章节级比对

人工复核与批注系统

对黄灯项进行人工确认/驳回，形成最终审计结论。支持单个复核和批量复核。功能特性： - 确认操作：标记为红灯风险（绿色标识） - 驳回操作：标记为绿灯通过（灰色标识），填写驳回原因 - 驳回原因分类：规则不准确/理解偏差/其他 - 复核统计：实时显示待复核/已确认/误报数量 - 复核历史记录：记录操作时间、操作人、批注内容

系统架构与设计亮点

AI 技术边界理解

L1 硬规则使用 Python/正则（不调 LLM），确保 100% 准确且零误报；L3 语义分析使用 Qwen3 API，发挥 AI 的语义理解优势。体现能力：理解 AI 适合做什么（语义分析、生成），知道 AI 不适合做什么（确定性规则判断）。

防御性设计思维

OCR 预检机制（<50% 熔断，防止'带病审计'）；风险分级展示（红/黄/灰），让 AI 的不确定性透明化；证据溯源能力，每个风险项都有原文支撑。体现能力：平衡 AI 能力与风险控制，避免过度信任 AI。

可解释的 AI 决策

每个风险项包含：风险描述、置信度评分、证据摘录、页码引用、法律依据。审计结论从黑盒变成白盒，建立用户信任。体现能力：将 AI 决策过程透明化，满足企业合规审计要求。

量化指标与成果

100%

L1 召回率

>97%

L2/L3 综合召回率

<5 分钟

单标书审计时间

成果时间线

项目启动需求分析、架构设计

3.10

MVP 完成 PDF 解析、L1 规则引擎、L3 语义分析

3.11

四层架构完整实现 L2 RAG、L4 相似度检测

3.12

前端优化审计进度模态框、用户体验提升

3.16

人工复核功能数据库设计、API 实现、前端 UI

3.18

产品方法论总结

"AI 产品经理不是什么都用 AI，而是知道什么时候不用 AI。"

— 混合架构决策框架

方法论详细阐述

1需求分析阶段：深入理解政府采购审计场景，识别核心痛点（效率低、易漏判、难追溯）。明确业务约束（L1 必须 100% 准确、数据不能出内网、支持离线部署）。
2技术选型阶段：L1 硬规则使用 Python/正则（确定性、100% 准确）；L2 RAG 使用 Chroma+Qwen3（检索增强、防止迷路）；L3 语义分析使用 Qwen3 API（深度理解、识别隐蔽风险）；L4 相似度检测使用向量数据库（高效比对）。混合架构，发挥各自优势。
3体验设计阶段：风险分级展示（红/黄/灰），让 AI 的不确定性透明化；证据溯源（点击定位原文），建立用户信任；人工复核（确认/驳回），人机协作形成最终结论。
4合规设计阶段：本地部署（数据不出内网）；审计日志（记录所有操作）；证据链完整（每个风险项都有原文支撑）。让企业敢用 AI，因为风险可控、结论可追溯。

上一个作品带有"防御性设计"的 RAG 知识库下一个作品双亲健康：家庭慢病管理助手