政府采购智能合规审计助手

通过 L1 硬规则+L2 RAG+L3 语义+L4 相似度检测四层架构,实现 100% 硬规则召回与 95%+ 语义风险识别,将人工审计效率提升 80% 以上

2026-03-10AI 审计政府采购合规检测RAG语义分析防御性设计可解释性 AI

项目背景与问题定义

背景说明

政府采购审计专员面临三大核心痛点:千页标书人工审核耗时长(单份 2-3 天)、易漏判(特别是隐蔽的排他性条款)、审计结论难以追溯。基于对政府采购场景的深度调研,发现传统人工审核存在效率低下、标准不一、疲劳漏判等问题,而纯 AI 方案又存在幻觉风险、不可解释、合规性不足等缺陷。

核心问题

  • 1人工审核效率低下:一份 500 页标书需要 2-3 天逐页审阅,审计专员疲劳作业时漏判率高达 30%。
  • 2隐蔽风险难以识别:排他性条款('必须使用 XX 品牌')、歧视性条款('仅限 XX 省企业')分散在文档各处,人工难以全面发现。
  • 3审计结论不可追溯:传统审核缺乏证据链,发现问题后难以快速定位原文,复核成本高。

核心价值主张

🏗️

四层混合架构

L1 规则引擎(100% 准确)+ L2 RAG 完整性检查 + L3 语义分析 + L4 相似度检测,规则与 AI 结合,兼顾准确性与深度洞察。

🎯

风险分级展示

红灯(≥90% 确认风险)、黄灯(70-90% 待复核)、灰灯(<70% 语义模糊),让审计优先级一目了然。

🔗

证据溯源能力

点击风险项直接定位到原文页码并高亮显示,审计结论可追溯、可复核、可解释。

核心功能展示

PDF 智能解析与元数据注入

支持 50-500 页 PDF 标书上传,使用 PyMuPDF 解析为 Markdown 格式,保留标题、段落、表格层级结构。为每段内容注入元数据(页码、章节、类型),为后续精准溯源奠定基础。 技术亮点: - OCR 识别率预检(<50% 熔断报警,防止'带病审计') - 元数据自动注入(page/section/type) - 表格内容结构化提取

L1 硬规则引擎(100% 准确)

资格铁律与形式铁律检查,使用 Python/正则/逻辑判断,不调用 LLM,确保零误报。 检查项: - 资质有效期检查(检测'有效期至 YYYY-MM-DD'格式) - 金额超预算检查(比较报价和预算金额) - 关键字段缺失检查(签字/盖章/页码完整性) 性能指标: - L1 召回率 100% - 零误报 - 检查速度 <10 秒/标书

L2 RAG 完整性检查

基于 Chroma 向量库的 RAG 检索增强生成,检查技术参数响应完整性,防止漏项。 工作流程: - 文档分块存储(按章节分块,保持语义完整性) - 向量检索定位相关条款(Top-5 相关片段) - 基于检索结果生成提示词,调用 Qwen3 API 检查完整性 检查项: - 技术参数偏离表完整性 - 工期/交付承诺完整性 - 资格证明文件完整性

L3 语义分析(排他性/歧视性条款检测)

利用 Qwen3.5-plus 的 128k+ 上下文能力,深度语义理解识别隐蔽风险。 检测类型: - 排他性条款('必须使用华为/小米')、'需与原有系统无缝对接' - 歧视性条款('仅限进口设备'、'仅限 XX 省企业') - 内容冲突检测(商务页与技术页公司名不一致) - 隐蔽埋雷识别 置信度评分:0-100%,支持红/黄/灰分级展示

L4 相似度检测(防串标)

独立向量数据库存储标书,比对多标书技术方案相似度,发现异常相似文件,防止串标。 风险等级: - 高度相似(>90%):高度疑似串标 - 中度相似(70-90%):需要进一步核查 - 低相似度(<70%):正常范围 技术实现: - 文本向量化 - 余弦相似度计算 - 章节级比对

人工复核与批注系统

对黄灯项进行人工确认/驳回,形成最终审计结论。支持单个复核和批量复核。 功能特性: - 确认操作:标记为红灯风险(绿色标识) - 驳回操作:标记为绿灯通过(灰色标识),填写驳回原因 - 驳回原因分类:规则不准确/理解偏差/其他 - 复核统计:实时显示待复核/已确认/误报数量 - 复核历史记录:记录操作时间、操作人、批注内容

系统架构与设计亮点

AI 技术边界理解

L1 硬规则使用 Python/正则(不调 LLM),确保 100% 准确且零误报;L3 语义分析使用 Qwen3 API,发挥 AI 的语义理解优势。体现能力:理解 AI 适合做什么(语义分析、生成),知道 AI 不适合做什么(确定性规则判断)。

防御性设计思维

OCR 预检机制(<50% 熔断,防止'带病审计');风险分级展示(红/黄/灰),让 AI 的不确定性透明化;证据溯源能力,每个风险项都有原文支撑。体现能力:平衡 AI 能力与风险控制,避免过度信任 AI。

可解释的 AI 决策

每个风险项包含:风险描述、置信度评分、证据摘录、页码引用、法律依据。审计结论从黑盒变成白盒,建立用户信任。体现能力:将 AI 决策过程透明化,满足企业合规审计要求。

量化指标与成果

100%
L1 召回率
>97%
L2/L3 综合召回率
<5 分钟
单标书审计时间

成果时间线

项目启动 需求分析、架构设计
3.10
MVP 完成 PDF 解析、L1 规则引擎、L3 语义分析
3.11
四层架构完整实现 L2 RAG、L4 相似度检测
3.12
前端优化 审计进度模态框、用户体验提升
3.16
人工复核功能 数据库设计、API 实现、前端 UI
3.18

产品方法论总结

"AI 产品经理不是什么都用 AI,而是知道什么时候不用 AI。"

混合架构决策框架

方法论详细阐述

  • 1需求分析阶段:深入理解政府采购审计场景,识别核心痛点(效率低、易漏判、难追溯)。明确业务约束(L1 必须 100% 准确、数据不能出内网、支持离线部署)。
  • 2技术选型阶段:L1 硬规则使用 Python/正则(确定性、100% 准确);L2 RAG 使用 Chroma+Qwen3(检索增强、防止迷路);L3 语义分析使用 Qwen3 API(深度理解、识别隐蔽风险);L4 相似度检测使用向量数据库(高效比对)。混合架构,发挥各自优势。
  • 3体验设计阶段:风险分级展示(红/黄/灰),让 AI 的不确定性透明化;证据溯源(点击定位原文),建立用户信任;人工复核(确认/驳回),人机协作形成最终结论。
  • 4合规设计阶段:本地部署(数据不出内网);审计日志(记录所有操作);证据链完整(每个风险项都有原文支撑)。让企业敢用 AI,因为风险可控、结论可追溯。