政府采购智能合规审计助手
通过 L1 硬规则+L2 RAG+L3 语义+L4 相似度检测四层架构,实现 100% 硬规则召回与 95%+ 语义风险识别,将人工审计效率提升 80% 以上
项目背景与问题定义
背景说明
政府采购审计专员面临三大核心痛点:千页标书人工审核耗时长(单份 2-3 天)、易漏判(特别是隐蔽的排他性条款)、审计结论难以追溯。基于对政府采购场景的深度调研,发现传统人工审核存在效率低下、标准不一、疲劳漏判等问题,而纯 AI 方案又存在幻觉风险、不可解释、合规性不足等缺陷。
核心问题
- 1人工审核效率低下:一份 500 页标书需要 2-3 天逐页审阅,审计专员疲劳作业时漏判率高达 30%。
- 2隐蔽风险难以识别:排他性条款('必须使用 XX 品牌')、歧视性条款('仅限 XX 省企业')分散在文档各处,人工难以全面发现。
- 3审计结论不可追溯:传统审核缺乏证据链,发现问题后难以快速定位原文,复核成本高。
核心价值主张
四层混合架构
L1 规则引擎(100% 准确)+ L2 RAG 完整性检查 + L3 语义分析 + L4 相似度检测,规则与 AI 结合,兼顾准确性与深度洞察。
风险分级展示
红灯(≥90% 确认风险)、黄灯(70-90% 待复核)、灰灯(<70% 语义模糊),让审计优先级一目了然。
证据溯源能力
点击风险项直接定位到原文页码并高亮显示,审计结论可追溯、可复核、可解释。
核心功能展示
PDF 智能解析与元数据注入
支持 50-500 页 PDF 标书上传,使用 PyMuPDF 解析为 Markdown 格式,保留标题、段落、表格层级结构。为每段内容注入元数据(页码、章节、类型),为后续精准溯源奠定基础。 技术亮点: - OCR 识别率预检(<50% 熔断报警,防止'带病审计') - 元数据自动注入(page/section/type) - 表格内容结构化提取
L1 硬规则引擎(100% 准确)
资格铁律与形式铁律检查,使用 Python/正则/逻辑判断,不调用 LLM,确保零误报。 检查项: - 资质有效期检查(检测'有效期至 YYYY-MM-DD'格式) - 金额超预算检查(比较报价和预算金额) - 关键字段缺失检查(签字/盖章/页码完整性) 性能指标: - L1 召回率 100% - 零误报 - 检查速度 <10 秒/标书
L2 RAG 完整性检查
基于 Chroma 向量库的 RAG 检索增强生成,检查技术参数响应完整性,防止漏项。 工作流程: - 文档分块存储(按章节分块,保持语义完整性) - 向量检索定位相关条款(Top-5 相关片段) - 基于检索结果生成提示词,调用 Qwen3 API 检查完整性 检查项: - 技术参数偏离表完整性 - 工期/交付承诺完整性 - 资格证明文件完整性
L3 语义分析(排他性/歧视性条款检测)
利用 Qwen3.5-plus 的 128k+ 上下文能力,深度语义理解识别隐蔽风险。 检测类型: - 排他性条款('必须使用华为/小米')、'需与原有系统无缝对接' - 歧视性条款('仅限进口设备'、'仅限 XX 省企业') - 内容冲突检测(商务页与技术页公司名不一致) - 隐蔽埋雷识别 置信度评分:0-100%,支持红/黄/灰分级展示
L4 相似度检测(防串标)
独立向量数据库存储标书,比对多标书技术方案相似度,发现异常相似文件,防止串标。 风险等级: - 高度相似(>90%):高度疑似串标 - 中度相似(70-90%):需要进一步核查 - 低相似度(<70%):正常范围 技术实现: - 文本向量化 - 余弦相似度计算 - 章节级比对
人工复核与批注系统
对黄灯项进行人工确认/驳回,形成最终审计结论。支持单个复核和批量复核。 功能特性: - 确认操作:标记为红灯风险(绿色标识) - 驳回操作:标记为绿灯通过(灰色标识),填写驳回原因 - 驳回原因分类:规则不准确/理解偏差/其他 - 复核统计:实时显示待复核/已确认/误报数量 - 复核历史记录:记录操作时间、操作人、批注内容
系统架构与设计亮点
AI 技术边界理解
L1 硬规则使用 Python/正则(不调 LLM),确保 100% 准确且零误报;L3 语义分析使用 Qwen3 API,发挥 AI 的语义理解优势。体现能力:理解 AI 适合做什么(语义分析、生成),知道 AI 不适合做什么(确定性规则判断)。
防御性设计思维
OCR 预检机制(<50% 熔断,防止'带病审计');风险分级展示(红/黄/灰),让 AI 的不确定性透明化;证据溯源能力,每个风险项都有原文支撑。体现能力:平衡 AI 能力与风险控制,避免过度信任 AI。
可解释的 AI 决策
每个风险项包含:风险描述、置信度评分、证据摘录、页码引用、法律依据。审计结论从黑盒变成白盒,建立用户信任。体现能力:将 AI 决策过程透明化,满足企业合规审计要求。
量化指标与成果
成果时间线
产品方法论总结
"AI 产品经理不是什么都用 AI,而是知道什么时候不用 AI。"
— 混合架构决策框架
方法论详细阐述
- 1需求分析阶段:深入理解政府采购审计场景,识别核心痛点(效率低、易漏判、难追溯)。明确业务约束(L1 必须 100% 准确、数据不能出内网、支持离线部署)。
- 2技术选型阶段:L1 硬规则使用 Python/正则(确定性、100% 准确);L2 RAG 使用 Chroma+Qwen3(检索增强、防止迷路);L3 语义分析使用 Qwen3 API(深度理解、识别隐蔽风险);L4 相似度检测使用向量数据库(高效比对)。混合架构,发挥各自优势。
- 3体验设计阶段:风险分级展示(红/黄/灰),让 AI 的不确定性透明化;证据溯源(点击定位原文),建立用户信任;人工复核(确认/驳回),人机协作形成最终结论。
- 4合规设计阶段:本地部署(数据不出内网);审计日志(记录所有操作);证据链完整(每个风险项都有原文支撑)。让企业敢用 AI,因为风险可控、结论可追溯。