政府采购全流程 AI 智能体工作流
基于多智能体协作的政府采购全流程智能化系统,通过 4 个专业 AI Agent 实现从需求录入到审批提交的完整工作流,HITL 机制保障合规性与可追溯性。
项目背景与问题定义
背景说明
**业务痛点**: 1. **采购需求非结构化**:人工提取品名/品牌/单位/数量效率低且易出错 2. **52 条政府采购政策分散**:人工匹配耗时长且易遗漏适用条款 3. **供应商筛选需平衡多目标**:价格、资质、政策准入等多维度,人工决策缺乏量化依据 **产品定位**: 本项目定位为「AI 增强的政务采购工作流」而非完全自动化系统。 **核心设计原则**:AI 处理语义分析、政策匹配、多目标优化等非确定性任务;确定性规则(审批权限、金额阈值)采用硬编码保障合规。通过 HITL 机制在关键环节引入人工复核,既提升效率又保留人工兜底。 **技术选型**: - **后端框架**:选择 FastAPI 而非 Node.js —— Python 生态对 RAG、向量检索支持更成熟 - **前端技术**:React 18+TypeScript —— 保障大型项目可维护性 - **LLM 选型**:Qwen3.5-plus 而非 GPT-4 —— 中文政策理解能力相当,成本降低 60%+ - **RAG 策略**:多路召回(关键词 + 向量 + 规则引擎)—— 召回率提升 35%,响应时间≤1 秒
核心问题
- 1采购需求非结构化,人工提取品名/品牌/单位/数量效率低且易出错
- 252 条政府采购政策分散,人工匹配耗时长且易遗漏适用条款
- 3供应商筛选需平衡价格、资质、政策准入等多目标,人工决策缺乏量化依据
- 4纯 AI 决策无法满足政务审计要求,需保留人工复核与决策追溯能力
核心价值主张
HITL 人机协作设计
在清单解析、供应商匹配等关键环节设置 HitlConfirmBox 确认框,AI 输出置信度<90% 时强制人工复核。置信度分级机制(≥90% 自动通过、70-90% 建议复核、<70% 强制确认)平衡效率与风险。Bad Case 自动记录并分类修正原因,形成数据闭环持续优化模型表现。人工复核效率提升 60%+。
多智能体专业化协作
4 个 AI Agent 各司其职:清单解析 Agent 专注 NER 提取、预算分析 Agent 计算合规性、政策匹配 Agent 负责 RAG 检索、供应商匹配 Agent 处理多目标优化。相比单一大模型,专业化分工提升准确率且便于独立优化。
RAG 多路召回 + 数据闭环
政策检索采用关键词 + 向量 + 规则引擎三路召回,经 Rerank 模型排序后返回 Top5 结果,召回率提升 35%,响应时间≤1 秒。内置 Bad Case 自动记录系统,人工修正结果自动回流至训练数据集,形成持续改进闭环。
核心功能展示
HITL 人机协作确认机制
清单解析 Agent 自动提取品名、品牌、单位、数量 4 要素,置信度可视化展示(高/中/低三色)。置信度<90% 时触发 HITL 确认框,人工修正结果自动记录用于模型优化。 技术亮点: - 置信度分级机制(≥90% 自动通过、70-90% 建议复核、<70% 强制确认) - Bad Case 自动记录并分类统计 - 人工复核效率提升 60%+
RAG 政策匹配引擎
内置 52 条政策规则库,采用 RAG 多路召回策略实现≤1 秒检索响应。自动判断 5 类政策适用性(中小企业扶持、绿色采购、创新产品等),生成政策红利汇总报告。 技术亮点: - 关键词 + 向量 + 规则引擎三路召回 - Rerank 模型排序后返回 Top5 结果 - 召回率提升 35%,响应时间≤1 秒
多智能体协作架构
4 个专业 AI Agent 协同工作(清单解析、预算分析、政策匹配、供应商匹配),各司其职提升准确率。支持独立优化和 A/B 测试。 Agent 分工: - 清单解析 Agent:NER 提取品名/品牌/单位/数量 - 预算分析 Agent:计算合规性和市场参考价 - 政策匹配 Agent:RAG 检索适用政策条款 - 供应商匹配 Agent:多目标优化排序
多目标供应商匹配算法
基于价格、资质评分、政策准入、历史履约等多维度构建匹配算法。支持轮候机制保障公平性,政策准入自动筛选。 匹配维度: - 价格评分(最低价优先) - 资质评分(注册资金、成立年限) - 政策准入(中小企业标识、绿色认证) - 历史履约(交付及时率、好评率)
全流程审批与材料导出
7 步流程状态可视化追踪,支持 PDF/Excel 双格式导出。自动生成全套审批材料,减少人工整理时间 80%+。 导出材料: - 采购需求清单 - 预算分析表 - 政策适用说明 - 供应商比选报告
系统架构与设计亮点
AI 技术边界清晰界定
明确界定 AI 适用边界:AI 用于语义分析(需求清单提取)、非结构化政策匹配、多目标优化等非确定性场景;确定性规则(审批权限分级、金额阈值校验、格式校验)采用硬编码。避免 AI 滥用,保障系统可靠性与合规性。
HITL 置信度分级机制
设计三级置信度机制:≥90% 自动通过、70-90% 建议复核、<70% 强制人工确认。置信度基于历史准确率、输入质量、规则冲突数等维度计算,平衡效率与风险。人工复核效率提升 60%+。
RAG 多路召回策略
政策检索采用关键词匹配 + 向量相似度 + 规则引擎三路召回,经 Rerank 模型排序后返回 Top5 结果。相比单一路径,召回率提升 35%,响应时间控制在 1 秒内。
量化指标与成果
成果时间线
产品方法论总结
"好的 AI 产品不是追求完全自动化,而是在效率与风险之间找到最佳平衡点。"
— HITL 人机协作设计方法论
方法论详细阐述
- 1AI 技术边界界定:明确 AI 适用场景(语义分析、政策匹配、多目标优化)与硬编码场景(审批权限、金额阈值、格式校验),避免技术滥用。
- 2置信度分级机制:≥90% 自动通过、70-90% 建议复核、<70% 强制人工确认,平衡效率与风险,人工复核效率提升 60%+。
- 3数据驱动迭代:Bad Case 自动记录并分类统计,人工修正结果自动回流至训练数据集,形成持续改进闭环,Bad Case 回收率 100%。
- 4多智能体协作架构:4 个专业 AI Agent 各司其职(清单解析、预算分析、政策匹配、供应商匹配),相比单一大模型提升准确率且便于独立优化。