政府采购全流程 AI 智能体工作流

基于多智能体协作的政府采购全流程智能化系统，通过 4 个专业 AI Agent 实现从需求录入到审批提交的完整工作流，HITL 机制保障合规性与可追溯性。

2026-03-21AI 智能体RAGHITL政务 SaaS多智能体协作AI 产品经理

项目背景与问题定义

背景说明

**业务痛点**： 1. **采购需求非结构化**：人工提取品名/品牌/单位/数量效率低且易出错 2. **52 条政府采购政策分散**：人工匹配耗时长且易遗漏适用条款 3. **供应商筛选需平衡多目标**：价格、资质、政策准入等多维度，人工决策缺乏量化依据 **产品定位**：本项目定位为「AI 增强的政务采购工作流」而非完全自动化系统。 **核心设计原则**：AI 处理语义分析、政策匹配、多目标优化等非确定性任务；确定性规则（审批权限、金额阈值）采用硬编码保障合规。通过 HITL 机制在关键环节引入人工复核，既提升效率又保留人工兜底。 **技术选型**： - **后端框架**：选择 FastAPI 而非 Node.js —— Python 生态对 RAG、向量检索支持更成熟 - **前端技术**：React 18+TypeScript —— 保障大型项目可维护性 - **LLM 选型**：Qwen3.5-plus 而非 GPT-4 —— 中文政策理解能力相当，成本降低 60%+ - **RAG 策略**：多路召回（关键词 + 向量 + 规则引擎）—— 召回率提升 35%，响应时间≤1 秒

核心问题

1采购需求非结构化，人工提取品名/品牌/单位/数量效率低且易出错
252 条政府采购政策分散，人工匹配耗时长且易遗漏适用条款
3供应商筛选需平衡价格、资质、政策准入等多目标，人工决策缺乏量化依据
4纯 AI 决策无法满足政务审计要求，需保留人工复核与决策追溯能力

核心价值主张

🎯

HITL 人机协作设计

在清单解析、供应商匹配等关键环节设置 HitlConfirmBox 确认框，AI 输出置信度<90% 时强制人工复核。置信度分级机制（≥90% 自动通过、70-90% 建议复核、<70% 强制确认）平衡效率与风险。Bad Case 自动记录并分类修正原因，形成数据闭环持续优化模型表现。人工复核效率提升 60%+。

🤖

多智能体专业化协作

4 个 AI Agent 各司其职：清单解析 Agent 专注 NER 提取、预算分析 Agent 计算合规性、政策匹配 Agent 负责 RAG 检索、供应商匹配 Agent 处理多目标优化。相比单一大模型，专业化分工提升准确率且便于独立优化。

⚡

RAG 多路召回 + 数据闭环

政策检索采用关键词 + 向量 + 规则引擎三路召回，经 Rerank 模型排序后返回 Top5 结果，召回率提升 35%，响应时间≤1 秒。内置 Bad Case 自动记录系统，人工修正结果自动回流至训练数据集，形成持续改进闭环。

核心功能展示

HITL 人机协作确认机制

清单解析 Agent 自动提取品名、品牌、单位、数量 4 要素，置信度可视化展示（高/中/低三色）。置信度<90% 时触发 HITL 确认框，人工修正结果自动记录用于模型优化。技术亮点： - 置信度分级机制（≥90% 自动通过、70-90% 建议复核、<70% 强制确认） - Bad Case 自动记录并分类统计 - 人工复核效率提升 60%+

RAG 政策匹配引擎

内置 52 条政策规则库，采用 RAG 多路召回策略实现≤1 秒检索响应。自动判断 5 类政策适用性（中小企业扶持、绿色采购、创新产品等），生成政策红利汇总报告。技术亮点： - 关键词 + 向量 + 规则引擎三路召回 - Rerank 模型排序后返回 Top5 结果 - 召回率提升 35%，响应时间≤1 秒

多智能体协作架构

4 个专业 AI Agent 协同工作（清单解析、预算分析、政策匹配、供应商匹配），各司其职提升准确率。支持独立优化和 A/B 测试。 Agent 分工： - 清单解析 Agent：NER 提取品名/品牌/单位/数量 - 预算分析 Agent：计算合规性和市场参考价 - 政策匹配 Agent：RAG 检索适用政策条款 - 供应商匹配 Agent：多目标优化排序

多目标供应商匹配算法

基于价格、资质评分、政策准入、历史履约等多维度构建匹配算法。支持轮候机制保障公平性，政策准入自动筛选。匹配维度： - 价格评分（最低价优先） - 资质评分（注册资金、成立年限） - 政策准入（中小企业标识、绿色认证） - 历史履约（交付及时率、好评率）

全流程审批与材料导出

7 步流程状态可视化追踪，支持 PDF/Excel 双格式导出。自动生成全套审批材料，减少人工整理时间 80%+。导出材料： - 采购需求清单 - 预算分析表 - 政策适用说明 - 供应商比选报告

系统架构与设计亮点

AI 技术边界清晰界定

明确界定 AI 适用边界：AI 用于语义分析（需求清单提取）、非结构化政策匹配、多目标优化等非确定性场景；确定性规则（审批权限分级、金额阈值校验、格式校验）采用硬编码。避免 AI 滥用，保障系统可靠性与合规性。

HITL 置信度分级机制

设计三级置信度机制：≥90% 自动通过、70-90% 建议复核、<70% 强制人工确认。置信度基于历史准确率、输入质量、规则冲突数等维度计算，平衡效率与风险。人工复核效率提升 60%+。

RAG 多路召回策略

政策检索采用关键词匹配 + 向量相似度 + 规则引擎三路召回，经 Rerank 模型排序后返回 Top5 结果。相比单一路径，召回率提升 35%，响应时间控制在 1 秒内。

量化指标与成果

≥90%

政策匹配准确率

≥90%

清单解析 F1-score

60%+

人工复核效率提升

100%

Bad Case 回收率

≤10 秒

单流程响应时间

80%+

人工整理时间减少

成果时间线

项目启动需求调研与痛点分析

3.20

PRD 文档完成技术方案设计

3.21

4 个 AI Agent 开发 RAG 政策库构建

3.22

HITL 机制实现前端界面开发

3.23

系统集成测试性能优化

3.24

Bad Case 回收机制数据闭环完善

3.25

完整文档沉淀项目总结发布

3.26

产品方法论总结

"好的 AI 产品不是追求完全自动化，而是在效率与风险之间找到最佳平衡点。"

— HITL 人机协作设计方法论

方法论详细阐述

1AI 技术边界界定：明确 AI 适用场景（语义分析、政策匹配、多目标优化）与硬编码场景（审批权限、金额阈值、格式校验），避免技术滥用。
2置信度分级机制：≥90% 自动通过、70-90% 建议复核、<70% 强制人工确认，平衡效率与风险，人工复核效率提升 60%+。
3数据驱动迭代：Bad Case 自动记录并分类统计，人工修正结果自动回流至训练数据集，形成持续改进闭环，Bad Case 回收率 100%。
4多智能体协作架构：4 个专业 AI Agent 各司其职（清单解析、预算分析、政策匹配、供应商匹配），相比单一大模型提升准确率且便于独立优化。

上一个作品人机协作剧本生成器下一个作品 AI 产品决策计算器