🚀 AgentCraft — 多 Agent 协作智能知识库系统

基于 Spring Boot + FastAPI + React 构建的 RAG 知识库问答平台，内置五层可编排 Agent 架构与多 Agent 协作机制，适合作为 Agent 后端开发学习项目与简历展示项目。

📖 项目简介

AgentCraft 是一个"前端 + Java 后端 + Python AI 微服务"的全栈 RAG 知识库系统。核心亮点是 五层可编排 Agent 架构——Interface、Orchestrator、Tool、Memory、Evaluation 五层解耦，支持意图识别→问题改写→检索→充分性判断→答案生成的完整工作流。系统内置 Router Agent / Retrieval Agent / Ops Agent 多 Agent 协作，通过统一 Tool Registry 管理 AI 能力，支持 runId/traceId 全链路追踪。

一句话总结：不只是一个 RAG 问答系统，更是一个 Agent 架构学习项目。

🏗️ 系统架构

flowchart TB
    Frontend["⚛️ React 前端"] -->|"HTTP/SSE<br/>JWT认证"| Backend["☕ Spring Boot 后端"]
    Backend -->|"REST API"| AI["🐍 Python AI 服务"]
    AI --> Storage["💾 数据存储"]
    
    Frontend --> User["👤 用户端<br/>智能问答 · 文档预览 · 历史记录"]
    Frontend --> Admin["🔧 管理端<br/>仪表盘 · 知识库管理 · Agent执行记录"]
    
    Backend --> Controller["🎮 Controller层<br/>Agent·Chat·Auth"]
    Backend --> Service["📦 Service层<br/>Ai·Chat·Knowledge·Cache"]
    Backend --> Data["🗄️ 数据访问<br/>MyBatis-Plus·Caffeine·Redis"]
    
    AI --> Interface["🌐 Interface层<br/>FastAPI·HTTP/SSE"]
    AI --> Orchestrator["🔄 Orchestrator层<br/>Planner·Executor·State"]
    AI --> Tool["🔧 Tool层<br/>ToolRegistry·超时重试"]
    AI --> Memory["🧠 Memory层<br/>Redis·MongoDB·MySQL"]
    AI --> Evaluation["📊 Evaluation层<br/>检索充分性·质量评估"]
    
    Storage --> MySQL["📊 MySQL<br/>业务数据持久化"]
    Storage --> Redis["🚀 Redis<br/>缓存会话锁"]
    Storage --> Milvus["🔍 Milvus<br/>向量相似度检索"]
    Storage --> Elasticsearch["📜 Elasticsearch<br/>日志分析"]
    Storage --> MongoDB["🗃️ MongoDB<br/>会话历史存储"]

多Agent协作流程

flowchart LR
    Router["🎯 Router Agent"] -->|知识型问题| Retrieval["📚 Retrieval Agent"]
    Router -->|闲聊/问候| ChitChat["💬 ChitChat Agent"]
    Retrieval --> Ops["⚙️ Ops Agent"]
    Ops --> Inspection["🔍 Inspection Agent"]
    
    Ops -.-> State["📊 状态追踪"]
    Inspection -.-> State

✨ 核心亮点

亮点一：五层可编排 Agent 架构

将 AI 服务拆分为 Interface → Orchestrator → Tool → Memory → Evaluation 五层，每层职责单一、可独立扩展。

单 Agent 端到端执行流程：

flowchart TD
    A["🗣️ 用户提问"] --> B["意图识别<br/><i>Planner.recognize_intent()</i>"]
    B -->|知识问答| C["问题改写<br/><i>Planner.rewrite_question()</i>"]
    B -->|闲聊| CHITCHAT["ChitChatAgent 直接回复"]
    B -->|管理操作| OPS["OpsAgent 处理"]

    C --> D["知识检索<br/><i>VectorStore.search()</i><br/>Milvus 向量相似度搜索"]
    D --> E{"充分性判断<br/><i>Sufficiency Check</i>"}
    E -->|不充分| F["追问用户补充信息"]
    F --> B
    E -->|充分| G["答案生成<br/><i>LLM.generate()</i><br/>带引用来源的结构化回答"]
    G --> H["记忆写入<br/><i>MemoryWriteTool</i><br/>保存对话上下文"]

    style A fill:#1e3a5f,stroke:#60a5fa,color:#fff
    style E fill:#3b2f00,stroke:#fbbf24,color:#fff
    style G fill:#0f3d0f,stroke:#4ade80,color:#fff
    style H fill:#2d1b4e,stroke:#a78bfa,color:#fff

关键代码：

agent/orchestrator.py — 编排器，创建 state、调用 planner、逐步执行
agent/planner.py — 规划器，意图识别 + 问题分类 + 充分性判断
agent/executor.py — 执行器，根据 step_type 分发到具体实现
agent/state.py — 状态管理，run_id / trace_id / step 追踪

亮点二：多 Agent 协作机制

Router Agent 负责任务分发，Retrieval Agent 专精检索，Ops Agent 负责运营分析，各 Agent 独立可扩展。

多 Agent 协作流程：

flowchart TD
    Q["🗣️ 用户提问"] --> R{"🤖 Router Agent<br/><i>router_agent.py</i><br/>关键词权重 + LLM 分类"}

    R -->|闲聊| C1["💬 ChitChatAgent<br/><i>chitchat_agent.py</i><br/>轻量级回复，不走检索"]
    R -->|知识问答| C2["🔍 RetrievalAgent<br/><i>retrieval_agent.py</i><br/>Query Rewrite → Recall → Rerank → Citation"]
    R -->|管理助手| C3["📊 OpsAgent<br/><i>ops_agent.py</i><br/>知识缺口/问答趋势/用户活跃度"]
    R -->|知识巡检| C4["🔎 InspectionAgent<br/><i>inspection_agent.py</i><br/>重复检测/质量检测/过期检测"]

    C2 --> ANS["📝 答案生成 + 引用来源"]
    C1 --> ANS

    classDef router fill:#1e3a5f,stroke:#60a5fa,color:#fff
    classDef chitchat fill:#0f3d0f,stroke:#4ade80,color:#fff
    classDef retrieval fill:#3b2f00,stroke:#fbbf24,color:#fff
    classDef ops fill:#2d1b4e,stroke:#a78bfa,color:#fff
    classDef inspection fill:#4a1942,stroke:#f472b6,color:#fff

    class R router
    class C1 chitchat
    class C2 retrieval
    class C3 ops
    class C4 inspection

Retrieval Agent 内部链路：

flowchart LR
    A["Query Rewrite<br/>问题改写优化"] --> B["Knowledge Search<br/>Milvus 向量检索"]
    B --> C["Rerank<br/>语义重排序"]
    C --> D["Citation Integration<br/>引用来源整合"]
    D --> E["答案生成"]

    style A fill:#3b2f00,stroke:#fbbf24,color:#fff
    style B fill:#1e3a5f,stroke:#60a5fa,color:#fff
    style C fill:#0f3d0f,stroke:#4ade80,color:#fff
    style D fill:#2d1b4e,stroke:#a78bfa,color:#fff
    style E fill:#1a1a2e,stroke:#e2e8f0,color:#fff

关键代码：

workflows/router_agent.py — 4 种任务路由（闲聊/知识问答/管理助手/巡检）
workflows/retrieval_agent.py — 完整检索链路，可配置开关
workflows/ops_agent.py — 运营分析，直接查 MySQL，不走 LLM

亮点三：统一 Tool Registry 工具体系

将知识检索、OCR、文档摘要、对话记忆等 AI 能力抽象为标准 Tool，定义输入/输出 Schema、超时、重试与权限元数据。

# tools/base.py — 工具基类
class Tool(ABC):
    name: str
    input_schema: ToolSchema      # 输入参数 Schema
    output_schema: ToolSchema     # 输出结果 Schema
    metadata: ToolMetadata        # 超时/重试/权限

    @abstractmethod
    def execute(self, parameters: Dict) -> Dict:
        pass

# tools/registry.py — 工具注册器（单例）
class ToolRegistry:
    def register_tool(tool: Tool)      # 注册工具
    def invoke_tool(name, params)       # 调用（带超时+重试）
    def get_all_tools() -> Dict         # 列出所有工具

已注册工具列表：

工具名	功能	超时	重试
knowledge_search	知识库语义检索	30s	3
question_rewrite	问题改写优化	30s	3
rerank	语义重排序	30s	3
citation	引用来源整合	5s	1
conversation_memory_read	对话记忆读取	5s	1
conversation_memory_write	对话记忆写入	5s	1
ocr_extract	OCR 文字提取	30s	3
doc_summary	文档摘要生成	30s	3

亮点四：全链路可观测

每个 Agent 运行都有 runId + traceId，支持执行记录查询、步骤追踪、工具调用审计。

run_id: "test-run-001"
  ├─ step 1: intent_recognition     → ✅ confidence: 0.95
  ├─ step 2: question_rewrite       → ✅ "什么是数据库" → "请解释数据库的定义、分类和常见应用场景"
  ├─ step 3: knowledge_search       → ✅ 返回 3 个相关 chunk
  ├─ step 4: result_evaluation      → ✅ 充分性: sufficient
  └─ step 5: answer_generation      → ✅ 生成答案 + 2 个引用来源

🛠️ 技术栈

后端

技术	版本	用途
Java	17	开发语言
Spring Boot	3.2.3	后端主框架
MyBatis-Plus	3.5.x	ORM 持久层
MySQL	8.0	关系型数据库
Redis	7.0	分布式缓存、会话管理
Caffeine	3.x	本地缓存，毫秒级响应
Spring Security	6.2.x	JWT 认证 + 权限控制
Spring WebFlux	-	SSE 流式响应
七牛云 Kodo	-	文档对象存储

AI 服务

技术	版本	用途
Python	3.9+	AI 服务语言
FastAPI	0.110+	高性能 Web 框架
LangChain	0.1.x	RAG 流程管理
Milvus	2.4+	向量数据库，语义检索
通义千问	qwen-plus	大语言模型
DashScope	-	Embeddings 向量化服务

前端

技术	版本	用途
React	18.2	前端主框架
Vite	5.x	构建工具
ECharts	6.x	数据可视化
Axios	1.x	HTTP 客户端

📸 效果展示

用户端

智能问答（带参考来源）	闲聊路由（Router Agent 自动识别）

管理端

仪表盘	Agent 执行记录

知识巡检（Ops Agent）	自动报表

🚀 快速启动

方式一：Docker Compose 一键部署（推荐）

# 克隆项目
git clone https://github.com/your-username/ai-knowledge-system.git
cd ai-knowledge-system

# 一键启动（首次需要构建镜像，约 5-10 分钟）
docker-compose up -d

# 访问
# 前端：http://localhost:80
# Java 后端：http://localhost:8080
# Python AI 服务：http://localhost:8000

需要安装 Docker Desktop。首次启动会自动下载 MySQL、Redis 并构建服务镜像。

方式二：手动启动

环境要求

JDK 17+
Python 3.9+
Node.js 18+
MySQL 8.0+
Redis 7.0+

开发模式零配置可跑：向量存储默认使用 FAISS（零依赖，无需 Milvus），文档上传默认本地存储（无需七牛云），短信验证码未配置时为模拟模式（验证码输出到控制台）。

1. 数据库准备

mysql -u root -p -e "CREATE DATABASE ai_knowledge_db CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;"
mysql -u root -p ai_knowledge_db < sql/init.sql

2. Java 后端启动

# 编辑 src/main/resources/application.yml 配置 MySQL / Redis 连接
mvn clean package
java -jar target/ai-knowledge-system-*.jar
# 默认端口 8080

3. Python AI 服务启动

cd python-service
pip install -r requirements.txt
# 配置 .env（MILVUS_HOST、DASHSCOPE_API_KEY 等）
python main.py
# 默认端口 8000

4. 前端启动

cd frontend
npm install
npm run dev
# 默认端口 3000

默认账号

用户端：手机验证码注册登录（未配置短信时为模拟模式）
管理端：admin / admin123

📝 简历写法参考

以下话术可直接用于简历项目经历描述，面试时围绕每条展开讲解即可。

1. 负责五层可编排 Agent 架构设计与实现，将 AI 服务拆分为 Interface、Orchestrator、Tool、Memory、Evaluation 五层，实现意图识别→问题改写→检索→充分性判断→答案生成的完整工作流；通过 StepType 枚举 + Planner 动态规划步骤，支持任务编排与独立扩展，runId/traceId 实现全链路追踪。

2. 设计并实现多 Agent 协作机制，Router Agent 基于关键词权重算法识别任务类型并分发至对应 Agent，Retrieval Agent 专精 Query Rewrite + 多路召回 + Rerank + Citation 全链路检索，Ops Agent 负责知识缺口分析与运营报告生成；各 Agent 独立可扩展，共享状态协同工作。

3. 构建统一 Tool Registry 工具体系，将知识检索、OCR、文档摘要、对话记忆等 AI 能力抽象为标准 Tool，定义输入/输出 Schema、超时、重试与权限元数据；通过单例 ToolRegistry 实现工具注册/查找/调用，支持单工具执行与多工具链编排，基于 ThreadPoolExecutor 实现超时控制。

4. 设计并实现多级缓存架构，Caffeine 本地缓存 + Redis 分布式缓存两级架构，实现缓存穿透/雪崩防护机制，热点数据毫秒级响应；通过 @Async 异步处理提升系统吞吐量。

5. 实现 RAG 全链路知识库系统，支持多格式文档（PDF/Word/TXT）自动解析、向量化存储至 Milvus，用户提问时通过语义检索 + Rerank 重排序精准召回相关文档，生成带引用来源的结构化答案，支持在线预览/下载。

🗺️ 迭代路线图

阶段	内容	状态
Phase 1	RAG 知识库核心链路（上传→解析→向量化→检索→生成）	✅ 已完成
Phase 2	多级缓存 + 对话上下文 + SSE 流式输出	✅ 已完成
Phase 3	五层 Agent 架构 + 全链路追踪	✅ 已完成
Phase 4	多 Agent 协作（Router + Retrieval + Ops）	✅ 已完成
Phase 5	Docker Compose 一键部署	✅ 已完成
Phase 6	接入更多 LLM（OpenAI / Claude / 本地模型）	📋 计划中
Phase 7	Reasoning Agent（归纳推理独立 Agent）	📋 计划中
Phase 8	Memory Agent（记忆压缩 + 主动读写）	✅ 已完成

🎓 学完这个项目你能掌握什么

能力	对应代码	面试考点
RAG 全链路设计	python-service/core/ + tools/	向量检索、Embedding、Rerank
Agent 架构设计	python-service/agent/	编排器、规划器、执行器、状态机
多 Agent 协作	python-service/workflows/	Router 分发、Agent 间通信
工具注册体系	python-service/tools/registry.py	插件化设计、Schema 校验、超时重试
多级缓存	src/.../service/impl/CacheService	Caffeine + Redis、穿透/雪崩防护
SSE 流式输出	src/.../controller/ChatController	WebFlux Flux、Server-Sent Events
JWT 认证	src/.../config/SecurityConfig	Token 生成/校验/刷新
向量数据库	python-service/core/vector_store.py	Milvus 部署、索引、检索、删除

⚠️ 已知问题与改进方向

当前存在的问题

Reasoning Agent 缺失：答案生成目前由 KnowledgeQAAgent 直接调用 LLM，没有独立的归纳推理 Agent，复杂问题的推理能力有限。
~~Memory Agent 缺失~~ ✅ 已实现独立的记忆压缩 Agent，支持主动读写和记忆压缩策略，长对话场景下记忆效率显著提升。
~~四级记忆体系不完整~~ ✅ 已完善四级记忆体系：短期记忆（Redis）、会话记忆（MongoDB）、知识分层记忆和用户个性化记忆均已实现。
Rerank 默认关闭：Retrieval Agent 中 use_rerank 默认为 False，需要手动开启。支持 simple（规则排序，零依赖）和 bge（语义重排，需下载 ~1.1GB 模型）两种模式，开发环境建议用 simple。
~~无 Docker Compose~~ ✅ 已提供 docker-compose.yml，支持一键部署。
前端无 TypeScript：前端使用纯 JavaScript，没有类型检查，对于大型项目可维护性不足。
短信验证码为模拟模式：未配置阿里云短信时，验证码直接输出到控制台，适合开发调试，不适合生产环境。
~~七牛云为必需依赖~~ ✅ 文档上传已支持本地存储，upload.dir 可配置，默认 ./uploads。

改进方向

补充 Reasoning Agent 和 Memory Agent，完善五层架构
接入更多 LLM 提供商（OpenAI / Claude / 本地 Ollama）
前端迁移到 TypeScript + 状态管理库
完善单元测试覆盖率

📄 开源协议

MIT License — 可自由用于学习、毕设、简历项目。

Name		Name	Last commit message	Last commit date
Latest commit History 98 Commits
.github/workflows		.github/workflows
.playwright-mcp		.playwright-mcp
.trae/rules		.trae/rules
frontend		frontend
images		images
python-service		python-service
sql		sql
src/main		src/main
.dockerignore		.dockerignore
.gitignore		.gitignore
Dockerfile.frontend		Dockerfile.frontend
Dockerfile.java		Dockerfile.java
Dockerfile.python		Dockerfile.python
LICENSE		LICENSE
README.md		README.md
docker-compose.yml		docker-compose.yml
nginx.conf		nginx.conf
pom.xml		pom.xml
test_memory.py		test_memory.py

Folders and files

Latest commit

History

Repository files navigation

🚀 AgentCraft — 多 Agent 协作智能知识库系统

📖 项目简介

🏗️ 系统架构

多Agent协作流程

✨ 核心亮点

亮点一：五层可编排 Agent 架构

亮点二：多 Agent 协作机制

亮点三：统一 Tool Registry 工具体系

亮点四：全链路可观测

🛠️ 技术栈

后端

AI 服务

前端

📸 效果展示

用户端

管理端

🚀 快速启动

方式一：Docker Compose 一键部署（推荐）

方式二：手动启动

环境要求

1. 数据库准备

2. Java 后端启动

3. Python AI 服务启动

4. 前端启动

默认账号

📝 简历写法参考

🗺️ 迭代路线图

🎓 学完这个项目你能掌握什么

⚠️ 已知问题与改进方向

当前存在的问题

改进方向

📄 开源协议

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages