西北上单

03-08 22:11 已编辑新疆大学 Java 发布于新疆

关注

Mini-Doubao：一个具备 RAG + Agent 能力的 AI 对话系统（已开源）

我自己做了一个 AI 后端项目 Mini-Doubao 。

这个项目不只是“调用大模型接口聊天”，而是围绕真实工程问题做了完整实现，包括：

SSE 流式对话
RAG 知识库检索
Agent 工具调用闭环
多轮会话上下文管理
线程池隔离与异步收尾
邮箱验证码注册/登录/找回密码

项目背景

基于火山引擎（豆包模型）API 构建。

目标是做一个“可对话 + 可检索 + 可扩展工具能力”的系统，并解决 AI 场景中常见的工程问题：

长连接、异步任务、上下文成本控制、服务稳定性等。

核心能力

1）RAG 异步摄入链路

文档上传后通过 RocketMQ 异步处理
完成“解析 -> 切片 -> Embedding -> Milvus 入库”
避免大文件处理阻塞 Web 请求

2）流式响应 + 稳定性优化

使用 SSE 把模型输出实时推送到前端
使用独立线程池隔离模型调用，避免下游波动拖垮业务线程
流结束后异步进行落库与扣费

3）Agent 工具调用

支持天气查询、联网搜索等工具
实现“模型决策 -> 参数解析 -> 工具执行 -> 结果回填 -> 最终回答”的闭环
工具失败可降级，不影响主流程可用性

4）上下文滑动窗口（Token 预算）

多轮对话按 Token 预算做上下文裁剪
预留 system/rag/input 预算，控制调用成本
保证长对话的可持续性与响应质量平衡

5）账号体系

邮箱验证码注册
邮箱密码登录
邮箱验证码找回密码
频控（邮箱/IP）

技术栈

后端：Spring Boot、MyBatis-Plus、Spring AI、JWT、Redis
AI 能力：火山引擎豆包 API、SSE
RAG：RocketMQ、MinIO、Milvus
前端：Vue3 + TypeScript + Element Plus
数据库：MySQL

这个项目我重点锻炼了什么

AI 接口集成能力（流式协议、模型输入结构）
异步架构设计（MQ 解耦 + 后台处理）
稳定性治理（线程隔离、超时、降级）
成本控制（上下文预算管理）
工程化思维（日志可观测、模块化设计、可开源交付）

当前已实现功能点

1）账号与权限

邮箱验证码注册
邮箱密码登录
忘记密码（邮箱验证码重置）
JWT 鉴权
基础角色区分（管理员/普通用户）

2）对话能力

单轮/多轮文本对话
SSE 流式返回（打字机效果）
深度思考开关（按模式切换回答策略）
会话创建、重命名、删除、置顶
历史消息查看与持久化

3）上下文管理

基于 Token 预算的滑动窗口裁剪
可预留 system / RAG / 输入预算
长对话成本控制（避免上下文无限增长）

4）RAG 知识库

文档上传（支持会话关联）
文档异步解析（MQ 解耦）
文本切片 + 向量化
Milvus 向量检索召回
检索结果注入对话上下文

5）Agent 工具调用

工具决策（模型输出结构化决策）
本地工具执行（天气查询、联网搜索）
工具调用记录（工具名、参数、状态、耗时、结果）
工具失败降级与结果回填

6）稳定性与工程化

模型调用线程池隔离（避免阻塞业务线程）
异步收尾（消息落库、消耗统计）
请求超时与友好错误返回
Redis + MySQL 的会话上下文分级存储（读缓存、miss 回源、回填）
基础限频（邮箱/IP）

7）管理后台（基础）

用户管理
对话记录查看
系统配置项管理
基础运营数据展示

代码地址

GitHub：https://github.com/mknb66/mini-doubao

在线演示（测试环境）：http://115.191.64.85/

说明：演示环境资源有限，可能会限流或不定时重启，如果访问异常可以稍后再试。

欢迎提 issue 或交流建议，我会继续慢慢打磨。

#27届求职交流##AI项目实战#

全部评论

推荐最新楼层

求好运眷顾🙏🏻

门头沟学院后端工程师

大佬泰牛

点赞回复分享

发布于 03-21 21:28 广东

旺仔QQ唐同学

武汉理工大学营销

对比卖课的那帮，已经很厉害了，我看谁敢喷你

点赞回复分享

发布于 03-10 18:23 湖北

海侠之歌

郑州大学增长产品

开源还带演示？作者是活菩萨🙏

点赞回复分享

发布于 03-10 18:23 河南

7Shock-突击手

门头沟学院 Java

限频+超时+降级，稳定性三件套齐了

点赞回复分享

发布于 03-10 18:23 陕西

狂踹瘸子那条好腿

浙江传媒学院产品经理

邮箱注册+JWT鉴权，连账号都做了，牛的

点赞回复分享

发布于 03-10 18:23 浙江

勇敢的候选人想要offer

暨南大学生物工程

这项目真硬核！

点赞回复分享

发布于 03-10 18:22 广东

贡木槿

兰州城市学院通信研发工程师

就佩服手搓的

点赞回复分享

发布于 03-10 18:22 甘肃

创作小队长

牛客创作者运营

厉害诶！

点赞回复分享

发布于 03-09 18:26 北京

西北上单

楼主

新疆大学 Java

做得非常简陋轻喷

点赞回复分享

发布于 03-08 21:41 新疆

03-30 14:45

福州大学 Java

字节飞书二面凉经......

面试内容：1.使用过飞书吗，都是在哪些场景2.介绍一下TCP三次握手3.对DDoS了解吗？（根本没听过，然后我反问他让他介绍一下是什么（分布式的拒绝服务的攻击），我说有点像中间人攻击）4.中间人攻击是什么？根据我的介绍，你觉得DDoS和中间人攻击的区别在于什么？5.针对中间人攻击的怎么进行防御（我讲了https的加密握手）6.又绕回来了这个DDos攻击，怎么实现比较高效呢。（根本不会我就一直瞎扯）7.然后说这个DDos是想让服务拒绝提供正常的服务，怎么让服务端拒绝提供服务呢？（我回答了而已刷接口流量之类的，然后他觉得一直没get到他的点，就pass这个问题了，然后我反问才得知要从内存、计算资源...

纳斯卡可：这算法题太经典了

查看12道真题和解析

点赞评论收藏

04-08 15:24

重庆大学 golang

这几个项目怎么样呢

最近在投暑期实习，都拖得好久😭

点赞评论收藏

04-18 20:29

门头沟学院 C++

腾讯云平台架构一面

1. 自我介绍2. 平时写代码多吗，平时主要用 C++ 做什么3. C++11 和 C++17 里你觉得比较重要的特性有哪些答案：C++11 我觉得比较关键的是右值引用、移动语义、智能指针、lambda、线程库、原子操作、auto、范围 for、nullptr。这些特性基本把现代 C++ 的使用方式奠定下来了。C++17 里我更常用的是结构化绑定、if constexpr、折叠表达式、std::optional、std::variant、std::string_view、并行算法里的一些思想。如果是实际工程里最有感知的，我会优先说移动语义、智能指针、lambda、原子和 string_view...

腾讯一面2290人在聊

点赞评论收藏

04-20 17:48

沈阳工业大学测试开发

参与有关ai的业务

在简历中写明在业务中主要涉及ai的哪方面，我暑期实习负责的就是ai回答的准确率，符合知识库给它的，主要是历史方面的，秋招实习时就经常被问到是如何检验的，有哪些评测指标

简历上如何体现你的“AI...

点赞评论收藏

04-13 14:00

浙江大学算法工程师

小马智行C++ 一面

1. C++ 中左值、右值、右值引用分别是什么？左值一般表示有名字、可取地址、生命周期相对明确的对象；右值通常是临时对象、字面量，或者表达式计算后的中间结果。右值引用本质上是为了高效接管临时对象资源，避免不必要的深拷贝，这也是移动语义成立的基础。std::move 本身不移动对象，它只是把对象强制转换成右值引用，真正是否发生资源转移取决于移动构造或移动赋值是否实现。在工程里，右值引用常用于容器扩容、返回值优化配合、资源句柄转移等性能敏感场景。2. 什么情况下需要把析构函数写成虚函数？只要一个类可能被当作基类使用，并且会通过基类指针删除派生类对象，就必须把析构函数声明为虚函数。如果基类析构不是虚...

查看12道真题和解析

点赞评论收藏

招聘动态

上海人工智能实验室

2026年春季校园招聘

AI网申助手

网申字段一键填写

阿里巴巴集团

2027届实习生校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

滴滴

2027届秋招储备实习生招聘

快手

27届实习超多转正机会

全站热榜

创作者周榜

正在热议

# 华泰星战营，提前锁定校招offer #

# 一人推荐一个值得去的通信/硬件公司 #

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

# HR问：你期望的薪资是多少？如何回答 #

97751次浏览 826人参与

# 90后北漂现状 #

39071次浏览 225人参与

# 正在春招的你，也参与了去年秋招吗？ #

398000次浏览 2740人参与