02-07 14:57 中国科学技术大学 Java 发布于江苏

关注

基于知识库的agent幻觉降低的实践

在做agent项目的时候，我真正感受到“AI幻觉”并不是抽象概念，而是一个非常具体、非常烦人的工程问题。基于知识库的问答助手，理论上应该“只根据资料说话”，但现实中却频繁出现张冠李戴、虚构事实、甚至把不存在的数据说得头头是道。模型看起来很自信，结果却完全不对。

我们最先做的，其实是最直觉的一步：换更强的模型。能力更强的模型，确实在理解上下文、引用资料时稳定不少，但问题也很快暴露出来——算力和调用成本直线上升，项目根本压不住成本。这一步只能作为兜底，而不是长期方案。

接下来是补资料库。我们发现，很多幻觉并不是“乱编”，而是模型在背景知识不足时强行补全。于是不断扩充文档覆盖面，减少模糊表述，让资料本身更完整、更自洽。这一步很笨，但很有效，背景越扎实，模型胡说的空间就越小。

真正拉开效果差距的，是prompt的优化。我们重新设计了背景设定，明确告诉模型“只能基于给定资料回答”，并且通过#牛客AI配图神器#few-shot示例，让它看到什么是正确引用、什么是信息不足时该如何回答。尤其是示范“无法从资料中得出结论”的回答方式，对减少幻觉帮助很大。

最后我才意识到，幻觉不是单点问题，而是模型能力、知识质量和引导方式共同作用的结果。能做的不是彻底消灭它，而是一步步把它压到工程可接受的范围内。
#为了减少AI幻觉，你注入过哪些设定？#

全部评论

推荐最新楼层

02-04 22:23

浙江大学嵌入式工程师

如何做一个有含金量的嵌入式项目？（不烂大街思路分享）

最近我看了一些粉丝的简历，写着五六个项目，全是“温湿度采集”、“简单的家居控制”。说句扎心的实话：做一堆简单的 Demo，不如把一个项目做深。为什么你的项目被 HR 说是“烂大街”？ 因为那些大多是验证硬件功能，跟嵌入式软件的核心能力关系不大。你调通了 外设读取温湿度，那是单片机基础。如果是找“嵌入式软件”岗位，请一定要在“软件”上下功夫！真正的深度不是你会用几个外设，也不是老生常谈的“通信来通信去”，而是你有没有能力对系统核心进行优化。怎么增加嵌入式项目的深度？以下是几个能真正体现“软件深度”的项目优化方向：一、 拒绝“裸机思维”，拥抱 RTOS 的内核级深度别再只是 跑到底了。引入 RTO...

你最近因为什么迷茫？

点赞评论收藏

分享

昨天 18:19

卓越里程_中台运营(准入职员工)

卓越教育内推，卓越教育内推码

卓越助教面试经验分享参加卓越小学助教首先是要笔试（线上的），选语数英三科中的两到三科进行笔试，有80分就算过。题目很简单，就是小学六年级的知识点。然后你把成绩截图并且简历发给招聘负责人，等待面试。面试（线上微信视频通话）1.进行一个简单的自我介绍，并说出你做助教的个人优势。个人优势：担任过班委，班级管理经验。有家教经验，懂得如何和小朋友相处。2.情景问答题从2-9中选一个数字，回答对应的问题。1.到了上课时间老师还没来，你应该怎么办？先和老师联系，了解情况。然后告诉学生情况，安抚大家的情绪，带领学生拿出复习资料和课本进行学习，等待老师到达。2.如果上课过程中有孩子嬉笑打闹，你应该怎么办？分成三...

点赞评论收藏

分享

02-05 20:34

蚌埠坦克学院嵌入式软件开发

嵌入式开发可以干到多少岁

很多人问，嵌入式开发能干多久，其实没有固定上限。嵌入式更看能力和经验，而不是单纯年龄。年轻的时候，更多精力刷算法、调外设、熬夜加班；经验丰富后，更多靠设计架构、优化系统、指导新人。只要持续学习新技术、熟悉操作系统、掌握芯片和项目经验，完全可以干到 40+，甚至 50+ 也能在团队里发挥核心价值。嵌入式不像一些纯前端、前沿互联网岗位对体力或眼力要求那么高，更多是脑力活和经验活。坚持学习、跟上行业节奏，年龄从来不是限制。

程序员能干到多少岁？

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

27届简历点评

27届寒假/转正实习汇总

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛客吐槽大会 #

25673次浏览 324人参与

# 工作前VS工作后，你的心态变化 #

38529次浏览 267人参与

# 秋招想进国企该如何准备 #

125464次浏览 617人参与

# 你的mentor是什么样的人？ #

51611次浏览 741人参与

# 从mentor身上学到了__ #

55636次浏览 886人参与

# 我和mentor的爱恨情仇 #

106718次浏览 969人参与

# 我的省钱小妙招 #

37603次浏览 446人参与

# 机械人避雷的岗位/公司 #

44894次浏览 320人参与

# 在大厂上班是一种什么样的体验 #

15295次浏览 224人参与

# 为了减少AI幻觉，你注入过哪些设定？ #

7696次浏览 217人参与

# 职场上哪些行为很加分？ #

323200次浏览 3619人参与

# 通信/硬件求职避坑tips #

139995次浏览 1087人参与

# 论秋招对个人心气的改变 #

16294次浏览 251人参与

# 你觉得mentor喜欢什么样的实习生 #

48778次浏览 1002人参与

# 你现在会用到哪些AI技能？ #

24849次浏览 137人参与

# 牛客AI体验站 #

9469次浏览 230人参与

# 毕业论文进行时 #

27710次浏览 153人参与

# 运营来爆料 #

77460次浏览 467人参与

# 程序员找工作至少要刷多少题？ #

24432次浏览 315人参与

# 过年最难忘的一件事 #

23344次浏览 179人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务