03-14 19:31 上海交通大学算法工程师发布于上海

关注

DeepSeek-V3.2读后感：稀疏注意力不只省算力，更影响智能体上限

今天啃完 DeepSeek-V3.2 技术报告，记3个我觉得最有启发的点：

1）架构层：DSA 把注意力从“全量看历史”改成“先索引再精读”，长上下文下计算压力明显更可控。

2）训练层：后训练不是点缀。报告里把大量算力放在 RL 和专家蒸馏上，说明“会推理+会调用工具”是靠系统工程堆出来的。

3）数据层：智能体能力提升的关键在任务构造。把真实工具链、可验证任务、难度递进放进训练闭环，比单纯堆问答数据更有效。

我的体感是：下一阶段做大模型应用，拼的不只是模型参数，而是“架构效率 × 训练策略 × 任务设计”的乘积。

你们最近在做的 Agent 项目里，最卡的是哪一环？

#大模型# #算法工程师# #深度学习# #AI求职#

全部评论

推荐最新楼层

03-04 15:25

黑龙江大学 Java

我做过的，被面试官夸爆的那些Ai项目(二)

如果说我做过的，被面试官夸爆的那些Ai项目(一)是对现有规则提出了完全不同的解题思路的话，那么今天的项目则可以说是开创了全新的产品形态。换言之，我们不仅应该探索全新的思路，更应该站在开发者的角度去思考，有哪些全新的产品形态可以给用户带来完全不一样的体验模式。1. Superset — AI Agent 多路复用终端2026.03.01 | 全新品类，两天前刚上线一个终端同时运行 10+ 个 AI 编码 Agent，git-worktree 隔离互不干扰。会话 fork、智能状态感知、零遥测。这个品类刚出现，做一个带 Web 可视化的"AI 编程指挥台"，目前几乎没有竞品。推...

点赞评论收藏

分享

03-18 03:50

门头沟学院推荐算法

度小满大模型算法实习一面

欢迎友好讨论，信息共享1.项目拷打2.moe架构的专家路由是对每个token路由还是对每个序列路由3.如果是对每个token路由，那么代码实现时是如何避免写对每个token的循环的4.部署qwen3合成数据时候用的什么框架5.在用qwen3-32b做推理时显存占用是多少6.在多卡上部署模型时，用了什么策略使得GPU利用率能拉满7.讲一讲vllm框架，他是如何保证GPU利用率的8.讲讲flash attention9.算法题：反转链表

查看9道真题和解析

点赞评论收藏

分享

03-19 15:17

广西大学算法工程师

Momenta AI Agent开发二面

1、自我介绍2、项目介绍3、Agent 的核心组成是什么LLM Agent 本质上不是单独一个大模型，而是由模型、提示策略、工具、知识、记忆和执行接口组成的系统。可以概括成：[Agent = LLM + Prompt + Tools + Knowledge + Memory + Interface]其中 LLM 负责理解和生成，Prompt 决定任务边界和行为方式，Tools 负责访问外部能力，比如检索、地图、计算、数据库和 API，Knowledge 负责补充外部知识，Memory 负责保留短期上下文和长期用户信息，Interface 则负责把 Agent 和外部系统连起来。如果任务比较简单...

AI-Agent面试实战...

点赞评论收藏

分享

03-23 08:45

门头沟学院推荐算法

大模型算法实习二面-美团 40min

发一下问题给大家参考，攒攒人品！有面试过同岗的朋友欢迎评论区交流1.实习介绍2.介绍第一个项目3.整个系统的延迟大概是多少4.rag数据库存储的具体的内容是什么5.你在这个项目里主要做了什么，能具体讲讲吗6.无算法题

查看5道真题和解析

点赞评论收藏

分享

03-19 04:30

北京大学算法工程师

得物大模型面经八股盛宴

继续来分享下之前的面经~Agent & 系统工程1. agent的部署流程2. agent和workflow的区别，为什么需要agent3. 觉得当前的agent达到预期了吗？对agent的预期是什么4. agent的改进方向是什么5. 你认为从大模型端要做什么来适配agent大模型基础 & 微调6. 大模型项目遇到了什么问题7. 大模型微调的机制8. lora的具体原理9. lora中特殊的超参数有哪些，分别有什么意义，会对模型有什么影响10. lora效果不好怎么办11. lora的缺点，改进方向12. 有没有从0训练大模型的经历上下文 & 记忆机制13. 怎么加强大模型记忆机制14. 上下文接口怎么修改15. 较长较多的上下文怎么解决多模态相关16. 多模态的用户信息怎么存储和使用17. 对多模态大模型有什么了解18. 多模态大模型的具体结构

查看18道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

AI网申助手

网申字段一键填写

龙湖集团数字科技平台

2026届春季招聘&实习生招聘

阿里巴巴集团

2027届实习生校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

滴滴

2027届秋招储备实习生招聘

快手

27届实习超多转正机会

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

61948次浏览 535人参与

# 机械笔面试考察这些知识点 #

17814次浏览 121人参与

# 商战，最累的是我们 #

31435次浏览 97人参与

# AI时代还有必要刷leetcode吗？ #

45742次浏览 550人参与

# 分享一个让你热爱工作的瞬间 #

69736次浏览 504人参与

# 米哈游笔试 #

671301次浏览 1207人参与

# 毕业租房也有小确幸 #

173443次浏览 4555人参与

# 字节7000实习来了，你投了吗？ #

42243次浏览 319人参与

# 想从事Agent应该学习哪些技术？ #

13286次浏览 379人参与

# 机械制造秋招总结 #

117691次浏览 927人参与

# 大学生该如何认清当下的就业环境？ #

165565次浏览 905人参与

# 国企/银行/研究所公司爆料 #

209038次浏览 917人参与

# 26届春招投递记录 #

4727次浏览 49人参与

# 有哪些公司在面试时考察AICoding？ #

26315次浏览 427人参与

# 实习必须要去大厂吗？ #

202152次浏览 1784人参与

# HR面都在聊什么？ #

20797次浏览 230人参与

# 初创公司值得加入吗？ #

44660次浏览 226人参与

# 春招什么时候投？ #

52391次浏览 709人参与

# 你都在哪些场所面过试？ #

80865次浏览 506人参与

# 你现在一天AI几次？ #

21921次浏览 147人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务