04-11 09:40 门头沟学院算法工程师

关注

字节 Agent算法凉经分享 75min

攒攒人品！有面试过同岗的朋友欢迎评论区交流
1. 在LM-as-Judge评测中，如何设计实验验证评测模型的打分偏差，并消除其对最终结果的系统性影响？
2. 多模型交叉评测时，若出现明显的打分分布偏移，如何量化偏移程度并设计校准策略？
3. 针对Data Agent的数值计算与逻辑推理场景，如何设计细粒度评测维度，避免只以最终结果论对错？
4. 如何构建高难度的对抗评测样本，以有效暴露Agent在工具调用、参数传递中的隐蔽缺陷？
5. 如何评估评测 pipeline 本身的可靠性？如何证明你的评测结果是可复现、可置信的？
6. 在长链路多步推理场景下，如何设计评测机制，区分中间步骤错误与最终生成错误？
7. 面对人工评测与自动化评测结果严重冲突时，如何设计决策机制与置信度评估方案？
8. 如何在不显著增加调用成本的前提下，提升LM-as-Judge对细微错误、逻辑漏洞的检测能力？
9. 模型迭代后如何设计回归评测体系，精准定位能力退化点并归因到具体训练或结构改动？
10. 多Agent协同任务中，如何设计评测指标区分单Agent能力问题与交互调度逻辑问题？

手撕：现有列表 A，B、C 均调用 A，B 执行出错导致 C 连带错误，从评测与测试角度该如何定位根因？

全部评论

推荐最新楼层

03-26 19:08

中国矿业大学后端工程师

3.26字节财经一面

1 synchronized底层原理 2.voliate 为什么不能保证原子性 3.threelocal内存泄漏的原因 4.mysql为什么用b+树 5.事务隔离级别有哪些主要解决什么问题  6.mvcc原理 7.对ai的理解 8 skill作用 9 mcp是什么样的协议 10.怎么开发一个mcp服务 11上下文过大怎么解决  12.leetcode438. 找到字符串中所有字母异位词

查看12道真题和解析

点赞评论收藏

分享

昨天 17:35

门头沟学院 Java

27实习字节后端ai开发一面 1h

给我面没招了，发点面经攒攒人品～1项目拷打2ai助手如何优化的呢3面向用户是谁，你的优化过程是怎么考虑的4agent和前端交互用的什么协议5讲下http是什么，属于哪一层6假如我们没有tcp只有udp如何保证传递的安全性7讲下你这个rag的完整流程8tI时间设计的这么短，热点数据打入redis，redis这时候过期了怎么办9那假如查询的数据缓存没有命中，会有什么问题10cache-aside是什么，解决了什么问题11算法:链表是否有环

点赞评论收藏

分享

03-29 12:00

门头沟学院 golang

字节财经实习一面（40分钟）

1、自我介绍2、解释项目中预扣减，场景题：如果redis预扣减后的假成功，如何解决？没想过这种情况，说了消息队列的异步下单失败回滚，数据库层幂等建唯一id查订单是否存在。3、场景题：怎么做用户支付不多扣？在自我介绍的时候解释了项目的防重和状态机，又说了一遍redis预扣，lua原子操作，卡夫卡异步下单，数据库幂等表，不知道怎么答。4、对账怎么实现？没做过这部分，说了思路，应该不对。5、go的slice，array区别6、go的map是否并发安全7、redis的持久化操作8、如果AOF写的日志太多，怎么办？9、数据库索引种类，又解释了一下10、算法：lru11、反问：没问。#牛客AI配图神器#

查看10道真题和解析

点赞评论收藏

分享

04-11 09:39

门头沟学院 Java

常问的问题:1.理解的 AI Agent 是什么？和大模型对话、RAG 应用有什么本质区别？2.请解释一下 ReAct 框架的核心逻辑3.你用过哪些 Agent 框架（如 LangChain, LlamaIndex, CrewAI）？为什么选择它？然后其它的就是针对具体岗位要求问一些问题

Agent面试会问什么？

点赞评论收藏

分享

04-10 19:33

大连理工大学 Java

字节剪映 ai应用开发

攒人品！！！ 大家都要拿到暑期实习的offer啊！！！项目一：1. 你这里的意图判断是怎么做的？直接交给模型做，还是这个用户的查询query做了一些其他处理。2. 为什么要设计这三层记忆架构，是一个通用的设计还是参考了什么论文。3. Agent 的评估是怎么做的4. 有没有评估过你的记忆架构，在没参考openclaw之前和之后的指标有什么变化，成功率有对比吗？5. 你之前向量检索加redis缓存是怎么做的？ redis健和值是什么？6. 新的记忆加到文件里 是直接append吗？ 覆盖？还是改写？7. 改的方式 模型改吗？模型调用editor去改文件是吗？8. 你觉得 redis+milvus向量存储 和mysql+文件系统+向量检索，他们的优劣如何？优点缺点分别是什么。9. 其实我比较感兴趣的是他们这两种方式的查询检索召回 效率的对比。10. 对于每一个用户，在系统中怎么保存这些不同用户的文档？11. 其实就是模型通过路径去读这些文件是吧，那如果两个人登了同一个账号，在同一时刻，这个文件会被两个不同的用户使用，在这个情况下，你们的系统如何处理？怎么解决这个问题？项目二：1. 你说你的文档准确率达到90%，具体做的改变是什么。2. 那为什么医院的问答项目里，不采用同样的实现3. 你说pdf表格密集，那假如用户就是问一个表格里，第二行是2025年，第三行是2024年，具体问2025年的值是多少，你的系统能做到吗？4. skill是自己写的吗 ，互相之间可以联动吗？5. 为什么不用skill-creator6. 你的数据集是怎么收集的，然后是怎么评估的呢？打分是谁在打分？人在打分 ，还是模型裁判员去打分？如果有很好用的模型裁判员，为什么不用裁判员模型7. 介绍一下KV cache8. 讲一下transfromer架构。算法题1. 字符串数字相减2. 字符串最长连续序列

查看21道真题和解析

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 我的求职进度条 #

988160次浏览 6552人参与

# 实习教会我的事 #

73616次浏览 507人参与

# 厦门银行科技岗值不值得投 #

19035次浏览 422人参与

# 哪些公司一直卡在简历筛选 #

106390次浏览 363人参与

# 我想象的实习vs现实的实习 #

332947次浏览 2298人参与

# Agent面试会问什么？ #

39840次浏览 1447人参与

# 米哈游笔试 #

656165次浏览 1160人参与

# 总结:哪家公司最喜欢泡池子 #

168088次浏览 572人参与

# 一人分享一个skill #

10370次浏览 244人参与

# 拿到offer之后，可以做些什么 #

105052次浏览 511人参与

# 一人一道大厂面试题 #

127048次浏览 1310人参与

# 春招至今，你收到几个面试了？ #

107213次浏览 1306人参与

# 说说你知道的学历厂 #

402129次浏览 1434人参与

# 上班以后，你还有哪些坚持的爱好？ #

30310次浏览 303人参与

# 今年你最想重开的一场面试是？ #

103856次浏览 357人参与

# 米哈游工作体验 #

29972次浏览 145人参与

# 我是XXX，请攻击我最薄弱的地方 #

73590次浏览 500人参与

# 通信/硬件的薪资开多少，才值得去？ #

76868次浏览 408人参与

# 实习越久越好，还是多多益善？ #

95088次浏览 361人参与

# 今年春招是金一银二嘛？ #

99762次浏览 560人参与

# 简历无回复，你会继续海投还是优化再投？ #

148308次浏览 893人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务