丿南烟丶 level
获赞
362
粉丝
119
关注
83
看过 TA
3771
东南大学
2027
C++
IP属地:江苏
赚够钱就跑
私信
关注
05-04 08:26
东南大学 C++
一、基本情况 / 求职意向1.你先简单做一下自我介绍。2.你现在这段实习,最早什么时候可以到岗?预计能实习多久?3.你之前在北京实习,现在这个岗位在上海,你对 base 地点是怎么规划的?4.你之前实习是研发岗位,现在投递的是质量工程 / 测试开发岗位,这个方向转变你是怎么考虑的?5.你对质量工程、测试开发岗位的理解是什么?6.你长期职业规划是怎样的?未来更偏研发、质量效能,还是 AI 工程方向?7.你怎么看未来研发岗、测试开发岗、客户端岗、后端岗和 AI 的关系?二、字节实习项目:端智能特征平台8.你在字节实习期间主要做了什么事情?9.你们端智能团队的端上特征平台主要解决什么问题?10.端上原始事件是如何被处理成复杂特征并供业务方使用的?11.你在这个项目里主要负责哪些部分?12.你做的 C++ 性能优化、缓存优化、SQL 优化分别是什么?13.你在实习中做过哪些自动化测试相关工作?三、自动化测试 / MCP / Agent 生成用例14.你做的自动化测试主要包含哪些内容?15.你们的自动化测试是完全自动化,还是需要人工触发?16.这个自动化测试主要是针对客户端接口,还是服务端接口?17.这些测试用例是在端上跑的吗?运行环境是什么?18.你做的 MCP 在自动化测试流程中起什么作用?19.这个 Agent 生成测试用例时,依赖哪些信息?20.MCP 更像知识库,还是工具调用?21.用户需要输入什么,Agent 才能生成测试用例?22.为什么你们选择基于新增接口增量生成测试用例,而不是全量生成?23.Agent 如何根据新增接口生成对应的测试用例?24.如果新增接口存在上下游调用链路或依赖关系,Agent 怎么识别和处理?25.如果一个接口必须依赖前置接口返回值才能调用,你会如何设计 Agent / Skill 支持这种测试用例生成?26.接口之间的依赖关系应该放在哪一层?是在工具返回结果、JSON 结构、接口文档,还是系统提示词里?27.如果 A 接口依赖已有的 B、C 接口,这种依赖信息应该在研发测试流程的哪个阶段补充?28.你怎么让 Agent 显式知道“某个参数来自哪个前置接口的哪个字段”?29.如果只依赖模型自己理解调用链,会有什么问题?如何降低对模型能力的依赖?四、自动化测试通知 / 飞书机器人 / 端侧测试环境30.你开发的自动化测试提醒飞书机器人具体做了什么?31.飞书机器人是如何检测版本更新、触发测试并通知结果的?32.这个流程为什么在接入抖音流水线时会遇到困难?33.你们这里说的“端”具体是安卓、iOS、鸿蒙这些客户端吗?34.自动化测试用例是集成在宿主 App 里运行的吗?35.端上自动化测试是通过 API 调用完成,还是会模拟用户点击、按钮操作等真实事件?36.压力测试和接口测试在你们自动化测试体系里分别是什么?37.你当时主要补的是接口测试用例,还是压力测试用例?五、AI 参与开发 / 自动化闭环38.在你整个开发和自动化用例生成过程中,AI 参与度大概有多高?39.AI 主要参与了哪些部分?比如方案设计、代码生成、测试用例生成、调试排查等。40.代码开发中 AI 生成占比大概多少?人工主要负责什么?41.测试用例生成后,如何判断它是否正确?42.如果 AI 生成的测试用例跑不通,你如何判断是用例问题,还是被测接口本身有问题?43.如果要实现“全程无人参与”的 AI 自动化测试闭环,还需要哪些能力?44.现在人工在自动化测试流程中主要参与哪些环节?45.如何让 AI 自动识别新增接口并判断是否需要补测试用例?46.如何让 AI 在本地或模拟环境中自动运行生成的测试用例?47.如何让 AI 消费测试结果,而不是人工消费测试结果?48.测试结果如果要交给 AI 分析,需要具备哪些前提条件?49.测试结果应该如何结构化,才能让 AI 定位失败原因?50.AI 能否根据失败日志定位到对应测试用例、接口、代码位置和调用链路?51.如果进一步让 AI 自动修复问题,你觉得风险和边界在哪里?52.从开发、测试、修复到上线都由 AI 系统参与,这个方向你怎么看?六、模型选择 / 模型能力53.你实习期间主要使用过哪些模型?54.当时用过 Google Gemini、豆包、Kimi 等模型?效果怎么样?55.在自动化测试用例生成场景中,模型能力强弱会影响哪些环节?56.如果模型能力不足,应该通过工具、结构化信息、提示词还是流程约束来补足?七、AI 投资分析系统 / Multi-Agent 项目57.你的 AI 投资分析系统是自己做的项目吗?58.这个系统主要是去公网检索新闻信息并做分析吗?59.这个系统整体架构是什么?60.主控 Agent、数据 Agent、新闻 Agent、知识库 Agent、总分析 Agent 分别负责什么?61.新闻 Agent 是否可以理解为类似“联网搜索 / 爬虫”工具型 Agent?62.这个项目现在效果怎么样?63.你是否做了系统化评测,比如人工测试集、自动评测集、准确率统计?64.从用户角度看,它给出的投资建议准确率大概有值吗?65.你做这个系统的目的,是练手还是自己真实有投资分析需求?66.你有没有按它的分析结果进行真实买入卖出?67.如果后续要提升它的推荐或判断准确度,你会从哪些方面优化?68.是否需要构建历史数据评测集或回测体系来验证它的有效性?69.是否需要引入更专业的量化模型、金融模型或更强的大模型?70.如何让系统既给出有参考价值的建议,又避免过度绝对化、误导用户?八、项目实现 / 技术栈71.你的 AI 投资分析系统是怎么开发的?73.Agent 编排是基于 LangChain 吗?74.News Agent 具体是怎么调用联网搜索并返回结果的?75.你主要熟悉 C++,为什么这个项目用了 Python?76.你怎么看不同开发语言之间的壁垒?九、算法题:用给定数字组成小于目标值的最大数77.给定一个目标数字,比如 249,以及可用数字集合,比如 1、2、3,如何组成一个小于目标值的最大数?78.你讲一下这道题的思路。
0 点赞 评论 收藏
分享
05-04 08:24
东南大学 C++
一、基本情况与项目背景1.请做一个简单自我介绍。2.你简历里的两段 AI 项目和字节实习经历,整体技术背景是什么?二、计算机基础3.顺序存储和链式存储有什么区别?在随机访问、遍历、插入删除上的效率分别如何?4.HTTPS 的加密原理是什么?对称加密和非对称加密有什么区别?为什么 HTTPS 要结合两者使用?5.高并发场景下,数据库性能可以从哪些方向优化?比如索引、分库分表、缓存分别适合解决什么问题?6.Redis 缓存穿透、缓存击穿分别是什么?一般怎么解决?三、RAG 与检索系统7.RAG 的完整流程是什么?从文档处理、分块、向量化、索引、检索、重排到生成答案,每一步分别做什么?8.混合检索一般包含哪些方式?向量检索和关键词检索分别适合什么场景?9.向量检索在哪些情况下表现不好?比如专业名词、日期、编号、精确字段为什么更适合关键词检索?10.如果 RAG 检索质量比较低,可能是什么原因?你会从 Query 改写、Embedding 模型、Top-k 召回、重排、关键词匹配等方面怎么优化?四、大模型生成参数与输出控制11.如果希望大模型输出更稳定、更确定,可以调整哪些参数?Temperature、Top-k、Top-p 分别有什么作用?12.除了调参数,提示词层面如何提高输出的准确性、确定性和可追溯性?五、LangChain / LangGraph 技术选型13.你的项目为什么选择 LangChain?14.LangChain 和 LangGraph 的区别是什么?什么场景下 LangGraph 更适合?六、Multi-Agent 架构设计15.你的多 Agent 系统是怎么设计的?主控 Agent、子 Agent、分析 Agent 分别负责什么?16.多 Agent 之间是如何协作的?任务编排、工具调用、状态管理和结果汇总是怎么做的?17.相比单 Agent,多 Agent 在上下文隔离、职责拆分、问题排查方面有什么优势?又会带来哪些复杂度?七、金融 Agent 的幻觉控制与冲突处理18.金融场景对准确性要求高,你做了哪些减少幻觉的设计?比如降低 Temperature、引用来源、无依据不输出等。19.如果实时新闻和知识库结论冲突,你会如何处理?如何根据用户意图判断该更信实时数据还是长期经验?20.系统里有行情数据、新闻数据、知识库数据等异构数据,你是如何分别处理的?如果要统一检索,会如何设计 metadata、过滤和重排策略?八、AI 交互系统与上下文管理21.你项目里的滑动窗口 / 类滑动窗口上下文管理是怎么做的?超过 token 限制时如何丢弃或保留历史?22.如果不想直接丢弃历史对话,如何通过摘要机制、长期记忆、短期记忆来优化上下文管理?23.子进程调用 AI 接口、主进程通过 JSON 通信这一套机制是怎么设计的?为什么不让主进程直接调用?24.如果子进程调用 AI 接口超时、崩溃或失败,主进程如何感知、重试、记录日志和停止重试?九、Agent 评估体系与后续优化25.你的 Agent 系统现在是怎么评估效果的?如果要做完整评估体系,会从人工评测、测试集、系统指标、RAG 指标、用户反馈哪些方面建设?26.如何评估工具调用成功率、接口超时率、运行成功率、检索召回率和回答质量?27.你的 Agent 后续有哪些优化方向?比如长短期记忆、用户画像、反馈闭环、动态调整子 Agent 权重等。28.为什么 Agent 的“自动自进化”比较难,仍然需要人工干预和质量评估?
查看28道真题和解析
0 点赞 评论 收藏
分享
05-04 08:23
东南大学 C++
一、基本情况与项目背景1.请做一个简单自我介绍。2.详细介绍一下你在字节做的端智能 SDK / 特征平台项目。3.端上的原始数据流主要包含哪些内容?4.这些数据是在端上落库,还是会上报云端?两条链路分别做什么?5.业务方如何注册、消费自定义特征?二、设备特征缓存优化6.设备特征缓存优化的背景是什么?原来性能瓶颈在哪里?7.为什么设备特征可以牺牲一部分时效性来换性能?8.为什么从统一 TTL 改成 2 秒 / 10 秒 / 90 秒分层 TTL?9.不同 TTL 档位分别适合哪些设备特征?10.你们是如何通过打点、实验和 A/B 验证优化效果的?三、C++ 智能指针11.你对 C++ 智能指针的理解是什么?12.unique_ptr、shared_ptr、weak_ptr 分别适合什么场景?13.shared_ptr 的引用计数机制是什么?14.weak_ptr 如何解决 shared_ptr 的循环引用问题?四、特征 SQL 复用优化15.端上 SDK 为什么会涉及 SQL 复用优化?16.端上本地数据库里存的是什么,业务方为什么会查它?17.特征 SQL 查询的性能瓶颈是什么?18.为什么这些 SQL 可以模板化、签名化和合并?19.为什么第一版 UNION ALL 优化效果不理想?20.后续“提取时间戳 + 最小时间戳查询 + 应用层分发”的方案是怎么做的?21.SQL 优化最终在单模块和全链路上分别带来了多少收益?五、直播端智能 / ABR 开放题22.你了解 ABR 吗?23.如果要判断用户是“画质敏感型”还是“流畅度敏感型”,你会在端上采集哪些特征?24.你会如何结合设备信息、网络状态、历史行为来设计直播画质 / 流畅度策略?25.端智能场景里,你是否接触过模型推理链路?六、AI 投资分析系统 / Multi-Agent26.介绍一下你的多 Agent 投资分析系统。27.主控 Agent、数据 Agent、新闻 Agent、知识库 Agent、分析 Agent 分别负责什么?28.多 Agent 之间的数据和上下文是怎么流转的?29.相比单 Agent,多 Agent 架构在上下文管理、幻觉控制和问题排查上有什么优势?30.多 Agent 架构会带来哪些复杂度和维护成本?31.真实金融行情数据是如何通过 API 接入系统的?七、Skill / 智能日志分析开放题32.你有没有自己写过 skill?平时如何使用 skill?33.如果要做一个直播播放日志智能分析工具,你会设计成 Agent 还是 Skill?为什么?34.如果有历史文档和代码库说明日志含义,你会如何构建知识库或 RAG?35.用户反馈某个视频播放卡顿时,如何定位、筛选并分析对应播放日志?36.日志分析系统里,工具调用、RAG、意图识别、日志筛选、错误码解释分别怎么设计?37.你会选择 ReAct、Plan-and-Execute,还是其他框架来实现这个日志分析系统?八、计算机网络 / 拥塞控制38.你了解拥塞控制吗?它主要解决什么问题?39.拥塞窗口是如何变化的?40.慢启动、拥塞避免、丢包后的窗口调整分别是怎么回事?九、C++ 基础 / 多态41.说一下 C++ 的多态特性。42.静态多态和动态多态分别是什么?43.动态多态如何通过继承、虚函数、虚函数表实现?十、Git 基础44.你实习开发中常用哪些 Git 指令?45.你平时如何创建分支、提交代码、推送代码、拉取更新?46.遇到 Git 冲突一般怎么处理?十一、算法题:两个有序数组中位数47.用 C++ 实现两个有序数组取中位数。48.先讲一下你的解题思路。49.暴力合并排序方案有什么可以优化的地方?50.既然两个数组本身有序,能否用双指针合并,避免再次 sort?51.有没有更高阶的二分解法?十二、实习时间与岗位匹配52.你本科期间是怎么安排时间去北京字节实习的?53.如果来小红书实习,最早什么时候可以到岗?54.你更倾向上海还是北京 base?55.你对“产品工程师”这个岗位定位的理解是什么?56.你对直播 SDK / 播放器 SDK / 端智能策略方向是否感兴趣?
0 点赞 评论 收藏
分享
05-04 08:22
东南大学 C++
一、基本情况 / 技术栈1.你先做个自我介绍。2.你的技术栈是什么?平时主要做哪些事情?3.你主要用 C++,那你是怎么做客户端开发的?4.你在客户端 SDK 里,C++、Android、iOS 分别负责什么部分?二、字节实习项目 / 端上特征平台5.你能详细介绍一下你做的项目吗?6.你觉得哪个项目最有价值?能重点介绍一下吗?7.你在字节实习里主要做了哪些产出?8.你们这个端上特征平台主要做什么事情?9.业务方是怎么使用这些端上特征的?10.你在这个项目里主要负责哪些部分?三、设备特征缓存优化11.设备特征缓存这块优化的背景是什么?12.原来端上设备特征调用为什么会有性能问题?13.为什么可以牺牲一部分时效性来换性能?14.业务方为什么能接受设备特征不是实时最新值?15.设备特征为什么要按 2 秒、10 秒、90 秒这类 TTL 分层?16.你们是怎么通过实验和埋点确定这些缓存分层的?17.哪些设备特征适合放在低频缓存里?哪些适合放在高频缓存里?四、特征 SQL 查询优化18.特征 SQL 查询优化的背景是什么?19.业务方调用特征 SQL 时,原来的性能瓶颈在哪里?20.为什么这些 SQL 可以进行合并优化?21.这些 SQL 为什么只有时间戳不同,其他结构比较相似?22.你们第一步用 UNION ALL 合并 SQL,为什么优化效果不理想?23.后面为什么要把时间戳提取出来,把 SQL 结构模板化?24.最小时间戳 / 覆盖范围最广的查询是什么意思?25.查询结果为什么可以放到应用层再分发?26.你们最后加的 SQL 查询结果缓存是怎么设计的?27.这个优化最终在单模块和整体链路上的收益分别是多少?五、实验 / A/B 验证28.你刚刚说通过实验验证,是已经进入实验系统了吗?29.你们通过实验主要比较什么指标?30.你们是怎么判断优化是否有效的?六、客户端岗位匹配31.你以后做 Android 和 iOS 客户端开发,有没有问题?32.你对 Android Java 和 iOS Objective-C 这两个方向清楚吗?33.如果岗位会涉及 Android 和 iOS 两端,你能接受吗?七、算法题 / 二叉树算法题:寻找两个节点的最深公共父节点34.二叉树会不会?35.这道二叉树题,你的整体思路是什么?36.你构建测试树的方式是什么?37.你现在构建的树是否依赖输入顺序?38.你的解法是否要求这棵树是有序二叉树 / 二叉搜索树?39.如果节点输入顺序打乱,你的算法还能正确吗?40.你是轮询整棵树,还是利用二叉搜索树性质降低复杂度?41.为什么有序二叉树可以降低查找复杂度?42.你之前刷到过这道题吗?43.你之前是怎么做这道题的?有没有看过其他更优解法?八、AI 编程工具使用44.现在 AI 编程工具很火,你用得怎么样?45.你在自己的 Agent 项目里,是怎么使用 AI 编程工具的?46.你常用哪些 AI 编程工具?47.Codex、Claude、MiniMax、GLM 这些工具或模型你用过吗?体验怎么样?
金三银四,你的春招进行到...
0 点赞 评论 收藏
分享
05-04 08:21
东南大学 C++
一、基本情况 / 实习经历1.你简单介绍一下你的情况。2.你这些项目经历是你自己做的吗?3.字节这段实习是怎么拿到的?是投递实习岗进去的吗?4.你在字节端智能团队里,平时主要是做 C++ 开发吗?5.你之前自己做 demo 的时候,主要也是用 Python 吗?6.你这期间没有系统用过 Java?7.你们软件工程专业的数据结构、Java 这些基础课程都会上吧?8.你们课程里的毕业设计 / 大作业,一般是什么形式?二、字节实习 / AI 使用方式9.你在字节实习实际工作里有涉及到 AI 吗?10.你能举几个例子吗?在字节实习期间,哪些环节会用到 AI?11.字节内部当时提供了哪些 AI 基础设施或工具?12.你在项目开发里,具体是怎么用 AI 来辅助方案设计、代码编写、测试用例生成和文档处理的?三、AI 投资分析系统 / Agent 项目13.你现在这个 Agent 项目是一个 demo,对吧?14.你这个项目现在大概做到什么程度了?是一个什么形态的产品?15.你的 Agent 是用 LangChain 开发的吗?16.你这里说的 Agent,每一个都是一个 workflow 吗?还是说有 ReAct Agent?17.你的 news agent 是怎么做联网检索的?18.拆分搜索关键词这一步,是调大模型拆分的,还是你自己用程序做分词?19.联网搜索这个工具是怎么接进系统里的?是程序去调搜索接口吗?20.你的 news agent 是一个 ReAct agent 吗?21.这个工具调用是在调大模型之前发生,还是在调大模型之后发生?22.前面的分词和工具调用,是主控 Agent 做的吗?23.查回来的联网结果,是再交给子 Agent 去分析吗?24.所以你的子 Agent,本质上更像是一段提示词驱动的分析模块,是吗?25.你的这个新闻子 Agent,它的提示词大概有多长?26.你试过哪些模型?不同模型的效果差异大吗?四、实习收获 / AI 方向学习27.在字节这三四个月里,你觉得自己最大的收获主要是什么?28.最近 AI 变化很快,你最近主要在研究哪些东西?29.最近在工具、框架、理念或者前沿动态上,有什么新的收获或见解吗?30.你提到看 Claude Code 相关内容,那你是怎么理解它的整体框架设计的?31.你看这种大代码仓的时候,TypeScript 代码你能读得懂吗?32.面对这么大的代码量,你怎么借助工具把整个代码结构理顺?33.你具体是怎么按目录 / 模块去拆解和理解一个大型代码库的?五、云端 Agent Platform 设计34.你 GitHub 上那个 go agent platform,是你自己开发的吗?35.你想做的这个云端 Agent 平台,整体思路是什么?36.云端 skill 可以运行 Python 脚本吗?37.这个云端 Agent 平台里,每个用户会有独立运行环境吗?38.skill 是怎么访问云端运行环境的?39.如果资源有限,只做 MVP,你会怎么设计运行环境和扩展方式?六、求职方向 / 职业选择40.字节实习结束之后,你接下来找工作还会考虑原团队吗?41.你不继续考虑字节原团队,主要原因是什么?42.你更希望去什么样的团队或方向?七、设备特征缓存优化 / 技术深挖43.你简历里提到了解决设备特征采集耗时和功耗的问题,设计了缓存架构,能具体讲一下吗?44.这块缓存优化,是你自己主导开发的,还是主要靠 AI 辅助生成的?45.你们为什么会想到通过牺牲一部分时效性来换性能?46.这个方案里,你和 mentor / 同事 / AI 各自发挥了什么作用?47.你们是怎么做灰度测试和方案验证的?八、Python / AI Coding / 代码质量判断48.你大概是从什么时候开始大规模使用 Python 的?49.当 AI 帮你写了大量代码之后,你怎么判断这些代码写得对不对、好不好?50.你一般会从哪些角度去判断 AI 生成代码的质量?51.你在这些项目里,自己手工写的代码大概占多少?52.你在字节这段实习里,真正写得最多的语言是哪一种?九、继续深造 / 就业选择53.你后面打算读研吗?
0 点赞 评论 收藏
分享
04-30 08:04
东南大学 C++
一、基本情况 / 项目概述1.你先做个自我介绍。2.你最近的一份项目,能不能从整体框架、实现方式、你承担的角色这几个方面讲一下?________________________________________二、字节实习:端上特征平台 / 数据处理链路3.你们这个特征平台,本质上是在做哪些事情?4.你们是只做数据处理和平台化支撑,真正的使用方是各个业务侧,对吗?5.端上数据的产生流程是怎么设计的?6.特征是怎么从原始事件中生成出来的?7.不同特征之间是怎么区分的?8.数据产生之后,准确性校验是怎么做的?9.如果你们主要只是做订阅、采集、落库,那这个平台真正的复杂度和难点在哪里?10.你刚才提到的平台能力里,除了基础入库,还有哪些额外的处理或运行能力?________________________________________三、SQL 优化 / 性能问题11.你做的 SQL 优化具体是怎么发现问题的?12.这个问题最初是怎么产生的?13.你的优化方案具体分成了哪几步?14.为什么这些 SQL 可以做模板化和合并处理?15.最终修复效果怎么样?优化指标大概是多少?________________________________________四、自动化测试 / MCP / Agent 能力16.你提到做了自动化测试相关的 Agent 和 MCP,这块整体设计思路是什么?17.这个自动化测试能力具体包含哪些功能?18.你是怎么把 MCP 接进自动化测试流程里的?19.这个自动化测试后面是怎么和业务流程、版本流程结合起来的?20.如果有新增接口或者代码变更,你们后续怎么补自动化测试用例?________________________________________五、AI 投资分析系统 / Multi-Agent 设计21.你做的 AI 投资项目,是一个 Multi-Agent 项目,对吗?22.这个 Multi-Agent 架构整体是怎么设计的?23.主控 Agent 和子 Agent 之间是怎么分工的?24.不同 Agent 之间的数据是怎么流转的?25.任务列表、完成标记、工具调用列表这套机制是怎么设计的?26.你的系统提示词一般是怎么设计出来的?27.你自己先写提示词,和让 AI 帮你结构化整理,这两部分分别怎么配合?________________________________________六、Prompt / 幻觉控制28.写提示词的时候,怎么尽量减少幻觉?29.你觉得减少幻觉最关键的设计点是什么?30.除了提示词约束和标注信息来源,你还有没有别的方法控制幻觉?________________________________________七、字节中的 Agent 实践31.在字节实习期间,除了测试那块,你还做过其他 Agent 相关开发吗?32.你说的测试 Agent,本质上到底用了哪些 Agent 能力?________________________________________八、通用 Agent 设计方法论33.如果现在让你从一个业务场景出发设计一个 Agent,整个流程你会拆成哪些步骤?34.在架构设计阶段,你会先判断哪些关键问题?35.什么时候适合做简单的一问一答式 Agent,什么时候适合做 ReAct / Plan-and-Execute 这种复杂 Agent?36.长短期记忆、工具设计、安全审查,这些部分在 Agent 设计里分别怎么考虑?37.你觉得一个 Agent 的最小可行版本(MVP)应该包含哪些核心部分?________________________________________九、Agent 评估 / 数据集 / 上线38.一个 Agent 做出来之后,你怎么评估它的效果?39.你刚才说需要准备测试数据集,那这个测试集应该怎么设计?40.如果测试集不好准备,那上线前你怎么确认这个 Agent 足够可用?41.除了离线测试,你会怎么做人工测试和灰度验证?________________________________________十、Agent 安全 / Prompt Injection / 越权42.Agent 测试时,除了正常测试,你有没有了解过异常测试场景?43.你对越权调用、Prompt 投毒这类安全问题了解多少?44.如果要做这类安全防御,你会怎么设计技术方案?45.在输入侧做规则引擎和小模型审查,这两种思路你怎么理解?________________________________________十一、C++ 并发 / 异步 / 落库46.你提到过 concurrent hashmap,你能讲讲它的实现原理吗?47.这个结构是怎么保证线程安全的?48.你们当时这个并发 map 真的是无锁实现吗?49.如果是锁 + 条件变量,它具体是怎么工作的?50.你提到异步落库,这个异步队列是怎么设计的?51.你们怎么处理消息延迟、消息丢失、消息堆积这些问题?52.如果队列在内存里堆积,进程或者机器异常退出,消息怎么恢复?53.你们当时对失败重试和上报之外,有没有更完整的恢复设计?________________________________________十二、网络基础 / HTTP54.你大致说一下 HTTP/1.1 和 HTTP/2 的区别。55.在长连接场景下,比如 Agent、模型交互、AI Coding 这些场景里,HTTP/1.1 和 HTTP/2 一般分别适用于什么情况?56.如果要选协议,你会怎么考虑它们各自的适用场景?
0 点赞 评论 收藏
分享
04-30 08:03
东南大学 C++
一、项目与实习经历1. 你先简单介绍一下你自己的情况。2. 你自己是确定不考研,还是打算本科就业?3. 你本科的专业排名大概是什么情况?4. 你之前是在北京实习吗?字节那边有没有转正机会?为什么没有继续优先投原来的部门?5. 你在字节实习大概四个月,自己的工作是怎么开展起来的?6. 这个过程中遇到过什么挑战吗?7. mentor 在实习期间对你有什么反馈?他对你日常工作的评价是什么?8. 在这过程中有没有遇到一些协同上的意见不一致?有冲突的时候你怎么解决?9. 你们团队有多少实习生?10. 你平时有一些什么样的技术交流?你觉得自己成长最大的地方是什么?11. 你那时候的工作节奏是什么样的?二、AI 项目与工具使用12. 除了实习之外,你自己在 AI 上面有什么研究?13. 有什么是真正通过 AI 工具沉淀出来的产品?14. 你那个 AI 投资分析系统结果怎么样?你自己用过吗?15. 在这个过程中,你持续优化过哪些地方?攻克了哪些原来不太行的问题?三、个人经历与规划16. 你过往经历当中,有什么是你自己全力以赴、不顾一切去做的事情?17. 你课后一般做什么?怎么安排自己的时间?18. 你人生中遇到过什么比较大的挫折或者挑战吗?你自己怎么看?19. 你未来想做什么?你自己的规划是什么?20. 你现在有在面哪些公司?21. 你自己更倾向哪一类公司?四、钉钉与岗位匹配22. 你对钉钉有什么了解?23. 你用过钉钉什么样的 AI 能力?24. 为什么投钉钉?
查看24道真题和解析
0 点赞 评论 收藏
分享
04-30 08:02
东南大学 C++
一、基本情况 / 实习经历1.你先做一下自我介绍。2.你大二就去字节实习了吗?3.你能简单介绍一下你在字节实习做的项目吗?________________________________________二、字节实习项目:端上特征平台 / 性能优化4.你们这个端上特征平台里的“特征”具体指什么?5.客户端上的特征和服务端上的特征有什么区别?6.你在实习中做的两块优化,具体分别是什么?7.这两块优化分别解决了什么问题?8.你觉得这里面的难点主要在发现问题,还是在方案设计和落地?9.设备特征缓存为什么可以做分层?10.你们是怎么确定 2 秒、10 秒、90 秒这类分层缓存策略的?11.业务方怎么感知或使用这套缓存频率配置?12.这些设备特征的规模是固定的吗?13.你做的特征 SQL 优化具体是怎么做的?14.这里的时间戳在 SQL 里具体是什么条件?15.为什么这些 SQL 可以合并处理?16.你们为什么要在端上做特征处理,而不是全部上报到云端处理?17.端上做特征处理,最终是给哪些场景使用的?18.你这个特征平台和抖音、头条这些业务之间的关系是什么?19.业务方如果需要自定义特征,是怎么接入你们平台的?________________________________________三、AI 投资分析系统 / 多 Agent 设计20.你能介绍一下你做的 AI 投资分析系统吗?21.这个系统从用户输入到输出投资建议,大概是什么流程?22.你为什么要把系统拆成多个 Agent,而不是单 Agent?23.你这样拆成多个子 Agent,会不会导致信息割裂,反而影响最终分析效果?24.你觉得你现在这个多 Agent 方案主要问题在哪里?25.如果让你继续优化这个投资分析系统,你会怎么改它的 pipeline?26.你会怎么降低这个系统里的幻觉和噪声问题?27.你觉得投资分析系统里的“证据链完整性”应该怎么保证?28.除了证据链,你觉得最终“投资建议生成”这一层应该怎么设计规则或决策机制?29.你理解的“闭环”是什么?30.如果要让这个投资分析系统真正形成闭环,你觉得还缺哪些能力?31.用户反馈信号应该怎么作用到你的系统里?32.长期记忆、短期记忆和用户画像在这个系统里应该怎么设计?33.你觉得用户反馈信号应该怎么转成 reward 或权重更新?34.你提到意图识别和 plan,那你怎么保证这条链路本身的一致性?________________________________________四、高并发 AI 聊天系统35.你做的高并发 AI 聊天系统,里面“高并发”和“AI 聊天”结合起来,有什么特别值得讲的地方?36.你为什么会做这个项目?
0 点赞 评论 收藏
分享
04-30 08:02
东南大学 C++
一、基本情况 / 经历1.你先简单做一下自我介绍。2.你在字节是在北京实习吗?3.你后来为什么没有继续在字节那边实习?4.你有 Java 相关的开发经验吗?5.你对 RPC 了解吗?6.你对 Kafka、MQ 这类消息队列中间件了解吗?________________________________________二、AI 投资分析系统 / 多 Agent 设计7.你之前做的 Agent 项目主要是用 Python 写的吗?8.你这个投资分析系统,是不是用户给一个投资问题,然后系统拆成多个子 Agent 去分析,最后汇总输出?9.你为什么要拆子 Agent?10.如果现在基于支持 skill 的系统重新实现你的 AI 投资分析系统,你觉得能不能用 skill 代替子 Agent?11.你说 skill 不能完全代替子 Agent,你理解的局限性具体是什么?12.如果 skill 的调用过程、输入输出都能清晰观测,而且上下文也能做清洗,那在你的理解里,skill 和子 Agent 还有什么本质区别?13.你觉得多 Agent 在什么情况下容易出错?14.你有没有一些实际经验,能说明多 Agent 什么时候会出问题?________________________________________三、AI Coding 环节相关15.你先看看这个 AI Coding 题目,理解一下。16.在这个词包拆分场景里,如果一个词包里有 10 万级别的词,你觉得 Agent 应该怎么处理?17.这些词包拆分时,你是不是必须覆盖词包里所有词,不能随机丢弃?18.如果广告主提出新的拆分维度,比如按产品型号、季节、颜色,甚至“适合情人节投放”这种抽象维度,你会怎么设计?19.这种动态维度拆分的问题,你觉得应该靠工具层解决,还是靠 Agent 自己推理解决?20.如果系统没有预定义这些维度,Agent 怎么识别和处理一个新的分类标准?________________________________________四、字节实习项目:特征平台 / SDK / 端云协同21.你能讲一个你觉得比较自豪、能体现你个人能力的方案设计吗?22.你做的这个特征 SQL 优化,里面的时间戳具体是 SQL 里的什么条件?23.你这个平台分析的是抖音这类 C 端用户行为吗?24.如果事件量很大,但查询量没那么高,你们有没有评估过事件驱动更新缓存会不会反而带来更大的压力?25.你实习里做的 SDK、特征平台、特征处理这些东西,它们之间到底是什么关系?26.头条和抖音用的是同一套 SDK,但关注的特征不一样,这种差异化是怎么实现的?27.这些差异化逻辑是在客户端做过滤,还是在服务端做过滤?28.如果过滤是在客户端做,那之前没上报的数据后面突然想要了,这种历史数据追溯问题怎么解决?29.你们现在的过滤逻辑,最终是在端上做的吗?________________________________________五、实习时间 / 求职安排30.你现在有考研或者读研的计划吗?31.如果还能继续实习的话,你最早什么时候能到岗,能实习到什么时候?
0 点赞 评论 收藏
分享
04-30 08:02
东南大学 C++
一、项目与经历1.你先做一下自我介绍。2.你做的两个小项目分别是什么?3.你之前做的这个高并发 AI 聊天系统,具体是一个什么产品?4.它和 ChatGPT 这类聊天产品相比,有什么不同?5.你当时在设计这个聊天系统时,上下文管理和 prompt 注入时机是怎么设计的?________________________________________二、AI IDE / AI 工具使用经验6.你用过 Claude Code、Codex 这类 AI IDE / AI 编程工具吗?7.你主要是用它们的 CLI、桌面端,还是网页版?8.在用这些 AI IDE 之前,你主要是用什么开发 C++?9.市面上常见的 AI IDE 工具你都用过哪些?10.你觉得这些 AI IDE 对 C++ 的支持怎么样?11.有没有什么让你特别不满意的地方?12.当这些工具帮你生成 C++ 代码后,你会怎么做验证?会直接接受,还是会 review / 测试?________________________________________三、Agent / ReAct / Claude Code / Skill / MCP13.你有调研过这些 AI IDE 背后的 Agent 模式和基础原理吗?14.你怎么理解 ReAct 这种 Agent 模式?15.你有了解过 Claude Code 的源码或整体架构设计吗?16.你觉得 Claude Code 的整体架构是不是基于 ReAct?17.从 Claude Code 这类产品里,你觉得有哪些设计思路是值得你自己的聊天系统借鉴的?18.你有了解过它里面常用的工具吗?比如 grep 这类。19.你自己用过哪些 MCP?20.你对 MCP 协议、安装方式、使用方式有了解吗?21.你觉得 skill 和 MCP 的区别是什么?22.你觉得 skill 算不算一种“渐进式披露”的能力组织方式?23.你在 Trae 或类似工具里,主要是怎么使用这些能力的?________________________________________四、聊天系统能力设计:读 / 写 / 调工具24.如果现在要让你的聊天系统具备“读文件”的能力,你会怎么设计?25.如果文件不在本地,而是在 GitHub 仓库路径下,你会怎么让系统读取它?26.如果系统本身还不具备调浏览器的能力,那你会怎么设计这部分能力?27.如果现在你的聊天系统已经具备了读、写和调 batch 工具的能力,那从系统实现角度,你要做哪些事情,才能真正让它具备这些能力?28.batch / 读 / 写这些能力,你会怎么做工具封装和调用适配?________________________________________五、投资分析系统如何抽成 Skill29.如果要把你的 AI 投资分析系统抽成一个 skill,挂到你的聊天系统里,让用户在聊天中直接调用,你会怎么设计?30.你的投资分析系统里,多 Agent 是核心吗?31.如果要 skill 化,多 Agent 这一层要不要保留?32.你的投资分析系统里不是还有知识库检索吗?如果做成 skill,这部分怎么处理?________________________________________六、回退机制 / 安全性 / 编排失败处理33.你刚才说的“回退机制”具体是什么意思?34.如果 AI 修改文件改到一半报错了,怎么保证用户原来的代码安全?35.你说的回退,是写日志、写操作记录,还是别的什么?36.如果是写操作记录,你会记录什么内容?37.这种回退是按行级别做,还是按块级别做?38.如果是编辑已有文件,而不是新建文件,回退机制怎么保证安全?39.你简历里写的“通过编排回退机制保障服务稳定性”,这里的“编排回退”具体指什么?40.你怎么定义一个工具调用或检索是“失败”的?41.你为什么要对失败结果做标记?42.如果检索结果本身不准确,你有做过效果评估吗?________________________________________七、语言迁移与学习能力43.如果 IDE 产品所需要的编程语言不是你熟悉的语言,你会怎么快速融入?44.你觉得在现在这个阶段,编程语言本身还是最核心的难点吗?45.你怎么看“学语言的术”和“学系统设计的道”这件事?46.你之前用我们那个 AI IDE 做笔试时,整体体验怎么样?47.你觉得在 AI coding 场景下,语言本身重要,还是方案设计更重要?
0 点赞 评论 收藏
分享
04-30 08:01
东南大学 C++
一、基本情况与工作意愿1.你先做个简单的自我介绍。2.你在字节实习时的作息是怎样的?3.早上九点、晚上十点到十一点下班,这种工作强度你能接受吗?________________________________________二、字节实习项目:特征平台 / 缓存 / SQL 优化4.你做的三档 TTL 分层缓存(2 秒 / 10 秒 / 90 秒)是怎么设计出来的?有数据支撑吗?5.如果业务场景变化了,这些缓存时间你怎么动态调整?6.你这里用到的 concurrent hashmap / unordered map,是加锁实现还是无锁实现?7.你提到的 SQL 签名化、UNION ALL 合并查询、事件驱动失效,这整套优化具体是怎么做的?8.你们的缓存是自己实现的,还是用现成组件,比如 Redis / Memcached?9.这里“事件驱动失效”里的事件来源是什么?触发缓存更新的时机是什么?10.你怎么保证这个事件回调一定成功?如果失败了,会不会导致缓存和数据库不一致?11.如果 SQL 的字段顺序不一样,还能不能归为同一类查询?12.你这些优化效果的数据是怎么采集出来的?13.除了缓存优化,你们还做过哪些性能优化?14.如果现在让你重新设计这套缓存框架,你觉得还有哪些可优化空间?________________________________________三、并发 / 网络模型 / 线程池15.在你的项目里,水平触发和边缘触发是怎么选的?各自适合什么场景?16.你动态线程池的扩容和缩容策略是什么?17.你怎么避免线程频繁创建带来的开销?18.如果线程池队列满了,或者任务队列也满了,你怎么处理?19.遇到突发流量时,你最保底想保证什么?________________________________________四、服务端 / Agent / AI 编程工具22.你做过服务端开发吗?你更偏服务端还是客户端?23.你还做过 Agent 项目,是自己写的还是 AI 辅助写的?24.你现在常用哪些 AI 编程工具?体验怎么样?25.你会对 AI 编程产生危机感吗?26.这些 AI 使用能力基本都是你自己学的吗?________________________________________五、学习能力 / 解决问题能力27.你有没有在一两周内快速学习一项新技术的经历?28.你成长过程中,有没有一个印象很深、最后被你自己解决掉的技术难点?29.你平时除了搜索、看视频,还会通过哪些方式学习或定位问题?30.当你面对源码时,你是怎么理解和真正学会它的?________________________________________六、工程素质 / 团队协作 / 技术关注31.你认为一个好的工程师,除了技术能力,还需要具备哪些素质?32.你们之前团队是怎么做技术分享和技术沉淀的?33.你自己分享过什么内容?34.你会经常关注新技术吗?为什么目前更多停留在“表面了解”这一层?35.你觉得“了解到能用”就够了吗?还是应该继续深挖原理?
0 点赞 评论 收藏
分享
04-30 08:01
东南大学 C++
一、项目与实习经历1.你先做个自我介绍。2.你能详细介绍一下你在字节跳动做的项目吗?二、AI Coding 题:配置驱动的 HTTP 路由转发题目:实现一个通过配置文件管理的HTTP接口路由转发功能,需满足:基础功能•支持 YAML/JSON 配置文件定义路由规则(路径、方法、目标服务)•实现 HTTP/HTTPS 请求转发•处理路径通配符(如 /api/*)进阶能力•配置热加载(修改文件不重启服务)•负载均衡(轮询/随机两种策略)•请求超时控制与重试机制生产级要求•大文件传输时内存占用 < 50MB(流式转发)•可读的错误码体系(如 404、502)•输出审计日志(路径、目标 IP、状态码、耗时)交付要求•可运行代码 + 配置示例•通过三个测试场景:热加载、重试、100MB 文件传输10.你先看一下这个题目,然后说一下你的理解,以及你打算怎么处理、整体思路是什么。11.你对这里“负载均衡”这一块是怎么理解的?12.热加载这个功能,你觉得一般应该怎么做?13.你刚才提到定时轮询配置,那这个轮询一般隔多久比较合适?14.你说到实习里也有类似的动态配置更新?对应的机制大概是什么?15.这个接口转发里,你理解的“目标服务”是什么?16.如果目标服务不只是 HTTP,也可能是 RPC,那你觉得这里还需要考虑什么?17.这个生成出来的代码里,配置和接口的匹配方式是什么?18.你希望这个配置文件的更新机制是什么样的?19.如果手动修改配置文件出了问题,比如 JSON 不合法,你觉得系统应该怎么处理?________________________________________三、设备特征缓存优化 / 特征 SQL 优化20.你刚才提到设备特征缓存优化,在你优化之前,这块有缓存机制吗?21.你刚才说每次要调适配器,这里调用适配器主要是为了获取什么?22.是因为这个接口耗时比较长,所以你们才考虑加缓存,是吗?23.如果设备特征对准确性要求不是特别高,那为什么适合做缓存?24.这块缓存机制上线之后,大概优化了多少?25.你刚才提到用了并发相关的开发,比如 concurrent hash map 这些,这块你了解多少?26.如果涉及多线程开发,你大概了解哪些线程相关的工具?________________________________________四、线程 / 系统能力 / 开放题27.如果一台 8G 内存的机器,你觉得大概能创建多少个线程?28.如果不要求你给具体数字,那你觉得估算“最多能创建多少线程”时,需要考虑哪些因素?________________________________________五、SQL 复用优化29.你第二点提到 SQL 复用优化,这一块能简单介绍一下你做的工作吗?30.你这里提到“将时间窗口不同的查询归定为同类请求”,这个怎么理解?31.你们是不是把某个时间范围内的 SQL 放在一起统一去请求?________________________________________六、滑动窗口消息去重(开放题)32.如果你的系统接收外部消息,并且希望在一个滑动时间窗口内对消息做去重,这个功能如果交给你,你会怎么做?33.假设你的服务有多台机器共同消费同一个上游消息源,在这种分布式场景下,滑动窗口内的消息去重你会怎么设计?34.如果你想到加一个共享中间件,那这个共享中间件应该怎么设计?35.这个去重逻辑你具体会怎么实现?
查看28道真题和解析
0 点赞 评论 收藏
分享
04-30 08:00
东南大学 C++
一、自我介绍 / 实习背景 / 项目定位1.请先做一下自我介绍。2.你可以讲一下你的这个 C++ SDK 实习吗?3.你们团队做的这个端智能特征工程,主要是在做什么?4.这里说的“特征”具体是什么特征?5.这些特征是怎么被业务使用,并对业务产生影响的?6.端上去做这个实时计算,算法是怎么部署和运行起来的?7.你了解 Python 怎么在移动端上运行吗?比如依赖、包管理、运行环境这些是怎么处理的?8.这些 Python 算法具体是什么类型的算法?是基于规则的,还是也可以基于模型的?9.这些中间数据最后是怎么真正影响业务的?能在端上完成业务闭环吗?________________________________________二、C++ / 内存管理 / 语言基础10.你觉得 C++ 在内存安全这一块的设计怎么样?11.其他语言一般用什么机制来做内存管理?12.为什么你觉得垃圾回收和 C++ 的智能指针机制不一样?它们的区别和特点是什么?13.C++ 智能指针大概是基于什么原理实现的?14.垃圾回收一般又是基于什么原理或算法实现的?15.堆和栈的区别是什么?16.在 C++ 里,局部变量、数组、STL 容器这些一般分别分配在什么地方?17.函数里的局部变量在栈上是怎么管理的?18.从编译器 / 操作系统视角看,栈在执行时是怎么工作的?________________________________________三、实习项目复盘 / 性能优化 / 缓存与 SQL19.在这个端智能特征项目里,你觉得还有哪些地方可以做得更好?20.你刚才说设备特征缓存还能优化,具体还能优化什么?21.如果出现极端边界情况,比如设备特征数量暴涨,你的缓存管理器会有什么问题?22.你说特征 SQL 查询也有缓存,这个缓存的 key 存的是什么?23.你说这个 SQL 查询缓存是事件驱动加懒更新机制,它现在的问题是什么?24.如果缓存一过期就把所有内容丢掉,这样的设计有什么缺点?25.你觉得这个 SQL 查询缓存还能怎么优化?26.为什么你觉得把更新条目直接加入缓存、再在应用层分发,会比落到数据库再查更好?________________________________________四、AI 投资分析系统 / Agent 设计 / LangChain27.你为什么想做这个 AI 投资分析系统?28.这个项目你是基于什么 Agent 架构做的?29.你这个 Agent 框架是自己写的,还是基于某个 SDK / 框架做的?30.LangChain 是一个什么样的框架?31.ReAct 是什么?它和 LangChain 是什么关系?32.在这个 Agent 框架之上,你自己主要做了哪些工作?33.你提到内容审查,这部分你具体做了什么?34.你做的这些工作,在整个 Agent 系统里更偏哪一部分?比如 memory、状态管理、tool call 之类。35.你新增的工具是怎么让 Agent 感知到并调用的?36.工具注册和工具调用这部分,你具体是怎么设计的?________________________________________五、AI Coding 现场题 / 架构设计 / Go 协程题目:命令行接口压测工具### 背景描述请设计并实现一个命令行高性能压力测试工具,用于对指定 HTTP 接口进行可控并发压测。工具需自主管理资源,确保在高负载下稳定运行并能优雅退出。### 技术要求1. **核心功能**:接收目标 URL 及并发参数,发起请求并输出统计报告。2. **并发控制**:自行设计并发模型;需明确定义压测结束时的请求处理策略(等待/取消)。3. **异常与边界**:必须妥善处理各类异常情况。需明确统计口径(如失败请求是否计入延迟)。4. **技术选型**:语言自选,需说明选型理由及架构设计思路。### 交付物要求1. **可运行的代码**:提供源码及 README,包含清晰的参数说明与运行示例,确保可直接验证。2. **测试用例**:至少包含 3 个自动化测试(利用本地 Mock 服务模拟正常、慢响应、断连等场景),覆盖基础功能与异常边界,并确保全部通过。37.你先看一下这个 AI coding 题。38.你为什么选择用 Go 和原生协程来做这个方案?39.相比协程,如果换成线程或者进程,会怎么样?40.这个方案里的并发控制是怎么做的?41.这里为什么会设计 worker 池?42.你觉得 AI 给出的这个整体设计方案合理吗?43.你怎么去保证 AI 生成的方案在异常情况下也能正确工作?44.你觉得这里需要重点考虑哪些异常情况?45.如果 AI 给出的方案不完善,你一般会怎么补充和修正?
0 点赞 评论 收藏
分享
04-30 07:57
东南大学 C++
一、字节实习 / 端智能特征平台1.你能详细介绍一下你在字节跳动做的这个项目吗?可以从背景、为什么做、有哪些技术难点、怎么解决这几个方面讲一下。2.你们这个项目里的“特征”具体指什么?3.这些特征是怎么被业务使用并产生影响的?4.端上的实时计算是怎么部署和运行起来的?5.你对这个项目里“特征提取”这一块了解吗?6.如果你们能提供很多特征能力,那在做特征工程时,哪些特征更有利于项目、该怎么去选择?7.如果拿到一堆数据可以做很多特征,你会怎么判断哪些特征是前期需要的、哪些是必须的、哪些甚至不应该出现?8.你们其实更偏平台通用能力,而不是直接做业务,对吧?________________________________________二、设备特征缓存优化 / SQL 优化9.你在这个项目里做的性能优化,能具体讲一下吗?10.为什么设备特征调用会产生比较大的耗时?11.你们为什么想到用缓存来优化设备特征?12.设备特征缓存为什么要分三档?13.你们是怎么根据更新频率去划分缓存层级的?14.这个设备特征缓存优化最终带来了什么收益?15.你做的特征 SQL 优化,问题背景是什么?16.为什么会想到把这些 SQL 做合并处理?17.你们最开始用 UNION ALL 合并 SQL 的思路是什么?18.后来进一步把时间戳提取出来、做“一次扫描再应用层分发”的思路是什么?19.这里做了特征缓存,那这个缓存的 key 存的是什么?20.你觉得这套特征 SQL 缓存和更新策略,还有哪些地方可以继续优化?21.如果遇到边界情况,比如特征数量暴涨,现有缓存设计可能会有什么问题?________________________________________三、高并发 AI 聊天系统 / 网络框架22.你这个高并发 AI 聊天系统项目,是在字节实习期间做的吗?23.你做这个项目之前,为什么会想做这样一个东西?背景是什么?24.你这里写了“自主研发网络框架”,你对网络框架这块很熟吗?25.你在做这个网络框架的时候,有没有遇到比较难的问题?是怎么解决的?26.你这里提到 epoll、多路复用,这部分你是怎么理解和落地的?27.你这里提到动态线程池,为什么会想到做动态扩容 / 缩容?28.这个项目最终主要是用什么语言实现的?29.你现在主要熟悉的语言还是 C++ 吗?30.除了 C++,你对 Python、Go 这些语言的使用情况怎么样?________________________________________四、开发习惯 / 问题定位 / 学习方式31.你平时开发过程中,如果有些代码不会写,或者对系统接口不熟,你是怎么把这些东西弄懂的?32.如果你实现某个功能时,发现结果和预期不一致,你一般怎么定位 bug?33.除了打日志之外,你还会怎么定位问题?34.如果实习中给你一个之前没做过的新需求,只有一周时间要落地,你一般会怎么推进?35.在这种时间紧、需求又新的情况下,你会怎么确定优先级和最小可用版本(MVP)?36.如果遇到不熟悉的技术或框架,你一般怎么快速补齐?________________________________________五、AI 投资分析系统 / Agent / LangChain / Skill37.你为什么会想做这个 AI 投资分析系统?38.这个项目现在做到什么程度了?39.你这个项目里的 Agent 架构是什么?40.你这个 Agent 架构是自己写的,还是基于现成框架 / SDK 做的?41.LangChain 是一个什么样的框架?42.ReAct 是什么?43.LangChain 和 ReAct 之间是什么关系?44.在这个 Agent 框架之上,你自己主要做了哪些工作?45.你这里提到内容审查,这部分具体做了什么?46.你做的这些工作,更偏 memory、状态管理,还是 tool call?47.你新增的工具,是怎么让 Agent 感知到并调用的?48.工具注册和工具调用这部分,你是怎么设计的?49.你觉得在这个项目里,skill 为什么不是必须的?50.skill 在你的使用场景里,主要是怎么发挥作用的?________________________________________六、AI 学习路径 / 开源 / 工具使用51.你这些 AI 相关能力,是学校里有课程,还是主要靠自学?52.你从学习计算机到现在,了解过哪些开源项目?53.有没有你比较感兴趣或者研究过的开源项目?54.你自己对开源项目的关注,更多偏底层实现,还是偏应用层?55.你最近提到的 Moon Cloud、OpenCode 这些东西,自己玩过之后感觉怎么样?56.你了解过“悟空”吗?57.你现在用的这些 AI 工具,基本上都是自费的吗?58.你平时怎么选模型和工具,怎么平衡成本和效果?59.你觉得 Codex、Trae、千问这类工具的体验怎么样?60.字节内部当时有没有自己的 AI 工具?你们内部是怎么用的?________________________________________七、客户端方向 / 安卓 iOS / 跨端 / 工具链61.你做的这个 SDK 最终落在什么场景里?是在端上吗?62.你们做安卓集成的时候,有没有遇到一些适配问题,比如 16KB 页大小这种?63.你现在既然面的是客户端方向,那你更偏向做哪个端?有没有认真想过这个问题?64.为什么你会觉得安卓端整体生态比 iOS 更好一些?65.你们这里说的客户端,不只是安卓和 iOS,也可能包括 PC 端,这一点你怎么看?66.你对 Windows 开发和 Mac 端开发有经验吗?67.你平时更多是在哪个端去调试和开发?68.你用得最多的开发工具是什么?69.如果岗位偏安卓多一点,这个你可以接受吗?70.你自己有做过能跑在手机上的安卓 App 吗?
0 点赞 评论 收藏
分享
04-30 07:55
东南大学 C++
一、自我介绍 / 经历亮点 / 岗位理解1.你先简单介绍一下你最近的经历,挑项目或实习里你觉得比较有亮点的讲一下。2.你们端智能这块的特征工程,主要是做什么的?3.你们这个项目本身负责采集吗,还是主要做中间处理?4.整个系统设计上大概是怎么分层的?5.业务方怎么定义和注册他们需要的特征?________________________________________二、设备特征缓存优化7.设备特征缓存优化这个需求,是 mentor 提给你的,还是你自己发现的?8.你当时接到这个任务后,是怎么思考和解决这个问题的?9.这个问题为什么会在高并发场景下耗时,它的根本背景是什么?10.你为什么会想到用缓存来解决?11.设备特征是会变化的,那你们怎么处理这个变化?12.为什么要分成 2 秒、10 秒、90 秒这几档?13.网络状态这种高频变化的特征,为什么是两秒?14.如果某些业务对实时性要求极高,比如 0.5 秒级别,你这套缓存怎么适配?15.如果同一个特征在不同业务、不同页面下要求不一样,你怎么设计整套特征供给和消费体系?16.如果不同业务场景对同一特征的刷新频率要求不同,你真正采集和计算时怎么定间隔?17.只要有人要求最短间隔,是不是整个系统都得按最短间隔跑?18.你觉得这个体系怎么设计,才能满足这种差异化需求?________________________________________三、特征计算触发 / 业务隔离 / 平台治理19.你们怎么限制特征计算不要无限制执行?20.如果一个事件可能触发很多脚本同时运行,你怎么管控?21.如果要限制并发执行任务数,那这些任务怎么选、谁优先?22.如果不同业务都说自己的任务重要,你作为平台怎么治理?23.这个治理过程以前可能靠人 review,那现在这个时代,你觉得还需要人一个个看吗?24.如果想用 AI 去替代人工 review 算法包,你觉得应该怎么做?25.如果让 AI 判断什么是合理、什么是不合理,你觉得提示词 / 规则里应该包含哪些信息?26.哪些特征或脚本应该被重点审查?高频的、复杂的、还是孤立的?为什么?________________________________________四、端上开发经验 / AI 在开发中的使用27.你在项目里面主要做的是 C++,对吧?28.除了 C++ 性能优化,你平时接的小需求是否也会涉及 iOS 和安卓两端?29.你们整个开发过程中会用 AI 吗?30.当时你们主要用哪些 AI 编码工具?31.你平时会用国产模型吗?________________________________________五、编程题:带 TTL 的 LRU Cache(允许 AI 辅助)### 题目要求实现一个线程安全的 **LRU + TTL** 本地缓存,请使用 Java 实现一个本地缓存类。### 代码框架```javapublic class LocalCache<K, V> {public LocalCache(int capacity) { }public void put(K key, V value, long ttlMillis) { }public V get(K key) { }public int size() { }}```### 功能要求缓存有最大容量 `capacity`;每个 key 支持 TTL(过期时间);get 时如果 key 已过期,返回 `null` 并删除;插入新 key 时缓存已满:- 先清理已过期元素;- 若仍满,则淘汰最近最少使用(LRU)的元素;如果 key 已存在,更新 value、过期时间,并刷新其 LRU 状态;需要保证线程安全;说明实现的时间复杂度,并说明如何避免因重复 put 导致过期堆中的旧记录误删新值。32.你先看一下这个题,先不用急着让 AI 出答案,你觉得它给出的方案方向有问题吗?33.它这里为什么要引入 version?34.version 是怎么避免旧数据误删新数据的?35.为什么这里要用小顶堆?36.小顶堆在这个设计里的作用是什么?37.如果堆里一共有 N 个元素,其中 K 个过期了,清理这 K 个元素的时间复杂度是多少?38.如果 K 很大,比如长时间没人请求、结果大量 key 一起过期,这个方案会有什么问题?39.在这种极端情况下,get / put 还能保持接近 O(1) 吗?40.如果你现在重新设计这个方案,你会怎么做?41.如果不用 AI,你最基础的思路是什么?42.纯 hash map + 双向链表 能不能先把 LRU 做出来?43.如果只在 value 里记录过期时间,会有什么局限?44.为什么说一旦加了小顶堆,就会把一致性和复杂度问题带进来?
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务