丿南烟丶 - 个人主页动态 - 牛客网

发布(50) 评论刷题收藏

05-04 08:26

东南大学 C++

26.4.23 字节飞书测开一面

一、基本情况 / 求职意向1.你先简单做一下自我介绍。2.你现在这段实习，最早什么时候可以到岗？预计能实习多久？3.你之前在北京实习，现在这个岗位在上海，你对 base 地点是怎么规划的？4.你之前实习是研发岗位，现在投递的是质量工程 / 测试开发岗位，这个方向转变你是怎么考虑的？5.你对质量工程、测试开发岗位的理解是什么？6.你长期职业规划是怎样的？未来更偏研发、质量效能，还是 AI 工程方向？7.你怎么看未来研发岗、测试开发岗、客户端岗、后端岗和 AI 的关系？二、字节实习项目：端智能特征平台8.你在字节实习期间主要做了什么事情？9.你们端智能团队的端上特征平台主要解决什么问题？10.端上原始事件是如何被处理成复杂特征并供业务方使用的？11.你在这个项目里主要负责哪些部分？12.你做的 C++ 性能优化、缓存优化、SQL 优化分别是什么？13.你在实习中做过哪些自动化测试相关工作？三、自动化测试 / MCP / Agent 生成用例14.你做的自动化测试主要包含哪些内容？15.你们的自动化测试是完全自动化，还是需要人工触发？16.这个自动化测试主要是针对客户端接口，还是服务端接口？17.这些测试用例是在端上跑的吗？运行环境是什么？18.你做的 MCP 在自动化测试流程中起什么作用？19.这个 Agent 生成测试用例时，依赖哪些信息？20.MCP 更像知识库，还是工具调用？21.用户需要输入什么，Agent 才能生成测试用例？22.为什么你们选择基于新增接口增量生成测试用例，而不是全量生成？23.Agent 如何根据新增接口生成对应的测试用例？24.如果新增接口存在上下游调用链路或依赖关系，Agent 怎么识别和处理？25.如果一个接口必须依赖前置接口返回值才能调用，你会如何设计 Agent / Skill 支持这种测试用例生成？26.接口之间的依赖关系应该放在哪一层？是在工具返回结果、JSON 结构、接口文档，还是系统提示词里？27.如果 A 接口依赖已有的 B、C 接口，这种依赖信息应该在研发测试流程的哪个阶段补充？28.你怎么让 Agent 显式知道“某个参数来自哪个前置接口的哪个字段”？29.如果只依赖模型自己理解调用链，会有什么问题？如何降低对模型能力的依赖？四、自动化测试通知 / 飞书机器人 / 端侧测试环境30.你开发的自动化测试提醒飞书机器人具体做了什么？31.飞书机器人是如何检测版本更新、触发测试并通知结果的？32.这个流程为什么在接入抖音流水线时会遇到困难？33.你们这里说的“端”具体是安卓、iOS、鸿蒙这些客户端吗？34.自动化测试用例是集成在宿主 App 里运行的吗？35.端上自动化测试是通过 API 调用完成，还是会模拟用户点击、按钮操作等真实事件？36.压力测试和接口测试在你们自动化测试体系里分别是什么？37.你当时主要补的是接口测试用例，还是压力测试用例？五、AI 参与开发 / 自动化闭环38.在你整个开发和自动化用例生成过程中，AI 参与度大概有多高？39.AI 主要参与了哪些部分？比如方案设计、代码生成、测试用例生成、调试排查等。40.代码开发中 AI 生成占比大概多少？人工主要负责什么？41.测试用例生成后，如何判断它是否正确？42.如果 AI 生成的测试用例跑不通，你如何判断是用例问题，还是被测接口本身有问题？43.如果要实现“全程无人参与”的 AI 自动化测试闭环，还需要哪些能力？44.现在人工在自动化测试流程中主要参与哪些环节？45.如何让 AI 自动识别新增接口并判断是否需要补测试用例？46.如何让 AI 在本地或模拟环境中自动运行生成的测试用例？47.如何让 AI 消费测试结果，而不是人工消费测试结果？48.测试结果如果要交给 AI 分析，需要具备哪些前提条件？49.测试结果应该如何结构化，才能让 AI 定位失败原因？50.AI 能否根据失败日志定位到对应测试用例、接口、代码位置和调用链路？51.如果进一步让 AI 自动修复问题，你觉得风险和边界在哪里？52.从开发、测试、修复到上线都由 AI 系统参与，这个方向你怎么看？六、模型选择 / 模型能力53.你实习期间主要使用过哪些模型？54.当时用过 Google Gemini、豆包、Kimi 等模型？效果怎么样？55.在自动化测试用例生成场景中，模型能力强弱会影响哪些环节？56.如果模型能力不足，应该通过工具、结构化信息、提示词还是流程约束来补足？七、AI 投资分析系统 / Multi-Agent 项目57.你的 AI 投资分析系统是自己做的项目吗？58.这个系统主要是去公网检索新闻信息并做分析吗？59.这个系统整体架构是什么？60.主控 Agent、数据 Agent、新闻 Agent、知识库 Agent、总分析 Agent 分别负责什么？61.新闻 Agent 是否可以理解为类似“联网搜索 / 爬虫”工具型 Agent？62.这个项目现在效果怎么样？63.你是否做了系统化评测，比如人工测试集、自动评测集、准确率统计？64.从用户角度看，它给出的投资建议准确率大概有值吗？65.你做这个系统的目的，是练手还是自己真实有投资分析需求？66.你有没有按它的分析结果进行真实买入卖出？67.如果后续要提升它的推荐或判断准确度，你会从哪些方面优化？68.是否需要构建历史数据评测集或回测体系来验证它的有效性？69.是否需要引入更专业的量化模型、金融模型或更强的大模型？70.如何让系统既给出有参考价值的建议，又避免过度绝对化、误导用户？八、项目实现 / 技术栈71.你的 AI 投资分析系统是怎么开发的？73.Agent 编排是基于 LangChain 吗？74.News Agent 具体是怎么调用联网搜索并返回结果的？75.你主要熟悉 C++，为什么这个项目用了 Python？76.你怎么看不同开发语言之间的壁垒？九、算法题：用给定数字组成小于目标值的最大数77.给定一个目标数字，比如 249，以及可用数字集合，比如 1、2、3，如何组成一个小于目标值的最大数？78.你讲一下这道题的思路。

0 点赞评论收藏

分享

05-04 08:24

东南大学 C++

26.4.23 淘天天猫技术测开一面

一、基本情况与项目背景1.请做一个简单自我介绍。2.你简历里的两段 AI 项目和字节实习经历，整体技术背景是什么？二、计算机基础3.顺序存储和链式存储有什么区别？在随机访问、遍历、插入删除上的效率分别如何？4.HTTPS 的加密原理是什么？对称加密和非对称加密有什么区别？为什么 HTTPS 要结合两者使用？5.高并发场景下，数据库性能可以从哪些方向优化？比如索引、分库分表、缓存分别适合解决什么问题？6.Redis 缓存穿透、缓存击穿分别是什么？一般怎么解决？三、RAG 与检索系统7.RAG 的完整流程是什么？从文档处理、分块、向量化、索引、检索、重排到生成答案，每一步分别做什么？8.混合检索一般包含哪些方式？向量检索和关键词检索分别适合什么场景？9.向量检索在哪些情况下表现不好？比如专业名词、日期、编号、精确字段为什么更适合关键词检索？10.如果 RAG 检索质量比较低，可能是什么原因？你会从 Query 改写、Embedding 模型、Top-k 召回、重排、关键词匹配等方面怎么优化？四、大模型生成参数与输出控制11.如果希望大模型输出更稳定、更确定，可以调整哪些参数？Temperature、Top-k、Top-p 分别有什么作用？12.除了调参数，提示词层面如何提高输出的准确性、确定性和可追溯性？五、LangChain / LangGraph 技术选型13.你的项目为什么选择 LangChain？14.LangChain 和 LangGraph 的区别是什么？什么场景下 LangGraph 更适合？六、Multi-Agent 架构设计15.你的多 Agent 系统是怎么设计的？主控 Agent、子 Agent、分析 Agent 分别负责什么？16.多 Agent 之间是如何协作的？任务编排、工具调用、状态管理和结果汇总是怎么做的？17.相比单 Agent，多 Agent 在上下文隔离、职责拆分、问题排查方面有什么优势？又会带来哪些复杂度？七、金融 Agent 的幻觉控制与冲突处理18.金融场景对准确性要求高，你做了哪些减少幻觉的设计？比如降低 Temperature、引用来源、无依据不输出等。19.如果实时新闻和知识库结论冲突，你会如何处理？如何根据用户意图判断该更信实时数据还是长期经验？20.系统里有行情数据、新闻数据、知识库数据等异构数据，你是如何分别处理的？如果要统一检索，会如何设计 metadata、过滤和重排策略？八、AI 交互系统与上下文管理21.你项目里的滑动窗口 / 类滑动窗口上下文管理是怎么做的？超过 token 限制时如何丢弃或保留历史？22.如果不想直接丢弃历史对话，如何通过摘要机制、长期记忆、短期记忆来优化上下文管理？23.子进程调用 AI 接口、主进程通过 JSON 通信这一套机制是怎么设计的？为什么不让主进程直接调用？24.如果子进程调用 AI 接口超时、崩溃或失败，主进程如何感知、重试、记录日志和停止重试？九、Agent 评估体系与后续优化25.你的 Agent 系统现在是怎么评估效果的？如果要做完整评估体系，会从人工评测、测试集、系统指标、RAG 指标、用户反馈哪些方面建设？26.如何评估工具调用成功率、接口超时率、运行成功率、检索召回率和回答质量？27.你的 Agent 后续有哪些优化方向？比如长短期记忆、用户画像、反馈闭环、动态调整子 Agent 权重等。28.为什么 Agent 的“自动自进化”比较难，仍然需要人工干预和质量评估？

查看28道真题和解析

0 点赞评论收藏

分享

05-04 08:23

东南大学 C++

26.4.22 小红书直播cpp音视频一面

一、基本情况与项目背景1.请做一个简单自我介绍。2.详细介绍一下你在字节做的端智能 SDK / 特征平台项目。3.端上的原始数据流主要包含哪些内容？4.这些数据是在端上落库，还是会上报云端？两条链路分别做什么？5.业务方如何注册、消费自定义特征？二、设备特征缓存优化6.设备特征缓存优化的背景是什么？原来性能瓶颈在哪里？7.为什么设备特征可以牺牲一部分时效性来换性能？8.为什么从统一 TTL 改成 2 秒 / 10 秒 / 90 秒分层 TTL？9.不同 TTL 档位分别适合哪些设备特征？10.你们是如何通过打点、实验和 A/B 验证优化效果的？三、C++ 智能指针11.你对 C++ 智能指针的理解是什么？12.unique_ptr、shared_ptr、weak_ptr 分别适合什么场景？13.shared_ptr 的引用计数机制是什么？14.weak_ptr 如何解决 shared_ptr 的循环引用问题？四、特征 SQL 复用优化15.端上 SDK 为什么会涉及 SQL 复用优化？16.端上本地数据库里存的是什么，业务方为什么会查它？17.特征 SQL 查询的性能瓶颈是什么？18.为什么这些 SQL 可以模板化、签名化和合并？19.为什么第一版 UNION ALL 优化效果不理想？20.后续“提取时间戳 + 最小时间戳查询 + 应用层分发”的方案是怎么做的？21.SQL 优化最终在单模块和全链路上分别带来了多少收益？五、直播端智能 / ABR 开放题22.你了解 ABR 吗？23.如果要判断用户是“画质敏感型”还是“流畅度敏感型”，你会在端上采集哪些特征？24.你会如何结合设备信息、网络状态、历史行为来设计直播画质 / 流畅度策略？25.端智能场景里，你是否接触过模型推理链路？六、AI 投资分析系统 / Multi-Agent26.介绍一下你的多 Agent 投资分析系统。27.主控 Agent、数据 Agent、新闻 Agent、知识库 Agent、分析 Agent 分别负责什么？28.多 Agent 之间的数据和上下文是怎么流转的？29.相比单 Agent，多 Agent 架构在上下文管理、幻觉控制和问题排查上有什么优势？30.多 Agent 架构会带来哪些复杂度和维护成本？31.真实金融行情数据是如何通过 API 接入系统的？七、Skill / 智能日志分析开放题32.你有没有自己写过 skill？平时如何使用 skill？33.如果要做一个直播播放日志智能分析工具，你会设计成 Agent 还是 Skill？为什么？34.如果有历史文档和代码库说明日志含义，你会如何构建知识库或 RAG？35.用户反馈某个视频播放卡顿时，如何定位、筛选并分析对应播放日志？36.日志分析系统里，工具调用、RAG、意图识别、日志筛选、错误码解释分别怎么设计？37.你会选择 ReAct、Plan-and-Execute，还是其他框架来实现这个日志分析系统？八、计算机网络 / 拥塞控制38.你了解拥塞控制吗？它主要解决什么问题？39.拥塞窗口是如何变化的？40.慢启动、拥塞避免、丢包后的窗口调整分别是怎么回事？九、C++ 基础 / 多态41.说一下 C++ 的多态特性。42.静态多态和动态多态分别是什么？43.动态多态如何通过继承、虚函数、虚函数表实现？十、Git 基础44.你实习开发中常用哪些 Git 指令？45.你平时如何创建分支、提交代码、推送代码、拉取更新？46.遇到 Git 冲突一般怎么处理？十一、算法题：两个有序数组中位数47.用 C++ 实现两个有序数组取中位数。48.先讲一下你的解题思路。49.暴力合并排序方案有什么可以优化的地方？50.既然两个数组本身有序，能否用双指针合并，避免再次 sort？51.有没有更高阶的二分解法？十二、实习时间与岗位匹配52.你本科期间是怎么安排时间去北京字节实习的？53.如果来小红书实习，最早什么时候可以到岗？54.你更倾向上海还是北京 base？55.你对“产品工程师”这个岗位定位的理解是什么？56.你对直播 SDK / 播放器 SDK / 端智能策略方向是否感兴趣？

0 点赞评论收藏

分享

05-04 08:22

东南大学 C++

26.4.21 腾讯广告国际客户端二面

一、基本情况 / 技术栈1.你先做个自我介绍。2.你的技术栈是什么？平时主要做哪些事情？3.你主要用 C++，那你是怎么做客户端开发的？4.你在客户端 SDK 里，C++、Android、iOS 分别负责什么部分？二、字节实习项目 / 端上特征平台5.你能详细介绍一下你做的项目吗？6.你觉得哪个项目最有价值？能重点介绍一下吗？7.你在字节实习里主要做了哪些产出？8.你们这个端上特征平台主要做什么事情？9.业务方是怎么使用这些端上特征的？10.你在这个项目里主要负责哪些部分？三、设备特征缓存优化11.设备特征缓存这块优化的背景是什么？12.原来端上设备特征调用为什么会有性能问题？13.为什么可以牺牲一部分时效性来换性能？14.业务方为什么能接受设备特征不是实时最新值？15.设备特征为什么要按 2 秒、10 秒、90 秒这类 TTL 分层？16.你们是怎么通过实验和埋点确定这些缓存分层的？17.哪些设备特征适合放在低频缓存里？哪些适合放在高频缓存里？四、特征 SQL 查询优化18.特征 SQL 查询优化的背景是什么？19.业务方调用特征 SQL 时，原来的性能瓶颈在哪里？20.为什么这些 SQL 可以进行合并优化？21.这些 SQL 为什么只有时间戳不同，其他结构比较相似？22.你们第一步用 UNION ALL 合并 SQL，为什么优化效果不理想？23.后面为什么要把时间戳提取出来，把 SQL 结构模板化？24.最小时间戳 / 覆盖范围最广的查询是什么意思？25.查询结果为什么可以放到应用层再分发？26.你们最后加的 SQL 查询结果缓存是怎么设计的？27.这个优化最终在单模块和整体链路上的收益分别是多少？五、实验 / A/B 验证28.你刚刚说通过实验验证，是已经进入实验系统了吗？29.你们通过实验主要比较什么指标？30.你们是怎么判断优化是否有效的？六、客户端岗位匹配31.你以后做 Android 和 iOS 客户端开发，有没有问题？32.你对 Android Java 和 iOS Objective-C 这两个方向清楚吗？33.如果岗位会涉及 Android 和 iOS 两端，你能接受吗？七、算法题 / 二叉树算法题：寻找两个节点的最深公共父节点34.二叉树会不会？35.这道二叉树题，你的整体思路是什么？36.你构建测试树的方式是什么？37.你现在构建的树是否依赖输入顺序？38.你的解法是否要求这棵树是有序二叉树 / 二叉搜索树？39.如果节点输入顺序打乱，你的算法还能正确吗？40.你是轮询整棵树，还是利用二叉搜索树性质降低复杂度？41.为什么有序二叉树可以降低查找复杂度？42.你之前刷到过这道题吗？43.你之前是怎么做这道题的？有没有看过其他更优解法？八、AI 编程工具使用44.现在 AI 编程工具很火，你用得怎么样？45.你在自己的 Agent 项目里，是怎么使用 AI 编程工具的？46.你常用哪些 AI 编程工具？47.Codex、Claude、MiniMax、GLM 这些工具或模型你用过吗？体验怎么样？

金三银四，你的春招进行到...

0 点赞评论收藏

分享

05-04 08:21

东南大学 C++

26.4.16 阿里淘天广告三面

一、基本情况 / 实习经历1.你简单介绍一下你的情况。2.你这些项目经历是你自己做的吗？3.字节这段实习是怎么拿到的？是投递实习岗进去的吗？4.你在字节端智能团队里，平时主要是做 C++ 开发吗？5.你之前自己做 demo 的时候，主要也是用 Python 吗？6.你这期间没有系统用过 Java？7.你们软件工程专业的数据结构、Java 这些基础课程都会上吧？8.你们课程里的毕业设计 / 大作业，一般是什么形式？二、字节实习 / AI 使用方式9.你在字节实习实际工作里有涉及到 AI 吗？10.你能举几个例子吗？在字节实习期间，哪些环节会用到 AI？11.字节内部当时提供了哪些 AI 基础设施或工具？12.你在项目开发里，具体是怎么用 AI 来辅助方案设计、代码编写、测试用例生成和文档处理的？三、AI 投资分析系统 / Agent 项目13.你现在这个 Agent 项目是一个 demo，对吧？14.你这个项目现在大概做到什么程度了？是一个什么形态的产品？15.你的 Agent 是用 LangChain 开发的吗？16.你这里说的 Agent，每一个都是一个 workflow 吗？还是说有 ReAct Agent？17.你的 news agent 是怎么做联网检索的？18.拆分搜索关键词这一步，是调大模型拆分的，还是你自己用程序做分词？19.联网搜索这个工具是怎么接进系统里的？是程序去调搜索接口吗？20.你的 news agent 是一个 ReAct agent 吗？21.这个工具调用是在调大模型之前发生，还是在调大模型之后发生？22.前面的分词和工具调用，是主控 Agent 做的吗？23.查回来的联网结果，是再交给子 Agent 去分析吗？24.所以你的子 Agent，本质上更像是一段提示词驱动的分析模块，是吗？25.你的这个新闻子 Agent，它的提示词大概有多长？26.你试过哪些模型？不同模型的效果差异大吗？四、实习收获 / AI 方向学习27.在字节这三四个月里，你觉得自己最大的收获主要是什么？28.最近 AI 变化很快，你最近主要在研究哪些东西？29.最近在工具、框架、理念或者前沿动态上，有什么新的收获或见解吗？30.你提到看 Claude Code 相关内容，那你是怎么理解它的整体框架设计的？31.你看这种大代码仓的时候，TypeScript 代码你能读得懂吗？32.面对这么大的代码量，你怎么借助工具把整个代码结构理顺？33.你具体是怎么按目录 / 模块去拆解和理解一个大型代码库的？五、云端 Agent Platform 设计34.你 GitHub 上那个 go agent platform，是你自己开发的吗？35.你想做的这个云端 Agent 平台，整体思路是什么？36.云端 skill 可以运行 Python 脚本吗？37.这个云端 Agent 平台里，每个用户会有独立运行环境吗？38.skill 是怎么访问云端运行环境的？39.如果资源有限，只做 MVP，你会怎么设计运行环境和扩展方式？六、求职方向 / 职业选择40.字节实习结束之后，你接下来找工作还会考虑原团队吗？41.你不继续考虑字节原团队，主要原因是什么？42.你更希望去什么样的团队或方向？七、设备特征缓存优化 / 技术深挖43.你简历里提到了解决设备特征采集耗时和功耗的问题，设计了缓存架构，能具体讲一下吗？44.这块缓存优化，是你自己主导开发的，还是主要靠 AI 辅助生成的？45.你们为什么会想到通过牺牲一部分时效性来换性能？46.这个方案里，你和 mentor / 同事 / AI 各自发挥了什么作用？47.你们是怎么做灰度测试和方案验证的？八、Python / AI Coding / 代码质量判断48.你大概是从什么时候开始大规模使用 Python 的？49.当 AI 帮你写了大量代码之后，你怎么判断这些代码写得对不对、好不好？50.你一般会从哪些角度去判断 AI 生成代码的质量？51.你在这些项目里，自己手工写的代码大概占多少？52.你在字节这段实习里，真正写得最多的语言是哪一种？九、继续深造 / 就业选择53.你后面打算读研吗？

0 点赞评论收藏

分享

04-30 08:04

东南大学 C++

26.4.15 阿里控股安全一面

一、基本情况 / 项目概述1.你先做个自我介绍。2.你最近的一份项目，能不能从整体框架、实现方式、你承担的角色这几个方面讲一下？________________________________________二、字节实习：端上特征平台 / 数据处理链路3.你们这个特征平台，本质上是在做哪些事情？4.你们是只做数据处理和平台化支撑，真正的使用方是各个业务侧，对吗？5.端上数据的产生流程是怎么设计的？6.特征是怎么从原始事件中生成出来的？7.不同特征之间是怎么区分的？8.数据产生之后，准确性校验是怎么做的？9.如果你们主要只是做订阅、采集、落库，那这个平台真正的复杂度和难点在哪里？10.你刚才提到的平台能力里，除了基础入库，还有哪些额外的处理或运行能力？________________________________________三、SQL 优化 / 性能问题11.你做的 SQL 优化具体是怎么发现问题的？12.这个问题最初是怎么产生的？13.你的优化方案具体分成了哪几步？14.为什么这些 SQL 可以做模板化和合并处理？15.最终修复效果怎么样？优化指标大概是多少？________________________________________四、自动化测试 / MCP / Agent 能力16.你提到做了自动化测试相关的 Agent 和 MCP，这块整体设计思路是什么？17.这个自动化测试能力具体包含哪些功能？18.你是怎么把 MCP 接进自动化测试流程里的？19.这个自动化测试后面是怎么和业务流程、版本流程结合起来的？20.如果有新增接口或者代码变更，你们后续怎么补自动化测试用例？________________________________________五、AI 投资分析系统 / Multi-Agent 设计21.你做的 AI 投资项目，是一个 Multi-Agent 项目，对吗？22.这个 Multi-Agent 架构整体是怎么设计的？23.主控 Agent 和子 Agent 之间是怎么分工的？24.不同 Agent 之间的数据是怎么流转的？25.任务列表、完成标记、工具调用列表这套机制是怎么设计的？26.你的系统提示词一般是怎么设计出来的？27.你自己先写提示词，和让 AI 帮你结构化整理，这两部分分别怎么配合？________________________________________六、Prompt / 幻觉控制28.写提示词的时候，怎么尽量减少幻觉？29.你觉得减少幻觉最关键的设计点是什么？30.除了提示词约束和标注信息来源，你还有没有别的方法控制幻觉？________________________________________七、字节中的 Agent 实践31.在字节实习期间，除了测试那块，你还做过其他 Agent 相关开发吗？32.你说的测试 Agent，本质上到底用了哪些 Agent 能力？________________________________________八、通用 Agent 设计方法论33.如果现在让你从一个业务场景出发设计一个 Agent，整个流程你会拆成哪些步骤？34.在架构设计阶段，你会先判断哪些关键问题？35.什么时候适合做简单的一问一答式 Agent，什么时候适合做 ReAct / Plan-and-Execute 这种复杂 Agent？36.长短期记忆、工具设计、安全审查，这些部分在 Agent 设计里分别怎么考虑？37.你觉得一个 Agent 的最小可行版本（MVP）应该包含哪些核心部分？________________________________________九、Agent 评估 / 数据集 / 上线38.一个 Agent 做出来之后，你怎么评估它的效果？39.你刚才说需要准备测试数据集，那这个测试集应该怎么设计？40.如果测试集不好准备，那上线前你怎么确认这个 Agent 足够可用？41.除了离线测试，你会怎么做人工测试和灰度验证？________________________________________十、Agent 安全 / Prompt Injection / 越权42.Agent 测试时，除了正常测试，你有没有了解过异常测试场景？43.你对越权调用、Prompt 投毒这类安全问题了解多少？44.如果要做这类安全防御，你会怎么设计技术方案？45.在输入侧做规则引擎和小模型审查，这两种思路你怎么理解？________________________________________十一、C++ 并发 / 异步 / 落库46.你提到过 concurrent hashmap，你能讲讲它的实现原理吗？47.这个结构是怎么保证线程安全的？48.你们当时这个并发 map 真的是无锁实现吗？49.如果是锁 + 条件变量，它具体是怎么工作的？50.你提到异步落库，这个异步队列是怎么设计的？51.你们怎么处理消息延迟、消息丢失、消息堆积这些问题？52.如果队列在内存里堆积，进程或者机器异常退出，消息怎么恢复？53.你们当时对失败重试和上报之外，有没有更完整的恢复设计？________________________________________十二、网络基础 / HTTP54.你大致说一下 HTTP/1.1 和 HTTP/2 的区别。55.在长连接场景下，比如 Agent、模型交互、AI Coding 这些场景里，HTTP/1.1 和 HTTP/2 一般分别适用于什么情况？56.如果要选协议，你会怎么考虑它们各自的适用场景？

0 点赞评论收藏

分享

04-30 08:03

东南大学 C++

26.4.14 阿里钉钉客户端三面（HR）

一、项目与实习经历1. 你先简单介绍一下你自己的情况。2. 你自己是确定不考研，还是打算本科就业？3. 你本科的专业排名大概是什么情况？4. 你之前是在北京实习吗？字节那边有没有转正机会？为什么没有继续优先投原来的部门？5. 你在字节实习大概四个月，自己的工作是怎么开展起来的？6. 这个过程中遇到过什么挑战吗？7. mentor 在实习期间对你有什么反馈？他对你日常工作的评价是什么？8. 在这过程中有没有遇到一些协同上的意见不一致？有冲突的时候你怎么解决？9. 你们团队有多少实习生？10. 你平时有一些什么样的技术交流？你觉得自己成长最大的地方是什么？11. 你那时候的工作节奏是什么样的？二、AI 项目与工具使用12. 除了实习之外，你自己在 AI 上面有什么研究？13. 有什么是真正通过 AI 工具沉淀出来的产品？14. 你那个 AI 投资分析系统结果怎么样？你自己用过吗？15. 在这个过程中，你持续优化过哪些地方？攻克了哪些原来不太行的问题？三、个人经历与规划16. 你过往经历当中，有什么是你自己全力以赴、不顾一切去做的事情？17. 你课后一般做什么？怎么安排自己的时间？18. 你人生中遇到过什么比较大的挫折或者挑战吗？你自己怎么看？19. 你未来想做什么？你自己的规划是什么？20. 你现在有在面哪些公司？21. 你自己更倾向哪一类公司？四、钉钉与岗位匹配22. 你对钉钉有什么了解？23. 你用过钉钉什么样的 AI 能力？24. 为什么投钉钉？

查看24道真题和解析

0 点赞评论收藏

分享

04-30 08:02

东南大学 C++

26.4.13 阿里淘宝闪购一面

一、基本情况 / 实习经历1.你先做一下自我介绍。2.你大二就去字节实习了吗？3.你能简单介绍一下你在字节实习做的项目吗？________________________________________二、字节实习项目：端上特征平台 / 性能优化4.你们这个端上特征平台里的“特征”具体指什么？5.客户端上的特征和服务端上的特征有什么区别？6.你在实习中做的两块优化，具体分别是什么？7.这两块优化分别解决了什么问题？8.你觉得这里面的难点主要在发现问题，还是在方案设计和落地？9.设备特征缓存为什么可以做分层？10.你们是怎么确定 2 秒、10 秒、90 秒这类分层缓存策略的？11.业务方怎么感知或使用这套缓存频率配置？12.这些设备特征的规模是固定的吗？13.你做的特征 SQL 优化具体是怎么做的？14.这里的时间戳在 SQL 里具体是什么条件？15.为什么这些 SQL 可以合并处理？16.你们为什么要在端上做特征处理，而不是全部上报到云端处理？17.端上做特征处理，最终是给哪些场景使用的？18.你这个特征平台和抖音、头条这些业务之间的关系是什么？19.业务方如果需要自定义特征，是怎么接入你们平台的？________________________________________三、AI 投资分析系统 / 多 Agent 设计20.你能介绍一下你做的 AI 投资分析系统吗？21.这个系统从用户输入到输出投资建议，大概是什么流程？22.你为什么要把系统拆成多个 Agent，而不是单 Agent？23.你这样拆成多个子 Agent，会不会导致信息割裂，反而影响最终分析效果？24.你觉得你现在这个多 Agent 方案主要问题在哪里？25.如果让你继续优化这个投资分析系统，你会怎么改它的 pipeline？26.你会怎么降低这个系统里的幻觉和噪声问题？27.你觉得投资分析系统里的“证据链完整性”应该怎么保证？28.除了证据链，你觉得最终“投资建议生成”这一层应该怎么设计规则或决策机制？29.你理解的“闭环”是什么？30.如果要让这个投资分析系统真正形成闭环，你觉得还缺哪些能力？31.用户反馈信号应该怎么作用到你的系统里？32.长期记忆、短期记忆和用户画像在这个系统里应该怎么设计？33.你觉得用户反馈信号应该怎么转成 reward 或权重更新？34.你提到意图识别和 plan，那你怎么保证这条链路本身的一致性？________________________________________四、高并发 AI 聊天系统35.你做的高并发 AI 聊天系统，里面“高并发”和“AI 聊天”结合起来，有什么特别值得讲的地方？36.你为什么会做这个项目？

0 点赞评论收藏

分享

04-30 08:02

东南大学 C++

26.4.9 阿里淘天广告二面

一、基本情况 / 经历1.你先简单做一下自我介绍。2.你在字节是在北京实习吗？3.你后来为什么没有继续在字节那边实习？4.你有 Java 相关的开发经验吗？5.你对 RPC 了解吗？6.你对 Kafka、MQ 这类消息队列中间件了解吗？________________________________________二、AI 投资分析系统 / 多 Agent 设计7.你之前做的 Agent 项目主要是用 Python 写的吗？8.你这个投资分析系统，是不是用户给一个投资问题，然后系统拆成多个子 Agent 去分析，最后汇总输出？9.你为什么要拆子 Agent？10.如果现在基于支持 skill 的系统重新实现你的 AI 投资分析系统，你觉得能不能用 skill 代替子 Agent？11.你说 skill 不能完全代替子 Agent，你理解的局限性具体是什么？12.如果 skill 的调用过程、输入输出都能清晰观测，而且上下文也能做清洗，那在你的理解里，skill 和子 Agent 还有什么本质区别？13.你觉得多 Agent 在什么情况下容易出错？14.你有没有一些实际经验，能说明多 Agent 什么时候会出问题？________________________________________三、AI Coding 环节相关15.你先看看这个 AI Coding 题目，理解一下。16.在这个词包拆分场景里，如果一个词包里有 10 万级别的词，你觉得 Agent 应该怎么处理？17.这些词包拆分时，你是不是必须覆盖词包里所有词，不能随机丢弃？18.如果广告主提出新的拆分维度，比如按产品型号、季节、颜色，甚至“适合情人节投放”这种抽象维度，你会怎么设计？19.这种动态维度拆分的问题，你觉得应该靠工具层解决，还是靠 Agent 自己推理解决？20.如果系统没有预定义这些维度，Agent 怎么识别和处理一个新的分类标准？________________________________________四、字节实习项目：特征平台 / SDK / 端云协同21.你能讲一个你觉得比较自豪、能体现你个人能力的方案设计吗？22.你做的这个特征 SQL 优化，里面的时间戳具体是 SQL 里的什么条件？23.你这个平台分析的是抖音这类 C 端用户行为吗？24.如果事件量很大，但查询量没那么高，你们有没有评估过事件驱动更新缓存会不会反而带来更大的压力？25.你实习里做的 SDK、特征平台、特征处理这些东西，它们之间到底是什么关系？26.头条和抖音用的是同一套 SDK，但关注的特征不一样，这种差异化是怎么实现的？27.这些差异化逻辑是在客户端做过滤，还是在服务端做过滤？28.如果过滤是在客户端做，那之前没上报的数据后面突然想要了，这种历史数据追溯问题怎么解决？29.你们现在的过滤逻辑，最终是在端上做的吗？________________________________________五、实习时间 / 求职安排30.你现在有考研或者读研的计划吗？31.如果还能继续实习的话，你最早什么时候能到岗，能实习到什么时候？

0 点赞评论收藏

分享

04-30 08:02

东南大学 C++

26.4.8 蚂蚁AI IDE一面

一、项目与经历1.你先做一下自我介绍。2.你做的两个小项目分别是什么？3.你之前做的这个高并发 AI 聊天系统，具体是一个什么产品？4.它和 ChatGPT 这类聊天产品相比，有什么不同？5.你当时在设计这个聊天系统时，上下文管理和 prompt 注入时机是怎么设计的？________________________________________二、AI IDE / AI 工具使用经验6.你用过 Claude Code、Codex 这类 AI IDE / AI 编程工具吗？7.你主要是用它们的 CLI、桌面端，还是网页版？8.在用这些 AI IDE 之前，你主要是用什么开发 C++？9.市面上常见的 AI IDE 工具你都用过哪些？10.你觉得这些 AI IDE 对 C++ 的支持怎么样？11.有没有什么让你特别不满意的地方？12.当这些工具帮你生成 C++ 代码后，你会怎么做验证？会直接接受，还是会 review / 测试？________________________________________三、Agent / ReAct / Claude Code / Skill / MCP13.你有调研过这些 AI IDE 背后的 Agent 模式和基础原理吗？14.你怎么理解 ReAct 这种 Agent 模式？15.你有了解过 Claude Code 的源码或整体架构设计吗？16.你觉得 Claude Code 的整体架构是不是基于 ReAct？17.从 Claude Code 这类产品里，你觉得有哪些设计思路是值得你自己的聊天系统借鉴的？18.你有了解过它里面常用的工具吗？比如 grep 这类。19.你自己用过哪些 MCP？20.你对 MCP 协议、安装方式、使用方式有了解吗？21.你觉得 skill 和 MCP 的区别是什么？22.你觉得 skill 算不算一种“渐进式披露”的能力组织方式？23.你在 Trae 或类似工具里，主要是怎么使用这些能力的？________________________________________四、聊天系统能力设计：读 / 写 / 调工具24.如果现在要让你的聊天系统具备“读文件”的能力，你会怎么设计？25.如果文件不在本地，而是在 GitHub 仓库路径下，你会怎么让系统读取它？26.如果系统本身还不具备调浏览器的能力，那你会怎么设计这部分能力？27.如果现在你的聊天系统已经具备了读、写和调 batch 工具的能力，那从系统实现角度，你要做哪些事情，才能真正让它具备这些能力？28.batch / 读 / 写这些能力，你会怎么做工具封装和调用适配？________________________________________五、投资分析系统如何抽成 Skill29.如果要把你的 AI 投资分析系统抽成一个 skill，挂到你的聊天系统里，让用户在聊天中直接调用，你会怎么设计？30.你的投资分析系统里，多 Agent 是核心吗？31.如果要 skill 化，多 Agent 这一层要不要保留？32.你的投资分析系统里不是还有知识库检索吗？如果做成 skill，这部分怎么处理？________________________________________六、回退机制 / 安全性 / 编排失败处理33.你刚才说的“回退机制”具体是什么意思？34.如果 AI 修改文件改到一半报错了，怎么保证用户原来的代码安全？35.你说的回退，是写日志、写操作记录，还是别的什么？36.如果是写操作记录，你会记录什么内容？37.这种回退是按行级别做，还是按块级别做？38.如果是编辑已有文件，而不是新建文件，回退机制怎么保证安全？39.你简历里写的“通过编排回退机制保障服务稳定性”，这里的“编排回退”具体指什么？40.你怎么定义一个工具调用或检索是“失败”的？41.你为什么要对失败结果做标记？42.如果检索结果本身不准确，你有做过效果评估吗？________________________________________七、语言迁移与学习能力43.如果 IDE 产品所需要的编程语言不是你熟悉的语言，你会怎么快速融入？44.你觉得在现在这个阶段，编程语言本身还是最核心的难点吗？45.你怎么看“学语言的术”和“学系统设计的道”这件事？46.你之前用我们那个 AI IDE 做笔试时，整体体验怎么样？47.你觉得在 AI coding 场景下，语言本身重要，还是方案设计更重要？

0 点赞评论收藏

分享

04-30 08:01

东南大学 C++

26.4.8 阿里钉钉c++客户端二面

一、基本情况与工作意愿1.你先做个简单的自我介绍。2.你在字节实习时的作息是怎样的？3.早上九点、晚上十点到十一点下班，这种工作强度你能接受吗？________________________________________二、字节实习项目：特征平台 / 缓存 / SQL 优化4.你做的三档 TTL 分层缓存（2 秒 / 10 秒 / 90 秒）是怎么设计出来的？有数据支撑吗？5.如果业务场景变化了，这些缓存时间你怎么动态调整？6.你这里用到的 concurrent hashmap / unordered map，是加锁实现还是无锁实现？7.你提到的 SQL 签名化、UNION ALL 合并查询、事件驱动失效，这整套优化具体是怎么做的？8.你们的缓存是自己实现的，还是用现成组件，比如 Redis / Memcached？9.这里“事件驱动失效”里的事件来源是什么？触发缓存更新的时机是什么？10.你怎么保证这个事件回调一定成功？如果失败了，会不会导致缓存和数据库不一致？11.如果 SQL 的字段顺序不一样，还能不能归为同一类查询？12.你这些优化效果的数据是怎么采集出来的？13.除了缓存优化，你们还做过哪些性能优化？14.如果现在让你重新设计这套缓存框架，你觉得还有哪些可优化空间？________________________________________三、并发 / 网络模型 / 线程池15.在你的项目里，水平触发和边缘触发是怎么选的？各自适合什么场景？16.你动态线程池的扩容和缩容策略是什么？17.你怎么避免线程频繁创建带来的开销？18.如果线程池队列满了，或者任务队列也满了，你怎么处理？19.遇到突发流量时，你最保底想保证什么？________________________________________四、服务端 / Agent / AI 编程工具22.你做过服务端开发吗？你更偏服务端还是客户端？23.你还做过 Agent 项目，是自己写的还是 AI 辅助写的？24.你现在常用哪些 AI 编程工具？体验怎么样？25.你会对 AI 编程产生危机感吗？26.这些 AI 使用能力基本都是你自己学的吗？________________________________________五、学习能力 / 解决问题能力27.你有没有在一两周内快速学习一项新技术的经历？28.你成长过程中，有没有一个印象很深、最后被你自己解决掉的技术难点？29.你平时除了搜索、看视频，还会通过哪些方式学习或定位问题？30.当你面对源码时，你是怎么理解和真正学会它的？________________________________________六、工程素质 / 团队协作 / 技术关注31.你认为一个好的工程师，除了技术能力，还需要具备哪些素质？32.你们之前团队是怎么做技术分享和技术沉淀的？33.你自己分享过什么内容？34.你会经常关注新技术吗？为什么目前更多停留在“表面了解”这一层？35.你觉得“了解到能用”就够了吗？还是应该继续深挖原理？

0 点赞评论收藏

分享

04-30 08:01

东南大学 C++

26.4.7 阿里淘天广告一面

一、项目与实习经历1.你先做个自我介绍。2.你能详细介绍一下你在字节跳动做的项目吗？二、AI Coding 题：配置驱动的 HTTP 路由转发题目：实现一个通过配置文件管理的HTTP接口路由转发功能，需满足：基础功能•支持 YAML/JSON 配置文件定义路由规则（路径、方法、目标服务）•实现 HTTP/HTTPS 请求转发•处理路径通配符（如 /api/*）进阶能力•配置热加载（修改文件不重启服务）•负载均衡（轮询/随机两种策略）•请求超时控制与重试机制生产级要求•大文件传输时内存占用 < 50MB（流式转发）•可读的错误码体系（如 404、502）•输出审计日志（路径、目标 IP、状态码、耗时）交付要求•可运行代码 + 配置示例•通过三个测试场景：热加载、重试、100MB 文件传输10.你先看一下这个题目，然后说一下你的理解，以及你打算怎么处理、整体思路是什么。11.你对这里“负载均衡”这一块是怎么理解的？12.热加载这个功能，你觉得一般应该怎么做？13.你刚才提到定时轮询配置，那这个轮询一般隔多久比较合适？14.你说到实习里也有类似的动态配置更新？对应的机制大概是什么？15.这个接口转发里，你理解的“目标服务”是什么？16.如果目标服务不只是 HTTP，也可能是 RPC，那你觉得这里还需要考虑什么？17.这个生成出来的代码里，配置和接口的匹配方式是什么？18.你希望这个配置文件的更新机制是什么样的？19.如果手动修改配置文件出了问题，比如 JSON 不合法，你觉得系统应该怎么处理？________________________________________三、设备特征缓存优化 / 特征 SQL 优化20.你刚才提到设备特征缓存优化，在你优化之前，这块有缓存机制吗？21.你刚才说每次要调适配器，这里调用适配器主要是为了获取什么？22.是因为这个接口耗时比较长，所以你们才考虑加缓存，是吗？23.如果设备特征对准确性要求不是特别高，那为什么适合做缓存？24.这块缓存机制上线之后，大概优化了多少？25.你刚才提到用了并发相关的开发，比如 concurrent hash map 这些，这块你了解多少？26.如果涉及多线程开发，你大概了解哪些线程相关的工具？________________________________________四、线程 / 系统能力 / 开放题27.如果一台 8G 内存的机器，你觉得大概能创建多少个线程？28.如果不要求你给具体数字，那你觉得估算“最多能创建多少线程”时，需要考虑哪些因素？________________________________________五、SQL 复用优化29.你第二点提到 SQL 复用优化，这一块能简单介绍一下你做的工作吗？30.你这里提到“将时间窗口不同的查询归定为同类请求”，这个怎么理解？31.你们是不是把某个时间范围内的 SQL 放在一起统一去请求？________________________________________六、滑动窗口消息去重（开放题）32.如果你的系统接收外部消息，并且希望在一个滑动时间窗口内对消息做去重，这个功能如果交给你，你会怎么做？33.假设你的服务有多台机器共同消费同一个上游消息源，在这种分布式场景下，滑动窗口内的消息去重你会怎么设计？34.如果你想到加一个共享中间件，那这个共享中间件应该怎么设计？35.这个去重逻辑你具体会怎么实现？

查看28道真题和解析

0 点赞评论收藏

分享

04-30 08:00

东南大学 C++

26.4.1 阿里千问c++客户端一面

一、自我介绍 / 实习背景 / 项目定位1.请先做一下自我介绍。2.你可以讲一下你的这个 C++ SDK 实习吗？3.你们团队做的这个端智能特征工程，主要是在做什么？4.这里说的“特征”具体是什么特征？5.这些特征是怎么被业务使用，并对业务产生影响的？6.端上去做这个实时计算，算法是怎么部署和运行起来的？7.你了解 Python 怎么在移动端上运行吗？比如依赖、包管理、运行环境这些是怎么处理的？8.这些 Python 算法具体是什么类型的算法？是基于规则的，还是也可以基于模型的？9.这些中间数据最后是怎么真正影响业务的？能在端上完成业务闭环吗？________________________________________二、C++ / 内存管理 / 语言基础10.你觉得 C++ 在内存安全这一块的设计怎么样？11.其他语言一般用什么机制来做内存管理？12.为什么你觉得垃圾回收和 C++ 的智能指针机制不一样？它们的区别和特点是什么？13.C++ 智能指针大概是基于什么原理实现的？14.垃圾回收一般又是基于什么原理或算法实现的？15.堆和栈的区别是什么？16.在 C++ 里，局部变量、数组、STL 容器这些一般分别分配在什么地方？17.函数里的局部变量在栈上是怎么管理的？18.从编译器 / 操作系统视角看，栈在执行时是怎么工作的？________________________________________三、实习项目复盘 / 性能优化 / 缓存与 SQL19.在这个端智能特征项目里，你觉得还有哪些地方可以做得更好？20.你刚才说设备特征缓存还能优化，具体还能优化什么？21.如果出现极端边界情况，比如设备特征数量暴涨，你的缓存管理器会有什么问题？22.你说特征 SQL 查询也有缓存，这个缓存的 key 存的是什么？23.你说这个 SQL 查询缓存是事件驱动加懒更新机制，它现在的问题是什么？24.如果缓存一过期就把所有内容丢掉，这样的设计有什么缺点？25.你觉得这个 SQL 查询缓存还能怎么优化？26.为什么你觉得把更新条目直接加入缓存、再在应用层分发，会比落到数据库再查更好？________________________________________四、AI 投资分析系统 / Agent 设计 / LangChain27.你为什么想做这个 AI 投资分析系统？28.这个项目你是基于什么 Agent 架构做的？29.你这个 Agent 框架是自己写的，还是基于某个 SDK / 框架做的？30.LangChain 是一个什么样的框架？31.ReAct 是什么？它和 LangChain 是什么关系？32.在这个 Agent 框架之上，你自己主要做了哪些工作？33.你提到内容审查，这部分你具体做了什么？34.你做的这些工作，在整个 Agent 系统里更偏哪一部分？比如 memory、状态管理、tool call 之类。35.你新增的工具是怎么让 Agent 感知到并调用的？36.工具注册和工具调用这部分，你具体是怎么设计的？________________________________________五、AI Coding 现场题 / 架构设计 / Go 协程题目：命令行接口压测工具### 背景描述请设计并实现一个命令行高性能压力测试工具，用于对指定 HTTP 接口进行可控并发压测。工具需自主管理资源，确保在高负载下稳定运行并能优雅退出。### 技术要求1. **核心功能**：接收目标 URL 及并发参数，发起请求并输出统计报告。2. **并发控制**：自行设计并发模型；需明确定义压测结束时的请求处理策略（等待/取消）。3. **异常与边界**：必须妥善处理各类异常情况。需明确统计口径（如失败请求是否计入延迟）。4. **技术选型**：语言自选，需说明选型理由及架构设计思路。### 交付物要求1. **可运行的代码**：提供源码及 README，包含清晰的参数说明与运行示例，确保可直接验证。2. **测试用例**：至少包含 3 个自动化测试（利用本地 Mock 服务模拟正常、慢响应、断连等场景），覆盖基础功能与异常边界，并确保全部通过。37.你先看一下这个 AI coding 题。38.你为什么选择用 Go 和原生协程来做这个方案？39.相比协程，如果换成线程或者进程，会怎么样？40.这个方案里的并发控制是怎么做的？41.这里为什么会设计 worker 池？42.你觉得 AI 给出的这个整体设计方案合理吗？43.你怎么去保证 AI 生成的方案在异常情况下也能正确工作？44.你觉得这里需要重点考虑哪些异常情况？45.如果 AI 给出的方案不完善，你一般会怎么补充和修正？

0 点赞评论收藏

分享

04-30 07:57

东南大学 C++

26.4.1 阿里钉钉c++客户端一面

一、字节实习 / 端智能特征平台1.你能详细介绍一下你在字节跳动做的这个项目吗？可以从背景、为什么做、有哪些技术难点、怎么解决这几个方面讲一下。2.你们这个项目里的“特征”具体指什么？3.这些特征是怎么被业务使用并产生影响的？4.端上的实时计算是怎么部署和运行起来的？5.你对这个项目里“特征提取”这一块了解吗？6.如果你们能提供很多特征能力，那在做特征工程时，哪些特征更有利于项目、该怎么去选择？7.如果拿到一堆数据可以做很多特征，你会怎么判断哪些特征是前期需要的、哪些是必须的、哪些甚至不应该出现？8.你们其实更偏平台通用能力，而不是直接做业务，对吧？________________________________________二、设备特征缓存优化 / SQL 优化9.你在这个项目里做的性能优化，能具体讲一下吗？10.为什么设备特征调用会产生比较大的耗时？11.你们为什么想到用缓存来优化设备特征？12.设备特征缓存为什么要分三档？13.你们是怎么根据更新频率去划分缓存层级的？14.这个设备特征缓存优化最终带来了什么收益？15.你做的特征 SQL 优化，问题背景是什么？16.为什么会想到把这些 SQL 做合并处理？17.你们最开始用 UNION ALL 合并 SQL 的思路是什么？18.后来进一步把时间戳提取出来、做“一次扫描再应用层分发”的思路是什么？19.这里做了特征缓存，那这个缓存的 key 存的是什么？20.你觉得这套特征 SQL 缓存和更新策略，还有哪些地方可以继续优化？21.如果遇到边界情况，比如特征数量暴涨，现有缓存设计可能会有什么问题？________________________________________三、高并发 AI 聊天系统 / 网络框架22.你这个高并发 AI 聊天系统项目，是在字节实习期间做的吗？23.你做这个项目之前，为什么会想做这样一个东西？背景是什么？24.你这里写了“自主研发网络框架”，你对网络框架这块很熟吗？25.你在做这个网络框架的时候，有没有遇到比较难的问题？是怎么解决的？26.你这里提到 epoll、多路复用，这部分你是怎么理解和落地的？27.你这里提到动态线程池，为什么会想到做动态扩容 / 缩容？28.这个项目最终主要是用什么语言实现的？29.你现在主要熟悉的语言还是 C++ 吗？30.除了 C++，你对 Python、Go 这些语言的使用情况怎么样？________________________________________四、开发习惯 / 问题定位 / 学习方式31.你平时开发过程中，如果有些代码不会写，或者对系统接口不熟，你是怎么把这些东西弄懂的？32.如果你实现某个功能时，发现结果和预期不一致，你一般怎么定位 bug？33.除了打日志之外，你还会怎么定位问题？34.如果实习中给你一个之前没做过的新需求，只有一周时间要落地，你一般会怎么推进？35.在这种时间紧、需求又新的情况下，你会怎么确定优先级和最小可用版本（MVP）？36.如果遇到不熟悉的技术或框架，你一般怎么快速补齐？________________________________________五、AI 投资分析系统 / Agent / LangChain / Skill37.你为什么会想做这个 AI 投资分析系统？38.这个项目现在做到什么程度了？39.你这个项目里的 Agent 架构是什么？40.你这个 Agent 架构是自己写的，还是基于现成框架 / SDK 做的？41.LangChain 是一个什么样的框架？42.ReAct 是什么？43.LangChain 和 ReAct 之间是什么关系？44.在这个 Agent 框架之上，你自己主要做了哪些工作？45.你这里提到内容审查，这部分具体做了什么？46.你做的这些工作，更偏 memory、状态管理，还是 tool call？47.你新增的工具，是怎么让 Agent 感知到并调用的？48.工具注册和工具调用这部分，你是怎么设计的？49.你觉得在这个项目里，skill 为什么不是必须的？50.skill 在你的使用场景里，主要是怎么发挥作用的？________________________________________六、AI 学习路径 / 开源 / 工具使用51.你这些 AI 相关能力，是学校里有课程，还是主要靠自学？52.你从学习计算机到现在，了解过哪些开源项目？53.有没有你比较感兴趣或者研究过的开源项目？54.你自己对开源项目的关注，更多偏底层实现，还是偏应用层？55.你最近提到的 Moon Cloud、OpenCode 这些东西，自己玩过之后感觉怎么样？56.你了解过“悟空”吗？57.你现在用的这些 AI 工具，基本上都是自费的吗？58.你平时怎么选模型和工具，怎么平衡成本和效果？59.你觉得 Codex、Trae、千问这类工具的体验怎么样？60.字节内部当时有没有自己的 AI 工具？你们内部是怎么用的？________________________________________七、客户端方向 / 安卓 iOS / 跨端 / 工具链61.你做的这个 SDK 最终落在什么场景里？是在端上吗？62.你们做安卓集成的时候，有没有遇到一些适配问题，比如 16KB 页大小这种？63.你现在既然面的是客户端方向，那你更偏向做哪个端？有没有认真想过这个问题？64.为什么你会觉得安卓端整体生态比 iOS 更好一些？65.你们这里说的客户端，不只是安卓和 iOS，也可能包括 PC 端，这一点你怎么看？66.你对 Windows 开发和 Mac 端开发有经验吗？67.你平时更多是在哪个端去调试和开发？68.你用得最多的开发工具是什么？69.如果岗位偏安卓多一点，这个你可以接受吗？70.你自己有做过能跑在手机上的安卓 App 吗？

0 点赞评论收藏

分享

04-30 07:55

东南大学 C++

26.3.31 小红书AI全栈（社区工程）一面

一、自我介绍 / 经历亮点 / 岗位理解1.你先简单介绍一下你最近的经历，挑项目或实习里你觉得比较有亮点的讲一下。2.你们端智能这块的特征工程，主要是做什么的？3.你们这个项目本身负责采集吗，还是主要做中间处理？4.整个系统设计上大概是怎么分层的？5.业务方怎么定义和注册他们需要的特征？________________________________________二、设备特征缓存优化7.设备特征缓存优化这个需求，是 mentor 提给你的，还是你自己发现的？8.你当时接到这个任务后，是怎么思考和解决这个问题的？9.这个问题为什么会在高并发场景下耗时，它的根本背景是什么？10.你为什么会想到用缓存来解决？11.设备特征是会变化的，那你们怎么处理这个变化？12.为什么要分成 2 秒、10 秒、90 秒这几档？13.网络状态这种高频变化的特征，为什么是两秒？14.如果某些业务对实时性要求极高，比如 0.5 秒级别，你这套缓存怎么适配？15.如果同一个特征在不同业务、不同页面下要求不一样，你怎么设计整套特征供给和消费体系？16.如果不同业务场景对同一特征的刷新频率要求不同，你真正采集和计算时怎么定间隔？17.只要有人要求最短间隔，是不是整个系统都得按最短间隔跑？18.你觉得这个体系怎么设计，才能满足这种差异化需求？________________________________________三、特征计算触发 / 业务隔离 / 平台治理19.你们怎么限制特征计算不要无限制执行？20.如果一个事件可能触发很多脚本同时运行，你怎么管控？21.如果要限制并发执行任务数，那这些任务怎么选、谁优先？22.如果不同业务都说自己的任务重要，你作为平台怎么治理？23.这个治理过程以前可能靠人 review，那现在这个时代，你觉得还需要人一个个看吗？24.如果想用 AI 去替代人工 review 算法包，你觉得应该怎么做？25.如果让 AI 判断什么是合理、什么是不合理，你觉得提示词 / 规则里应该包含哪些信息？26.哪些特征或脚本应该被重点审查？高频的、复杂的、还是孤立的？为什么？________________________________________四、端上开发经验 / AI 在开发中的使用27.你在项目里面主要做的是 C++，对吧？28.除了 C++ 性能优化，你平时接的小需求是否也会涉及 iOS 和安卓两端？29.你们整个开发过程中会用 AI 吗？30.当时你们主要用哪些 AI 编码工具？31.你平时会用国产模型吗？________________________________________五、编程题：带 TTL 的 LRU Cache（允许 AI 辅助）### 题目要求实现一个线程安全的 **LRU + TTL** 本地缓存，请使用 Java 实现一个本地缓存类。### 代码框架```javapublic class LocalCache<K, V> {public LocalCache(int capacity) { }public void put(K key, V value, long ttlMillis) { }public V get(K key) { }public int size() { }}```### 功能要求缓存有最大容量 `capacity`；每个 key 支持 TTL（过期时间）；get 时如果 key 已过期，返回 `null` 并删除；插入新 key 时缓存已满：- 先清理已过期元素；- 若仍满，则淘汰最近最少使用（LRU）的元素；如果 key 已存在，更新 value、过期时间，并刷新其 LRU 状态；需要保证线程安全；说明实现的时间复杂度，并说明如何避免因重复 put 导致过期堆中的旧记录误删新值。32.你先看一下这个题，先不用急着让 AI 出答案，你觉得它给出的方案方向有问题吗？33.它这里为什么要引入 version？34.version 是怎么避免旧数据误删新数据的？35.为什么这里要用小顶堆？36.小顶堆在这个设计里的作用是什么？37.如果堆里一共有 N 个元素，其中 K 个过期了，清理这 K 个元素的时间复杂度是多少？38.如果 K 很大，比如长时间没人请求、结果大量 key 一起过期，这个方案会有什么问题？39.在这种极端情况下，get / put 还能保持接近 O(1) 吗？40.如果你现在重新设计这个方案，你会怎么做？41.如果不用 AI，你最基础的思路是什么？42.纯 hash map + 双向链表 能不能先把 LRU 做出来？43.如果只在 value 里记录过期时间，会有什么局限？44.为什么说一旦加了小顶堆，就会把一致性和复杂度问题带进来？

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务