百度实习 AIGC算法面经分享

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.对于社区讨论类、用户生成内容较多的数据源,会做哪些额外的数据清洗或质量控制?
2.如何对metadata做数据处理?
3.检索系统中,数据预处理、metadata 设计和索引构建是如何考虑的?
4.检索阶段是如何做召回和精排的?为什么要结合关键词检索、语义检索和 rerank?
5.检索结果注入生成模型后,这个模型是用于实验验证,还是面向真实部署场景?
6.如果后续要正式落地,你会从哪些维度重新评估模型选型?
7.你如何理解 RAG?它的核心目标是什么?
8.RAG 的典型流程包括哪些阶段?每个阶段的关键点分别是什么?
9.在实际应用中,RAG 的效果上限主要受哪些因素影响?
10.在什么场景下更适合使用 RAG,而不是把规则或知识直接固化到系统逻辑里?
11.在 Agent 或助手系统里,tool calling 一般适合解决什么问题?
12.MCP 或类似协议在工具调用体系里主要起什么作用?
13.Skills 和 tool calling 的区别是什么?
14.如果要用 skills 重构一个现有助手系统,哪些模块最适合优先抽象成 skills?
15.在多模态系统中,引入 Adapter 的主要作用是什么?
16.Adapter 在模态对齐、参数高效训练、信息筛选和可迁移性上分别有什么价值?
17.用模型对长文本做预提取、重写或摘要,与直接截断相比,有什么本质区别?
18.滑动窗口、摘要压缩、关键词提取、长期 memory 存储,这几类方案分别适合什么场景?
19.DPO 和 GRPO 的核心区别是什么?
全部评论
这问的真的多啊
点赞 回复 分享
发布于 03-22 22:27 北京

相关推荐

全是八股轻松拿下,面完隔一天就说 oc 了(接了之后突然和我说加面,后面过了但是说 hc 无了)1. Go 语言有哪些特点2. 值类型和引用类型有哪些3. slice 和 array 的区别4. map 是否并发安全 / 为什么并发写不安全5. goroutine 和线程的区别6. 栈内存和堆内存的使用场景7. Go 的 GC 机制8. 逃逸分析 (escape analysis)9. context 的作用10. MySQL 常用引擎及区别 / 适用场景11. MySQL 索引类型12. 事务四大特性 ACID13. 事务隔离级别及可能造成的问题14. MySQL 底层日志 binlog / redolog / undolog15. MySQL 主从复制原理16. Redis 常用数据类型及适用场景17. Redis 为什么快18. Redis 数据量过大时为什么会变慢19. Redis 持久化机制20. Redis 分布式锁21. 为什么 Go 推荐 goroutine + channel 但还需要 Redis 分布式锁22. 消息队列中间件使用经验23. IO 多路复用原理24. HTTP 有什么特点25. 多模态内容(用户/商品)的点赞/评论/关注聚合展示 - 表结构设计26. 异步写入的缺点 / 一致性问题27. 职业规划28. 自我评价29. 工作中遇到问题如何解决
查看29道真题和解析
点赞 评论 收藏
分享
评论
2
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务