工程架构与细节(AI面试题)

#面试官拷打AI项目都会问什么?#
RAG相关:“你的向量检索召回率低怎么办?有没有做混合检索(BM25+向量)?重排序(Rerank)模型选的什么?为什么?”
上下文管理:“长文本处理时,你的上下文窗口不够了怎么截断?摘要策略是什么?”
并发与延迟:“流式输出的首字延迟(TTFT)怎么优化的?如果并发量上来,你的显存占用怎么控制?”

面试官心理:想知道你对数据清洗、向量数据库、Prompt工程迭代这些脏活累活有没有经验。
避坑指南:准备好具体的参数细节。比如:“我对比了BGE和M3E模型,发现M3E在中文短文本上表现更好,所以选用了它。”
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务