面试官人不错,但有些问题被问住了, 还是太菜了。不知道能不能过。问了流程, 说是:技术 3+HR 1【面试问题】1️⃣ 可以介绍一下你自己吗?2️⃣ 你觉得做得比较有成就感的一个项目是什么?在里面承担了什么角色?项目相关8️⃣ embedding 的原理是什么?它是如何让语义相近的内容在向量空间靠近的?9️⃣ Transformer 架构你了解吗?现在流行的 GPT 类 decoder-only 模型的工作流程和整体架构大概是什么样?🔟 大模型推理成本高,主要消耗在哪些地方?1️⃣1️⃣ 你在 AI 方面比较关注、感兴趣的方向是什么?1️⃣2️⃣ 如果给你一张 32B 参数量、未量化的模型,你觉得跑起来大概需要多少显存?1️⃣3️⃣ 训练时的精度(FP32、BF16、FP16 等)和推理时的精度有什么差异?各自怎么选择?1️⃣4️⃣ BF16 与 FP16 的差别是什么?1️⃣5️⃣ 你了解不同显卡(如 RTX 4090、A100/H100)支持的计算数据类型和算力大概是什么水平吗?1️⃣6️⃣ 你平常在工作、学习或科研中是如何使用 AI 的?1️⃣7️⃣ 你会用国产大模型或工具吗?1️⃣8️⃣ 你有实习经历吗?