小米二面面经
大模型应用岗,整体约一个小时左右
自我介绍
面试官介绍部门业务
rag系统的搭建过程,评价指标
在不改变回复准确度的前提下,如何提升模型回复速度
batch query的情况下如何再优化
Prefill(预填充)和Decode(解码)都做了什么
langchain对比vllm 和 deepspeed的优势是什么,kv cache如何管理
python多线程的特点,相较于java和c的区别
GIC锁
如何实现python真正的多线程
手撕 力扣简单
不知道能不能过
自我介绍
面试官介绍部门业务
rag系统的搭建过程,评价指标
在不改变回复准确度的前提下,如何提升模型回复速度
batch query的情况下如何再优化
Prefill(预填充)和Decode(解码)都做了什么
langchain对比vllm 和 deepspeed的优势是什么,kv cache如何管理
python多线程的特点,相较于java和c的区别
GIC锁
如何实现python真正的多线程
手撕 力扣简单
不知道能不能过
全部评论
一个小时,感觉这时间挺长的
能过能过,雷总说

自己感觉回答咋样?一般感觉***不离十
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看21道真题和解析