腾讯 TEG AI中台一面 暑期实习分享
简直是夯爆了!!!
1.实习项目相关问题
2.详细介绍一下你做过的智能客服系统。
3.你们这套系统主要的应用场景大概是怎么样的?能举个例子介绍一下。
4.什么情况下需要用到你的那个 expert 相关技术?
5.整套系统的主要难点是在于什么地方?
6.中间的 Planner,它的规划机制是怎么样的?比如它底层需要调用哪些工具?是不是需要多轮规划?中间的一些详细设计是怎么设计的?
7.你们怎么去评估客服对客户的输出是好还是坏?
8.搜索功能是怎么实现的?
9.你在中间起到的主要作用是什么?你做出了什么改进?
10.你这个迭代的过程中,有 ground truth 吗?比如每一个 query 实际上最终最相关的商品是有哪些?
11.你中间做了一些什么样的技术迭代?最终体现在人工评估指标上有什么样的提升?有做过对比吗?
12.这个人工评估的指标是怎么设计的?最后它的指标结果怎么样?
13.这个指标结果是内部人工评估的,还是线上的结果?
14.中间优化的过程中,你们用的是一个什么样的模型?
15.你的那个 expert 模型,怎么去训练的?样本从哪里来?
16.导购场景的数据是真实的用户跟人工客服对话的场景数据吗?
17.训练的样本量大概是多大?
18.1000 条样本就足够训练你的这个模型了吗?
19.你对比过训练之前跟训练之后,同样的问题模型学习后的能力提升大概有多少?
20.你能做到比原始蒸馏出来的模型效果还强吗?
21.训这个 8B 的模型用的是多大显存的?什么显卡?
八股
1.正常来说,1B 的模型在没有做任何量化的情况下,原始 FP 格式存储大概要占到多少显存?
2.不考虑梯度的情况,单纯只考虑 Inference,把参数加载到显存里面大概要占多少显存?
3.平时有用过一些量化加速的方法吗?
4.常用的量化手段比如 INT4、INT8、BF,它们之间怎么做到加速的?你有了解过吗?
5.FP 跟 BF 之间的区别,你了解吗?
6.FP 和 BF 底层实现的区别主要在哪个地方?
7.正常的 MP32 在底层数据存储上,小数是怎么表示的?
手撕:有连续的 N 个正整数,随机抽出一个(不拿头尾),将其他数乱序放入 N-1 大小的数组中,找出被取出的数。要求时间复杂度 O (N),空间复杂度 O (1)。
1.实习项目相关问题
2.详细介绍一下你做过的智能客服系统。
3.你们这套系统主要的应用场景大概是怎么样的?能举个例子介绍一下。
4.什么情况下需要用到你的那个 expert 相关技术?
5.整套系统的主要难点是在于什么地方?
6.中间的 Planner,它的规划机制是怎么样的?比如它底层需要调用哪些工具?是不是需要多轮规划?中间的一些详细设计是怎么设计的?
7.你们怎么去评估客服对客户的输出是好还是坏?
8.搜索功能是怎么实现的?
9.你在中间起到的主要作用是什么?你做出了什么改进?
10.你这个迭代的过程中,有 ground truth 吗?比如每一个 query 实际上最终最相关的商品是有哪些?
11.你中间做了一些什么样的技术迭代?最终体现在人工评估指标上有什么样的提升?有做过对比吗?
12.这个人工评估的指标是怎么设计的?最后它的指标结果怎么样?
13.这个指标结果是内部人工评估的,还是线上的结果?
14.中间优化的过程中,你们用的是一个什么样的模型?
15.你的那个 expert 模型,怎么去训练的?样本从哪里来?
16.导购场景的数据是真实的用户跟人工客服对话的场景数据吗?
17.训练的样本量大概是多大?
18.1000 条样本就足够训练你的这个模型了吗?
19.你对比过训练之前跟训练之后,同样的问题模型学习后的能力提升大概有多少?
20.你能做到比原始蒸馏出来的模型效果还强吗?
21.训这个 8B 的模型用的是多大显存的?什么显卡?
八股
1.正常来说,1B 的模型在没有做任何量化的情况下,原始 FP 格式存储大概要占到多少显存?
2.不考虑梯度的情况,单纯只考虑 Inference,把参数加载到显存里面大概要占多少显存?
3.平时有用过一些量化加速的方法吗?
4.常用的量化手段比如 INT4、INT8、BF,它们之间怎么做到加速的?你有了解过吗?
5.FP 跟 BF 之间的区别,你了解吗?
6.FP 和 BF 底层实现的区别主要在哪个地方?
7.正常的 MP32 在底层数据存储上,小数是怎么表示的?
手撕:有连续的 N 个正整数,随机抽出一个(不拿头尾),将其他数乱序放入 N-1 大小的数组中,找出被取出的数。要求时间复杂度 O (N),空间复杂度 O (1)。
全部评论
相关推荐
查看12道真题和解析 点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看6道真题和解析 点赞 评论 收藏
分享