淘天 NLP 一面
1.自我介绍
2.项目拷打
你们的训练数据怎么构造的?
对话的风格是怎么做的?
遇到 OOC 问题你们一般怎么解决?
还有一些比如说动漫角色这种,可能更难解决,你们怎么做。
模型输出内容太假大空你们怎么做?
记忆怎么做的?
然后问了一个八股
为什么现在大模型输入和输出价格不一样(说的有点结结巴巴,大意就是说输出需要对每个输入都要计算 注意力,输入只需要计算前面的部分。反正就是平均下来输入的成本比输出低。)
代码题
无序序列中位数,用 topk 改了一下。
反问
2.项目拷打
你们的训练数据怎么构造的?
对话的风格是怎么做的?
遇到 OOC 问题你们一般怎么解决?
还有一些比如说动漫角色这种,可能更难解决,你们怎么做。
模型输出内容太假大空你们怎么做?
记忆怎么做的?
然后问了一个八股
为什么现在大模型输入和输出价格不一样(说的有点结结巴巴,大意就是说输出需要对每个输入都要计算 注意力,输入只需要计算前面的部分。反正就是平均下来输入的成本比输出低。)
代码题
无序序列中位数,用 topk 改了一下。
反问
全部评论
八股这个 应该是gpu资源利用率方面 通信瓶颈+多次forward导致成本gpu利用率低
想问下佬投的是算法技术还是业务技术,谢谢

问问大佬,推进了吗还是在泡
学长太强了
相关推荐
今天 14:14
四川省泸县第二中学 Java 点赞 评论 收藏
分享
09-25 00:21
湖南工业大学 嵌入式工程师 故事和酒66:假设一下,就算报了培训班,不还是要投简历,只是项目改了。那不如先写几个培训班的项目,纯靠编,然后试试有没有面试。如果真有再报也不迟,如果没有还是没有,那就不是培训班的问题了。
点赞 评论 收藏
分享