字节大模型Agent算法一面

1.CV和NLP的区别与联系
2.在Transformer框架下,CV、NLP、语音是否可能统一?
3.大模型训练数据清洗、处理、配比的方法
4.大模型训练如何更容易提升模型性能
5.Encoder与decoder的中Attention区别?
6.Attention如何计算?为什么除以根号下Dk?mask attention是如何实现的?
7.讲GQA、MQA、MLA原理。
8.为什么要用位置编码?为什么要用sin_cos?
9.问之前实习的Agent的设计逻辑,问创新方法的实现。
10.你提到用DeepSpeed做SFT训练,请讲一下DeepSpeedZeROStage1-3的区别,以及什么时候
用FSDP会更好?
11.什么是大模型的幻觉,如何缓解
12.为什么会有复读问题,业内有哪些解决办法
13.大模型工具调用的实现方式
14.Agent的组成部分及实现方法
15.问Agent的工具tool的设计,是否是workflow形式。
16.了解哪些agent开发框架,例如langchain和Llamalndex,核心应用场景有何不同?
17.问数据的输入输出格式如何保证大模型输出稳定的json做了哪些工作?
18.开放题:你在大模型训练中遇到过的困难,如何解决?
19.代码题:实现一个Tokenizer
全部评论

相关推荐

评论
5
24
分享

创作者周榜

更多
正在热议
更多
# 一张图晒出你司的标语 #
4463次浏览 78人参与
# 找AI工作可以去哪些公司? #
10165次浏览 319人参与
# 米连集团26产品管培生项目 #
13494次浏览 286人参与
# 你的实习产出是真实的还是包装的? #
20890次浏览 346人参与
# 从事AI岗需要掌握哪些技术栈? #
9863次浏览 393人参与
# 春招至今,你的战绩如何? #
68050次浏览 600人参与
# 开放七大实习专项,百度暑期实习值得冲吗 #
15766次浏览 229人参与
# AI面会问哪些问题? #
29194次浏览 634人参与
# 你做过最难的笔试是哪家公司 #
36092次浏览 316人参与
# 中国电信笔试 #
32407次浏览 302人参与
# 金三银四,你的春招进行到哪个阶段了? #
22587次浏览 284人参与
# 投递几十家公司,到现在0offer,大家都一样吗 #
341255次浏览 2176人参与
# 同bg的你秋招战况如何? #
212267次浏览 1121人参与
# 哪些公司真双非友好? #
69835次浏览 289人参与
# 如何准备秋招 #
78326次浏览 868人参与
# 阿里笔试 #
179479次浏览 1324人参与
# 应届生被毁约被毁意向了怎么办 #
63363次浏览 305人参与
# 机械人避雷的岗位/公司 #
62728次浏览 393人参与
# 小马智行求职进展汇总 #
25151次浏览 80人参与
# 第一份工作一定要去大厂吗 #
15236次浏览 124人参与
# 担心入职之后被发现很菜怎么办 #
291436次浏览 1210人参与
# 为了减少AI幻觉,你注入过哪些设定? #
26333次浏览 310人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务