专业熬夜选手兼养生达人

03-10 18:55 门头沟学院推荐算法

关注

大模型应用开发二面 1h 字节

面试很难，还是要多多练习，感觉自己说不明白业务逻辑
1.写一下attention公式(代码实现了下)
2.训练时为什么要mask，推理时也需要吗?两处有什么区别?推理时的sequencelength和训练时一样吗
3.transformer和传统seg2seg模型有什么区别?
4.计算attention时为什么要除以dk，这个dk的含义是?attention计算时还有哪些scale处理?
5.attention中softmax函数作用、公式、为什么有减去最值的处理?换个函数还能这样处理吗?
6.解释数值上溢、下溢问题
7.讲一下prompt书写的经验，如何判断prompt是否达标何改进prompt
8.讲一下SFT，会对哪部分计算loss?为什么?
9.讲一下deepspeed
10.训练用一个7b模型要占用多少显存?不同zero阶段能够节多少显存?
11.训练模型时用了几张卡，有遇到什么异常中断问题吗?

全部评论

推荐最新楼层

捞的淌口水哦

门头沟学院人工智能

应用问这么多原理吗

点赞回复分享

发布于 03-14 13:29 广东

视频分析方向

重庆邮电大学算法工程师

感觉这不算应用开发吧？

点赞回复分享

发布于 03-13 19:46 北京

04-13 21:33

兰州大学 C++

字节支付1面

1. 自我介绍  你先开始自我介绍一下。  2. C++ 语言基础  能不能简单介绍一下 Lambda 表达式和智能指针？ 在你的实际项目中有没有用到这两个技术？请举例。 为什么那个地方（回调函数）要用 Lambda 表达式去写？（追问） 你在项目开发中是怎么使用智能指针的？  3. 数据结构与 STL  你能说一下 unordered_map 和 map 的底层实现及性能差异吗？ 在量化交易的批量定价场景中，你会优先使用哪一个？理由是什么？ 为什么红黑树的效率（在某些场景下）比哈希低？ 或者换句话说，为什么哈希存储方式的效率要高于红黑树？ 什么场景下必须选择 map 而不能用 unorder...

查看13道真题和解析

点赞评论收藏

分享

04-30 14:39

University of Oxford 测试开发

上海文景测试

笔试(30min)1. 软件的生命周期？2. 黑盒，白盒测试以及灰盒测试的区别？3. 进行软件测试的目的？4. 一个缺陷的提交应该包含那些要素？5. 出现bug如何沟通？6. 测试用例包含那些点？7. 市面上主流的数据库？8. 和开发之间沟通出现分歧如何解决？9. 设计修改密码的测试用例？10. 单元测试和功能/集成测试的区别？面试(20min)1. 自我介绍？2. 现在人在哪里？入职的时间？3. 实习期间测试负责的是一个模块还是整个项目？4. 有没有和客户进行直接的对接？5. 测试过程中怎样进行开展工作？6. 测试过程中和开发接触的多吗？7. 接口测试，功能测试，性能测试详细讲解一下以及区别？8. 如何区分一个bug是前端还是后端的错误？9. 出差接受？10. 反问？

发面经攒人品

点赞评论收藏

分享

04-24 10:35

西安电子科技大学杭州研究院 Java

暑期实习offer帮选淘天vs字节

最近收到了几个offer，纠结选择中，搜索到信息的也感觉褒贬不一，考虑到成长空间和对秋招的帮助，想求助各个大佬给点建议，听听大家的经验1. 阿里淘天，业务技术-原生技术-SRE，三面时说负责服务保障，大促稳定性之类的工作，属于横向部门2. 字节，国际支付-后端架构方向，参与支付业务的后端开发和稳定性保障

我的求职进度条

点赞评论收藏

分享

04-20 12:35

大连理工大学 Java

小红书值得去吗？

 电商和点点哪个好一点

点赞评论收藏

分享

04-19 16:47

四川大学 Java

字节飞书golang一面

·凉经 总时长45min，手撕300.最长递增子序列1.你项目出于什么背景做的？是有关于你之前的实习经历吗？2.介绍一下你刚说的三大功能3.你是如何使用RAG的？4.这里使用RAG和你直接把文档丢给大模型然后搜索，这俩方法有什么区别？5.你提到的安全问题，那么使用RAG给大模型也会存在安全泄露问题，这个如何解决？6.大模型的滑动窗口和其他存储上下文的方法你知道哪些？7.GPT现在支持多长的上下文？(......)8.有些时候我们会处理几万甚至几十万的数据，这样的情况下，现在大模型是如何处理这样超长长度的上下文的？9.你在最近有没有遇到一些在技术上或者项目上比较困难的情况？如何解决的？10.错误码403是什么？404、401呢？5xx的是什么？11.除了java其他语言了解过多少呢？你用python写过代码吗？12.对比一下java和python语言的区别？答：1.首先明确了语言是工具，架构才是核心2.java更适合做web场景下的开发：讲了面向对象、一个是解释型语言一个是编译+解释（JVM内存管理、JTI和多线程那里）3.python适合爬虫大模型推理等场景4.python运行时报错，java编译器可以检查出大部分错误.......13.你刚刚说的内存管理和垃圾回收，python不能做吗？14.JVM内存模型分哪些区域？15.native 方法比如C++的代码是如何运行在JVM中的？（不会）16.内存溢出和内存泄漏？以及常见场景17.讲一下如何解决java多线程的并发安全问题？18.如果加锁会影响性能，这样怎么办？如何解决性能问题？公平换非公平？锁粒度？乐观CAS？读写分离？ 这里我说了好几种优化的情况，不太明白面试官想问什么===========================================================手撕《300.最长递增子序列》没用动态规划，用别的方法做的...10分钟做出来了面试官看起来对手撕的方法不满意，反问，结束。第二天感谢信。

查看18道真题和解析

点赞评论收藏

分享

评论

1

13

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

19253次浏览 170人参与

# 字节开奖 #

149029次浏览 666人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

47377次浏览 513人参与

# 如果春招能重来，我会___ #

20001次浏览 213人参与

# 薪资爆料 #

421748次浏览 2223人参与

# 除了线上，还能去哪些地方投简历 #

11007次浏览 112人参与

# 刚工作的你，踩过哪些坑？ #

46500次浏览 295人参与

# HR问：你期望的薪资是多少？如何回答 #

99164次浏览 830人参与

# 大学四年该怎么过，才不算浪费时间？ #

23719次浏览 104人参与

# 一份好的简历长什么样？ #

41810次浏览 505人参与

# 你面试被问到过哪些不会的问题？ #

122286次浏览 1944人参与

# 今年形式下双非本找得到工作吗 #

328685次浏览 1774人参与

# 诺瓦星云求职进展汇总 #

258859次浏览 1743人参与

# 双非本科求职如何逆袭 #

1646178次浏览 13061人参与

# 你觉得实习能学到东西吗 #

154029次浏览 1493人参与

# 职场破防瞬间 #

381664次浏览 2847人参与

# 你被哪些公司挂了？ #

193112次浏览 1043人参与

# 实习最晚的一次下班是几点 #

35866次浏览 171人参与

# 字节求职进展汇总 #

1845615次浏览 15386人参与

# 26届校招投递进展 #

670170次浏览 3953人参与

# 双非应该如何逆袭？ #

584371次浏览 6377人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务