博彦科技大模型 prompt 日常实习一面

1、自我介绍
2、rag 的检索原理
3、哪些大模型在图像和表格方面比较好
4、大模型怎么解析图像和表格
5、对 mcp 的理解
6、对 prompt 的理解
7、对 workFlow 的理解
8、项目展示#牛客AI配图神器#
全部评论
请问佬这个岗位对技术要求高吗
点赞 回复 分享
发布于 05-18 20:24 上海

相关推荐

05-19 16:19
门头沟学院 Java
凉,原因是自己答得不是非常好以及他们要求学历是杭电及以上学历待遇可以1. 反射知道吗,你说一下2. hashmap的底层结构3. hashtable知道吗4. hash方法是如何优化的5. 多少会转为红黑树6. 为什么要用高16位和低16位异或7. 那他是怎么插入槽的,做了什么优化,过程说一下8. 是怎么实现一个去重的9. concurrentHashMap了解吗10. 那分段锁里面是怎么实现的11. cas+synchronized是如何操作,为什么要这样呢,先详细说一下cas12. 是怎么上锁的呢(这里我说是对对象,他说是吗,这样不是整个锁住了吗)13. JVM的内存结构说一下14. 线程池的那个参数说一下15. 拒绝策略有哪些16. redis的aof重写说一下17. mysql的行锁说一下18. 为什么里面用b+树19. 索引失效情况有哪些(没答完全)20. 索引覆盖是什么21. 索引下推讲讲22. redission的看门狗机制说一下23. redis里面的数据你是怎么与数据库同步(定时)24. volatile25. 如果我要求强一致性,然后每隔10秒进行一次同步,但是其中这个业务进行时间大于10秒了怎么办(消息队列,多线程去处理)26. lua脚本执行到一半中断,比如redis宕机,这个时候会回滚吗27. acid说一下28. 异常处理机制29. synchronized的底层原理30. reentrantlock的原理,他底层是怎么实现的
丰川打工祥:不会是智晟未来吧。这是家培训公司。3300+500绩效+免费住宿。工作是给别人面试,没什么编码机会。可以仔细想想要不要去。
查看30道真题和解析
点赞 评论 收藏
分享
1. 基础概念题:什么是大模型核心加速技术中的 “算子融合”?举例说明其作用。答案要点:算子融合是将多个连续计算算子合并为一个,减少计算图中的节点数和显存读写次数,降低延迟。举例:如将 Transformer 中的 Add(残差连接)与 RMSNorm(归一化)融合,减少两次内存访问,提升推理速度。2. 技术原理题:Flash Attention V2 如何优化注意力计算效率?与 V1 的核心区别是什么?答案要点:• V1:通过分块计算注意力,减少显存占用(避免存储所有中间键值对)。• V2:引入 “内外循环交换策略”,将矩阵乘法的循环顺序调整为更适合 GPU 并行计算的模式,进一步提升计算效率,尤其在长序列场景下加速明显。3. 量化技术中,FP8、INT4 AWQ、INT4-FP8 AWQ 的适用场景和压缩率有何差异?4. RAG 系统中,文档切分粒度如何影响检索和生成效果?实际中如何确定最优粒度?5.在长序列推理场景中,PagedAttention 和 Prefix Caching 分别解决什么问题?如何配合使用?答案要点:• PagedAttention:将 KV Cache 分块存储在非连续显存中,避免显存碎片,支持处理超长序列(如百万 Token);• Prefix Caching:缓存历史对话的 KV 对,跨请求复用,减少重复计算(如多轮对话中复用上文缓存)。配合逻辑:PagedAttention 解决显存限制,Prefix Caching 减少计算量,两者结合可提升长对话场景的效率和稳定性。6. 在企业级推理场景中,如何根据需求选择量化方案?举例说明短文本高并发和长文本场景的优化策略。实时客服系统用 INT4 量化加速响应;金融报告生成场景用 FP8+PagedAttention 处理数千 Token 输入。
点赞 评论 收藏
分享
评论
4
11
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务