科大讯飞大模型算法一面 业务拷打

发点面经攒攒人品~
1.实习拷打
2. 论文拷打
3.有什么涉及的具体的应用吗
4.我看里面上写上面写了一些知识图谱的一个构建说一下这个这个任务的一个输入和输出吧,大概你用到了什么数据,然后什么模型去产出什么样的一个东西
5.你这个图谱里边都有哪些类型的实体?关系是怎么定义的
6.你用了BERT去做实体识别哈,那为啥用BERT呢?能不能直接用个BiLSTM搞定
5.我看你提到了LayerNorm,这块为啥要用个条件LayerNorm有什么作用
6.说一下transformer的底层结构吧
7.Transformer为什么用了LayerNorm呢
8.你说你做了一个Multi-Head Self-Attention,那注意力权重那部分你还记得公式是咋算的吗?
9.说一下LoRA原理
10.刚才提到用LoRA做参数高效微调的必要性,那如果不是用LoRA,而是做全参数微调,那会消耗多少显存,比如说我以一个7B规模的大语言模型为例
11.说说现在千问里有哪些主流的大模型结构
12.项目拷打
13.那你们这个DAG 图是怎么构建的?根因节点怎么推出来的
全部评论
刚开始准备找实习,请问大佬这些东西都是在哪学啊😭大学摆烂了四年
点赞 回复 分享
发布于 03-27 10:18 黑龙江
最后捅过了吗
点赞 回复 分享
发布于 03-26 23:05 北京
问的还挺多,过了吗
点赞 回复 分享
发布于 03-25 23:03 北京

相关推荐

04-08 17:10
门头沟学院 Java
给我面麻了,发下面经攒攒人品1.TCP/IP 协议有几层?TCP 属于哪一层?TCP 是基于 IP 的,还是 IP 是基于 TCP 的?2.HTTP/HTTPS区别3.SSL/TLS工作原理4.Java 里面 ArrayList 和 LinkedList 有什么区别?5.JVM 的内存结构包括哪几个区?6.你对软件开发过程有了解吗?7.在软件开发流程里,如果想用 AI 提效,你觉得哪些环节可以做?8.监督学习和非监督学习有什么区别?9.所有大模型都支持工具调用吗?10.常用模型里,比如 GPT,支持工具调用吗?11.Claude 用过吗?是否支持工具调用?12.什么是 Skill?13.为什么它能节省上下文?14.它检索到的“相关部分”具体是什么?15.如果装了很多个 skill,llm怎么知道该用哪个?16.如果把所有 skill 都打开看,那上下文是不是就会爆掉?17.你知不知道什么是渐进式加载?18.function call 的原理你知道吗?19.大模型是怎么去调用 function call、又是怎么执行的?20.比如我本地写了一个 Java 进程并配好了入参、出参和描述,大模型会直接去运行这个 Java 函数吗?21.MCP 是一种协议吗?22.A2A 这种协议你听说过吗?是什么23.MCP 是什么,是控制什么的?24.你说 MCP 可以决定调用哪个方法,这里的“决定”是指大模型决定吗?25.你刚刚说的 MCP 和 A2A,它们分别是做什么的?区别是什么?26.实习里多 Agent / 单 Agent 取舍,你们做成多 Agent 之后,这个方案还有什么问题吗?系统还有没有什么问题?27.你自己有没有在业余用 AI 做一些东西?28.你平时有没有通过一些比较官方的渠道去了解 AI 的进展?29.Claude 这个模型你知道吗?30.Claude 最新版本现在是多少?31.GPT 最新版本是多少?32.GPT 5.4 和 5.3 有什么区别?33.Claude 4.6 现在的上下文长度是多少?
点赞 评论 收藏
分享
评论
1
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务