日常实习| AudioLLM 研究员| 米哈游| 内推

内推码:J4VQ9

岗位链接:链接

岗位名称:AudioLLM 研究员

投递的时候,请填写内推码,方便我跟进后续流程;实习岗位一般至少5个工作日才有进度更新,请耐心等候;

也欢迎同学们内部相互推荐,实习相对比较容易拿到米哈游的offer

工作职责

专注于AudioLLM通用音频理解模型的研究与开发,参与构建下一代音频基础模型和Omni多模态框架,探索语音、音乐、环境声音等多模态音频内容的统一理解建模方法,推动 audio AI 在理解、生成和交互场景中的技术突破。

核心职责:

  1. 模型架构与训练:负责通用音频理解模型设计与分布式训练优化,实现语音识别、情感分析、音频问答、音乐理解、声音事件检测等多任务统一建模
  2. 数据管线:设计并落地大规模多模态音频数据 pipeline,完成数据对齐、质量控制与自动标注
  3. 跨模态融合:研究音频编码器与大语言模型融合技术,优化跨模态注意力与统一特征表示

任职要求

  1. 计算机科学、人工智能、电子工程等相关博士学历

  2. 具备大模型(LLM 或多模态)训练经验,熟悉 Transformer 架构与大规模分布式训练

  3. 深入掌握以下至少一方向

    • 通用音频自监督表征,如 Best-RQ, CLAP, wav2vec bert2.0 等

    • Omni模型架构和多模态RL

    • 语音识别/情感识别/音乐信息检索算法

  4. 精通 Pytorch,具备海量数据处理经验

  5. 具备跨时区协作与良好沟通能力,结果导向,责任心强

加分项

  1. 在 NeurIPS/ICML/ICASSP/ISMIR 等顶级会议发表论文
  2. 负责过百万小时级多类型音频数据管理
  3. 拥有音频文本跨模态对齐、指令微调或多任务学习实践
  4. 在音频 AI 或音乐 AI 领域有开源贡献或技术影响力

alt

#llm##实习##内推##mihoyo#
全部评论

相关推荐

10-24 17:18
已编辑
南京大学 Java
前几天面的,近段时间零零碎碎的事情蛮多的,没心思更新,今天抽空写一下面经。岗位:Java开发10.17一面时长: 30min左右 + 25min手撕纯八股,后面手撕两个题目面试平台: 钉钉面试前面试官加vx沟通面试相关事宜自我介绍稍微聊了下简历上的两个项目(没深问)然后开始拷打八股:- Spring & SpringBoot 的区别- 有哪些注解- 说说自动装配- Bean的生命周期- 怎么避免循环依赖- 启动的时候如果遇到循环依赖,此时应该怎么解决(上一问答得不好,只说了三级缓存,面试官不是很满意,这里想引导一下的,奈何lz确实不知道...)- 线程池核心参数- 结合这些参数说一下线程池的工作流程- HashMap扩容机制- 两个数据的哈希值一样会放到一个数组下标下么?介绍下元素放入HashMap的过程- ThreadLocal介绍下- ThreadLocal底层原理- 强引用,软引用,弱引用,虚引用 介绍下- ThreadLocal里面的key & value分别是哪些引用- ThreadLocal内存泄漏问题- redis基本数据结构- 有list为啥还要zset? 你觉得他俩有什么区别(回了说元素的唯一性,面试官也想听这个...)- 缓存雪崩& 缓存穿透以及对应的解决方案- 布隆过滤器的一些实现细节(这里拷打挺细的)- redis集群有哪些节点,讲常见的即可(分布式这块准备的不是很充分,答不上来)- 分布式锁了解么?- 公平锁 & 非公平锁- ReentrantLock里面咋实现公平锁& 非公平锁的(没答上来,面试官说答不上来没事,确实有点细,不知道也正常)然后聊了会天,主要是关于AI的:- AI这块用过啥么? (回了RAG,上学期团队合作做过一个简单的RAG系统)- 细说下你了解的RAG- 为什么要有RAG(RAG的好处)反问了一下技术栈以及反馈时间,说是半小时内给结果。然后发邮件过来手撕两个题目。1. hot100滑动窗口最大值(lc239), 不过题面描述略有差异2. lc1189,一开始以为是原创的,后面找了下发现lc上有,是easy难度。不过加了个要求:时间复杂度要求O(n),空间复杂度要求O(1)  当时就用了桶计数的方式写了,不知道对不对。反思:被面试官评价基础不错,但是框架部分不太行。 其实问的不难,奈何部分问题确实没准备到,给我机会我也把握不住目前“评估”这一步是过了,不过快一周了还是“面试中”,也没有后续约面,昨天找面试官看看进度,面试官说有空问问,结果到现在也没回。感觉应该是挂了,但确实是自己能力不太够,挂了也无话可说。不过整个面试过程是秋招至今最好的一次,面试官非常nice,交流过程非常愉快的,有的地方还给建议说应该怎么回答会更加分,讲的一般的地方也会给点提示引导你重新回答,真的很赞;面完之后还给了点复习建议,让我好好准备后面的面试。10.24更新第二次找面试官问问情况,被暗示应该是挂了。哎不是,那你倒是把我流程结束一下啊😅,现在搞得想投别的部门的实习都投不了
查看56道真题和解析
点赞 评论 收藏
分享
10-13 18:01
已编辑
门头沟学院 Java
bg:双非硕,一段小公司实习经历面试氛围整体来说还行,总时长 50min,前面项目和基础答的还好,但自己算法太菜,手撕没写出来。1 自我介绍2 问读研期间做什么方向,目前实习所做的工作对科研有什么帮助?3 为什么选择Java开发?未来你想走什么路线发展?4 科研方面遇到的问题,你是怎么去解决的?对你以后的工作有什么帮助?5 挑一个项目进行介绍6 为什么要采用Redis,而不用其他的缓存方法呢,例如,本地缓存?7 在项目中用到了Redis的哪些数据结构?缓存了什么数据?8 Redis的操作是单线程还是多线程?9 项目中使用到了分布式锁,你是如何实现的?那么Redis实现分布式的底层原理是什么?10 你设计的分布式锁是否会造成死锁现象?如果锁过期了,如何解决?11 如果你缓存的数据key过期了,会发生什么情况?12 缓存雪崩、缓存穿透和缓存击穿又是如何解决的?13 布隆过滤器你有了解吗?底层是如何实现的?为什么要使用位图?14 Spring的源码你有看吗?能讲讲IOC和AOP的思想吗?15 在你项目中用到了哪些设计模式?(单例模式,观察者模式,代理模式,模板模式)16 你能讲一下Spring的Bean的生命周期吗?17 类的加载机制是怎么样的?为什么采用双亲委派加载机制?18 如果出现了循环依赖情况,你会如何解决呢?19 Java的内存模型你有了解吗?每个区域有什么作用?20 有哪些区域是不会发出内存溢出现象的?21 Java中的GC操作你了解吗?发生GC时,有哪些数据会被回收掉?调用system.gc()方法是一定会发生GC操作吗?22 Java的垃圾回收器能讲一下吗?CMS和G1的区别是什么?23 分代垃圾回收器中,新生代、老年代、元空间分配是怎么样的?24 Java的垃圾回收算法有哪些?分别在什么情况下使用?25 如果有一个大对象要被回收,它的回收过程你能讲一下吗?算法题:给一个桌子序列,一个团体序列,求出如何分配桌子和团体座位实现价值收益最大化。(思路:倒序 + 双指针)【没A出来,在面试官提示下讲了自己的想法和思路】反问了3个问题。注:如果通过全部面试,需要选一个时间段进行7天实习,实习完,leader评分后,HR才看是否发offer。第二天挂#
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务