秋招面经-字节音频算法工程师

2025.9.2 面试时长80分钟17.00~18.20

Docker容器的使用,用来干嘛

C++,多态,虚函数是怎么实现的,底层是怎样的

如果有一个unsigned 32类型数据,我要对其中某位置1,应该怎么实现

QT,信号与槽和回调函数的区别(有很大区别,回答了区别不大,回调一般是一对一,信号与槽可以一对多,发送方只管发送信号且可以跨线程)

stft,窗函数有哪些,都是怎样实现的,分别有什么特点

Transformer,交叉注意力,掩码注意力,自注意力,这集中注意力是怎样实现的,有什么区别

介绍毕设项目,DMCRN,RCAT-UNet

介绍端到端语音增强模型,介绍RCAT-UNet模型内部结构

为什么选时域的端到端模型

模型选用的损失函数是怎么样的

评估语音模型复杂度的指标

语音信号前处理的预加重是什么意思,怎么操作(很久之前看的,模糊记得是加重高频成分,特征提取时比较均衡,蒙对了

介绍实习项目,主要在企业做什么,讲讲模型QAT到板端部署的流程,过程中有没有遇到什么困难(GRU的量化,与重写算子,训练速度极大降低,tflite,tflite-micro,onnx2c的使用)

cnn和rnn两个模型谁的速度快(分点进行了回答,训练和推理两种情况,流式,顺便提了一嘴Mamba加戏)

有没有试过PTQ,PTQ是怎么实现的,进行校准的数据集选取对最终结果的影响(先介绍PTQ原理,数据集的数量选取做了多组实验,讲结果如何,最后于QAT精度对比,损失大)

部署时板端的资源如何,主要在什么设备部署(低计算资源**MB的MCU,嵌入式设备,移动端)

用的是什么精度的量化(INT8),为什么要用这个精度(板端支持,模型理论压缩四倍,推理相比FP32很快,精度损失很小,提供量化指标对比,与浮点模型结果进行对比)

板端推理时候,使用CPU或者使用NPU设备,速度上有什么体现吗,会快多少(NPU比CPU快十多倍左右)

问第二段实习在电科主要做什么工作

介绍传统算法,谱减法,维纳滤波,都是如何实现的(基于噪声,信噪比估计)

了解麦克风阵列算法吗(没做过,只做过天线阵列)

算法题,实现一个卷积算子,输入1234与123,实现卷积输出

#发面经攒人品#
全部评论
请问大佬有后续了吗
点赞 回复 分享
发布于 2025-09-18 08:33 广东
哥 面试前有笔试嘛
点赞 回复 分享
发布于 2025-09-14 10:02 湖北
你好,可以转载到我的公众号上 音频信号处理那些事儿 上吗,会标注转载来源的~
点赞 回复 分享
发布于 2025-09-06 10:10 北京
小哥哥好厉害
点赞 回复 分享
发布于 2025-09-03 19:27 山东

相关推荐

攒人品中,祝大家都能拿到满意的Offer!1.请分享一个你主导或深度参与的、与“算法或数据驱动体验优化”最相关的项目。AI/数据在其中解决了什么关键问题?你如何归因其对核心指标的影响?2.假设要为米哈游的一款新游戏设计一个以“AI NPC”为核心的玩法,你的核心设计理念是什么?它会如何与传统任务系统结合,并创造独特的体验?3.“AI动态关卡”或“AI自适配难度”是前沿方向。请构思一个具体的应用场景,说明AI如何实时调整游戏环境或挑战,为玩家提供“始终处于舒适区边缘”的体验。4.AIGC可大幅加速美术、音频、文案资产的生产。你认为在米哈游的管线中,哪个环节应用AIGC的边际收益最高?请提出具体的产品化工具构想。5.面对开放世界游戏“内容消耗速度快于生产速度”的永恒挑战,AI除了生成静态资产,能否在“生成可玩的动态内容”上发挥作用?请简述一个可行的技术-产品方案框架。6.如何利用玩家行为数据与AI,对游戏的“新手引导”或“经济系统”进行个性化与动态调优,以提升前期留存与长期生态健康?7.对于游戏内的社交与合作玩法,AI可以如何辅助进行队友匹配或行为引导,以提升整体社交体验与团队成功率?8.在不影响竞技公平性的前提下,如何将AI设计为一项增值服务?请阐述其产品形态与付费点设计。9.“AI创作平台”可激发玩家UGC生态。如果面向玩家开放简易的AIGC工具,你认为最关键的产品与社区治理策略是什么?
查看9道真题和解析
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
03-20 23:39
已编辑
因湃电池 信息化 (4035+1700)*18-20 本科双一流
点赞 评论 收藏
分享
评论
5
33
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务