腾讯多模态大模型算法实习二面 40min

1.最近有尝试什么新想法吗?有没有试过 vision encoder 的桥接。
2.ppu 是什么卡?自己有测试过性能和其他卡的对比吗?需要手写 cuda 吗
3.介绍一下多模态长视频扩展方法,如何在现有模型上改,比如 llava?
4.有考虑音频融合吗?新增一个音频模态你会怎么考虑?

5.手撕: 编辑距离
全部评论

相关推荐

为什么推荐AI Agent项目?符合当前最热趋势:AI正在从“聊天工具”向“自主行动的主体”演进。AI Agent(智能体)能理解目标、调用工具并完成任务,是2026年最被关注的方向之一。例如,可以用Agent一键点奶茶、处理工作流或运营社交账号。“人人可做”正成为现实:开发门槛因工具成熟而大幅降低。利用 OpenClaw 这类开源项目或国内大厂推出的低代码平台(如阿里的“通义千问”、字节的“火山引擎”),普通人通过自然语言描述也能快速搭建AI应用。实用价值高,场景广泛:无论是个人的自动信息处理、办公自动化,还是小团队的垂直业务(如电商客服、内容生成),AI Agent都能直接提升效率,甚至催生“一人公司”模式。💡 一个具体的入门项目:自动工作流助手你可以从构建一个能帮你自动处理日常信息并执行任务的AI Agent开始。例如,一个能自动阅读指定邮件或消息,提取关键信息(如会议时间、待办事项),并帮你添加到日历或生成待办清单的智能助手。所需工具:你可以使用 LangChain、CrewAI 等开源框架,它们提供了组装Agent的模块。核心能力:让AI学会调用日历API、邮件API或笔记软件接口。学习路径:可以参考Scaler平台发布的《2026生成式AI路线图》,其中第8阶段专门讲解如何构建AI Agent系统。
推荐一个值得做的AI项目
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务