一只爱飞翔的猪

2024-08-28 12:18 已编辑北京理工大学算法工程师发布于北京

关注

传统cv想做多模态

目前是研一，马上研二。
只做过传统的cv，用过YOLO，做过人体关键点检测，图像分割，图像分类之类的内容。
nlp只做过比较简单的，像用RNN做文本分类，文本生成。
没做过文生图和图生文以及图生图。
目前想找多模态的实习，不知道应该如何准备。
感谢大佬在评论区指点！
大概有个方向了，还有个小小的疑问，只学理论不跑代码能找到多模态的实习吗？
或者有没有合适的练手开源项目推荐。

全部评论

推荐最新楼层

有礼貌的打工鸭a

清华大学算法工程师

从clip到bilp系列 flamingo llava系列 cogvlm系列 internvl系列都看一遍

8 回复分享

发布于 2024-08-27 08:57 广东

北京科技大学算法工程师

可以看一下Rocky撰写的《三年面试五年模拟》系列文章

1 回复分享

发布于 2024-08-28 10:09 浙江

退学转码_校招咨询

中国科学技术大学算法工程师

秋招？

点赞回复分享

发布于 2024-08-25 11:07 北京

03-27 11:08

广西大学算法工程师

百度 AI Agent 开发二面

1. 如果让你从 0 到 1 设计一个企业级 Agent 平台，你会怎么划分 Planner、Memory、Tool、Knowledge、Runtime、Evaluation 这几个模块？边界怎么定？我一般不会按“大模型功能”来拆，而是按“责任是否稳定”来拆。Planner 只负责决定下一步做什么，不负责真正执行；Tool 只负责把外部能力标准化，不参与推理；Knowledge 负责把文档、结构化数据、权限和索引组织成可检索资产；Memory 只存跨步、跨轮、跨会话还需要被引用的信息；Runtime 负责状态推进、超时、重试、回放和观测；Evaluation 则独立出来，不跟在线链路耦合，因为...

AI-Agent面试实战...

点赞评论收藏

分享

03-08 15:30

门头沟学院推荐算法

科大讯飞大模型算法实习一面 50min

攒人品中～～1.介绍 Lora 的思想，为什么有效2.DPO 的数据集来源3.PPO 和 GRPO 的区别（损失函数的 clip 作用）4.什么是大模型的幻觉，大模型解决幻觉的方式有哪些5.为什么降低温度能缓解幻觉6.你项目中 system prompt 和 user prompt 的区别7.DeepSpeed zero-3 有什么改进8.verl 和 vllm 你是怎么配合的，每个在项目中的作用9.手撕：LCR 076 数组中的第 K 个最大元素

点赞评论收藏

分享

03-26 13:09

广西大学算法工程师

信雅达 AI Agent开发二面

1. 你做过的 Agent 项目里，Agent 和普通问答系统最大的区别是什么？普通问答系统更多是输入一个问题，模型生成一个回答，核心在回答质量。Agent 更强调任务闭环，不只是回答，还要规划步骤、调用工具、拿到结果、根据结果继续下一步，最后把任务完成。也就是说，问答系统重点是“说”，Agent 重点是“做”。如果项目里接了数据库查询、知识库检索、接口调用、审批流或者脚本执行，那基本就已经不是单纯的聊天系统了。2. 你怎么理解 Agent 的核心组成？一个完整的 Agent 一般包括模型、Prompt、工具、记忆、规划、执行控制这几部分。模型负责理解和推理，Prompt 负责约束行为，工具负...

AI-Agent面试实战...

点赞评论收藏

分享

03-16 22:09

已编辑

山东大学（威海）嵌入式软件工程师

南京机器人开发面

背景：9本28届机器人专业感觉小厂更看重你的综合项目能力，做过什么，中大厂应该就规范一些，八股，手撕，拷打简历下面是这次的面经，主要还是问项目（之前的贴子有简历，欢迎投票指正）1. 之前聊到PID，轮腿控制是两轮平衡车那种类型吗？讲讲你们具体PID的应用2. 这套轮腿设备是你自己做的吗？整体方案介绍3. 你对IMU的数据处理，尤其是陀螺仪部分应该很熟悉吧？你的处理流程是什么？4. 那你后面也搞过小车的建图导航吧？具体讲讲5. 那常见的建图导航算法你应该都用过吧？6. 那你们的机械臂，是用开源的还是自己做的？7. 那机械臂的正逆解这块你也有经验吗？原理代码都熟悉吗？8. 那你们用的机械臂是什么形式的，几轴的？9. 那你在AI方面有了解吗？10. 那你自己也能做模型训练是吧？YOLO掌握到什么程度，有做过什么东西吗？11. 那深度相机你们用得熟练吗？熟悉到什么程度反问：1.公司主营业务2.简历问题3.我的半桶水水平有多少4.企业更看重什么能力5.南京机器人相关公司情况怎么样，就业前景和生活体验以及人才引进政策呢？感觉自己的不足：面试一开始容易紧张，每次说自己的个人信息和比赛，项目经历都口吃，应该整理文字版，逻辑清晰念熟练

查看11道真题和解析

点赞评论收藏

分享

03-14 09:56

广西大学算法工程师

科大讯飞 AI Agent 二面

1、自我介绍2、做了一个企业知识库 + 办公助手 Agent的项目3、Agent 和传统聊天机器人最大的区别是什么传统聊天机器人更多是围绕对话生成展开，本质上是“用户问一句，模型答一句”。AI Agent 不只是回答，它还要理解目标、拆分任务、决定下一步动作，并且在必要时调用外部工具完成任务。所以 Agent 更强调“决策能力”和“执行能力”，而不是单纯的生成能力。比如用户问“请假流程是什么”，这更像知识问答；如果用户说“帮我查一下我下周一有没有会，如果没有就给我安排一个项目同步会”，这就不是普通聊天了，因为它涉及状态判断、调用日历工具、执行会议创建等一系列动作，这才更符合 Agent 的定义...

AI-Agent面试实战...

点赞评论收藏

分享

评论

2

19

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 面试被问到不会的问题，你怎么应对？ #

16124次浏览 339人参与

# uu们，春招你还来吗？ #

56635次浏览 464人参与

# 招商银行数字金融训练营 #

105494次浏览 915人参与

# 你见过哪些招聘隐形歧视？ #

16335次浏览 145人参与

# 面试中，你被问过哪些奇葩问题？ #

93431次浏览 1024人参与

# 你觉得大几开始实习最合适？ #

19660次浏览 207人参与

# 厦门银行科技岗值不值得投 #

14879次浏览 351人参与

# 25届网易互娱暑实进度 #

102584次浏览 784人参与

# 字节开奖 #

138880次浏览 625人参与

# 你都用vibe coding做过什么？ #

13249次浏览 567人参与

# AI Coding实战技巧 #

9612次浏览 222人参与

# 做完笔试后你收到面试了吗？ #

19295次浏览 196人参与

# 恒生电子笔试 #

19342次浏览 153人参与

# 哪个瞬间让你对大厂祛魅了？ #

593156次浏览 3746人参与

# 你现在一天AI几次？ #

7802次浏览 106人参与

# 找工作，你会甘心进小厂还是猛冲大厂 #

874825次浏览 7009人参与

# Vibe Coding 会干掉初级岗位吗？ #

15133次浏览 186人参与

# 哪些公司在招寒假实习？ #

89373次浏览 758人参与

# 大厂实习和小厂实习最大的区别是什么？ #

32458次浏览 233人参与

# 如果人生可以debug你会改哪一行? #

7019次浏览 119人参与

# 面试吐槽bot #

186106次浏览 909人参与

# 牛友の3月总结 #

19711次浏览 174人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务