模型端侧部署/AI Agent/嵌入式/前端

就业方向建议
本人背景:双非本西电硕研二
研究方向:模型轻量化(KV Cache),但目前也只是知道在做什么,复现过两篇SOTA论文,还没有自己的idea
项目上:自己做过一些嵌入式和大模型边缘部署的项目,会CMake, shell, gcc交叉编译
10月以为自己会点嵌入式“会点*大模型压缩就可以找AI Infra相关的实习了,实则狠狠打脸,vllm,sglang,CUDA深层次的一个都不会,遂放弃
目前就业方向纠结:模型部署/AI Agent/嵌入式/前端
1.模型端侧部署 发展前景怎么样?场景主要是车厂和工业环境?感觉手机端侧模型的能力很鸡肋。薪资比传统嵌入式高
2. AI Agent RAG RL 目前身边的人都在做这个,但自己现在还不会Java强化学习,焦虑自己进度
3. 嵌入式 一般的厂薪资低上限也低,大疆要求如何?
4. 开发的话今年感觉前端比较缺人,但就要放弃之前的积累,也不知道发展如何
5. 推荐入局算力算子吗
想听听正在秋招和已经就业的学长学姐的看法和建议 #秋招# #大模型# #模型部署# #就业方向#
全部评论
咋样了bro
1 回复 分享
发布于 2025-11-16 23:58 上海
mark同样困惑
点赞 回复 分享
发布于 01-30 23:26 北京
兄弟咋样了,我和你遇到差不多的情况,有点不知道往哪个方向走了
点赞 回复 分享
发布于 01-05 13:22 江苏
我也纠结模型部署和嵌入式linux,但不论选哪一个我都觉得很吃力,更别说两手抓了
点赞 回复 分享
发布于 2025-12-23 23:34 上海
mark
点赞 回复 分享
发布于 2025-12-22 16:10 上海
兄弟怎么说,感觉ai端侧部署还行,退路就选嵌入式linux你觉得咋样呢
点赞 回复 分享
发布于 2025-12-19 19:41 广东
mark
点赞 回复 分享
发布于 2025-12-09 20:26 四川
mark一下
点赞 回复 分享
发布于 2025-12-08 19:40 日本
和我情况好像 有选择了吗兄弟
点赞 回复 分享
发布于 2025-11-29 13:08 江苏
谁说嵌入式工资低的,头部dj 影石都是和互联网一个档次甚至更高
点赞 回复 分享
发布于 2025-11-16 06:13 荷兰
真不感兴趣就直接java了。这行没热情和兴趣,或者先占优势一年很难学下去的。感兴趣可以
点赞 回复 分享
发布于 2025-11-12 21:15 湖南
我现在也是Java转agent 但是这玩意学习瓶颈好大 😂😂
点赞 回复 分享
发布于 2025-11-08 00:42 北京
嵌入式边缘计算考虑过吗世另我
点赞 回复 分享
发布于 2025-11-07 13:57 吉林
世另我啊
点赞 回复 分享
发布于 2025-11-05 15:47 北京

相关推荐

03-11 10:20
门头沟学院 C++
想入门模型部署,问了一下Gemini,他的回答如下,大佬们看看这路径可行吗???第 1-2 个月:打地基(Modern C++ & CMake & Linux)目标:能看懂推理引擎源码,能独立构建多文件 C++ 项目。核心内容:Modern C++:跟着 HKL 视频,重点吃透 智能指针 (RAII)、移动语义 (Move)、Lambda 表达式和简单的模板。CMake:掌握如何链接第三方库(OpenCV, CUDA, TensorRT),学会编写 find_package。CSAPP:重点精读 第 6 章(存储层次)。理解什么是 Cache Latency。里程碑:在 Linux/WSL 下用 CMake 构建一个调用 OpenCV 处理视频流的小项目。手动实现一个包含智能指针管理的简易内存池。📅 第 3 个月:拿手术刀(CUDA 编程入门)目标:理解 GPU 并行逻辑,能手写并优化基础算子。核心内容:核心概念:Thread, Block, Grid, Shared Memory, Warp Shuffle。实战任务:手写一个 矩阵乘法 (GEMM)。版本 1:朴素版(跑通)。版本 2:使用 Shared Memory 优化(速度提升 5-10 倍)。性能分析:学会使用 nsight-systems 查看 Kernel 执行时间。里程碑:手写一个自定义的图像预处理 Kernel(比如把 BGR 转成 RGB 并归一化)。📅 第 4 个月:炼金术(模型转换与 TensorRT)目标:把 PyTorch 模型变成 1660 Ti 上的极致推理引擎。核心内容:ONNX:学习如何导出 ONNX,如何用 onnx-simplifier 简化模型。TensorRT:掌握 trtexec 工具,学习编写 TensorRT 的 C++ API 推理代码(创建 Runtime、Engine、Context)。插件编写:尝试为一个 TensorRT 不支持的算子写一个 CUDA Plugin。里程碑:将 YOLOv8 导出为 TensorRT 引擎,并在 1660 Ti 上跑到极致 FPS。📅 第 5 个月:工业化(量化与性能压榨)目标:攻克部署最难的一环——精度与速度的平衡。核心内容:量化原理:学习对称量化 vs 非对称量化,理解 KL 散度。PTQ 实战:使用 TensorRT 的 Int8EntropyCalibrator 进行训练后量化。多线程部署:学习 C++ std::thread 或生产消费者模型,实现“视频读取-模型推理-结果渲染”的异步并行流水线。里程碑:完成一个低延迟、多线程的实时检测系统,对比 FP16 和 INT8 的精度损失与速度提升。📅 第 6 个月:破圈与冲刺(国产迁移 & 算法 & 面试)目标:将能力迁移,准备实习面试。核心内容:国产迁移:如果有条件,借或买一个 RK3588 开发板,学习 RKNN-Toolkit。你会发现,因为你有了前 5 个月的底子,这部分 2 周就能上手。算法刷题:每天 1-2 道 LeetCode,重点是数组、链表、排序。八股文复习:回顾 C++ 内存模型、操作系统基础。里程碑:整理简历,把“手写 CUDA Kernel 优化”、“TensorRT INT8 量化实战”作为核心项目写上去。
秋招白月光
点赞 评论 收藏
分享
评论
4
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务