【淘天集团】团队实习生-Agent研发/算法实习生招聘

招Agent研发工程师(后端、前端、测试和客户端等)、Agent优化工程师(算法)
💼 岗位描述
在这里,你将参与智能Agent在电商场景中的创新实践,与团队协作探索如何用AI技术切实提升商家经营效率。
我们是淘天集团服务千万商家的核心技术引擎,曾打造千牛工作台、生意管家、淘宝开放平台、聚石塔等影响行业的标杆产品。如今,我们正经历一场突破性跃迁:从“交付工具”到“交付Agent"——不再让商家操作工具,而是让智能Agent主动驱动经营全流程!
✨ 我们正在创造什么?
● 🤖 打造电商专用Agent OS构建端云一体的千牛Agent产品(支持本地代理+云端沙箱),通过记忆建模、任务规划、决策推理等核心算法与高安全运行时框架,让Agent化身“数字店长”,自主完成商品上新、客服接待、营销策划等全链路作业。
● 🌱 孵化万级Skill生态设计Skill智能调度与效果优化算法,结合AI PaaS安全集成能力,将客服、数据分析、内容生成等场景抽象为标准化Skill,共建“电商Skill应用市场”。
● 🎨 定义AI Native交互新标准研发A2UI(AI to UI)生成算法与交互框架,实现自然语言指令到经营界面的精准映射与秒级生成,让“所想即所得”成为现实。
● 🔄 驱动研发与算法范式升级构建Skill效果自动化评测-在线学习-AB测试闭环,全面落地AI Coding、AI CR、AI运维,用技术与算法双轮驱动持续提效,让Agent越用越聪明,让工程师专注创造。
🔥 你将直面这些挑战
● 如何设计轻量高效的Agent记忆压缩与检索算法,在有限资源下实现个性化经营知识的精准调用?
● 如何构建电商领域任务规划与决策推理框架,让Agent在复杂业务流中自主拆解目标、动态调整策略?
● 如何将千亿级电商数据转化为高质量训练语料与结构化知识库,优化RAG系统召回率与生成质量?
● 如何设计Skill效果量化评测体系与在线学习机制,结合强化学习实现Agent能力的持续进化?
● 如何在高并发场景下平衡算法精度与推理延迟,通过模型蒸馏、缓存策略等技术保障大促期间体验流畅?
● 如何设计高安全沙箱与工具网关,保障百万级商家数据在生态Skill调用中的安全?
● 如何构建个性化Agent记忆体系,让每个Agent深度理解行业特性、品牌调性与店长习惯?
● 如何通过领域建模与商家主数据引擎,将海量电商数据转化为Agent可理解的“经营知识库”?
● 如何在双十一大促百万QPS场景下,保障商家Agent服务的高可用、低延迟与稳定性?
● 如何为生态开发者提供开箱即用的Skill开发、托管与评测能力,激发万级应用创新?
🎯 加入后,你将
● 主导Agent核心算法模块(记忆管理、任务规划、决策推理)与运行时框架(上下文压缩、长短期记忆)的研发,设计高鲁棒性方案;
● 深耕商品管理、智能客服、营销策划等场景,将业务逻辑转化为高性能Skill算法(如对话策略优化、文案生成)或高可用Skill服务;
● 构建Skill工具链(自动化评测、Prompt优化、小样本训练)并参与AI PaaS平台建设,赋能生态开发者高效迭代;
● 与产品、业务专家深度协作,通过AB实验与数据洞察驱动迭代,从0到1验证Agent产品价值。
🌱 你将获得
● 技术成长:在亿级真实业务场景中锤炼“算法设计-训练-部署-优化”全链路能力或高并发架构能力,积累宝贵的Agent工程实践经验;
● 资源支持:你将能够直接使用当前最前沿的大模型矩阵,提供充足的Token与专属算力集群,为创新实验全程护航;
● 业务视野:深度理解电商全链路逻辑,培养“技术×商业”与“算法×商业”双轮驱动思维;
● 成长体系:资深导师1对1带教 + AI Coding全流程实践 + 定期技术沙龙,加速能力跃迁;
● 真实价值:你的算法与代码将直接助力百万“一人店铺”降本增效,让乡村手艺人、原创设计师因智能而专注创造,共同守护淘宝“新奇、温暖、好玩”的商业生态。

❤️ 为什么选择我们?
“让天下没有难做的生意”不是口号——当你设计的记忆算法让乡村手艺人轻松复用经营经验,当你编写的Agent帮助产业带商家专注货品供给作而非琐碎运营,当你优化的营销Skill一键生成爆款文案,当你搭建的Skill平台让开发者创意自由生长……你将真切感受到:技术的温度,正在悄然改变千万商家的日常。
我们寻找的不是“刷题高手”或“完美简历”,而是眼里有光、心里有火的算法与技术梦想家。如果你渴望站在AI与实体经济的交汇点,用扎实的技术与算法能力创造真实价值——点击投递,和我们一起,让淘宝因“技术”的善意与“人”的多样性而更美好!淘天技术部-商家&开放平台技术团队 期待与你共创未来

📌 岗位要求
💻(一)AI Agent研发方向
📚 学历与专业
● 本科及以上学历,计算机、软件工程、人工智能、数据科学等相关专业。
⚙️ 技术能力
● 扎实的计算机基础(数据结构、算法、操作系统、网络),精通Java/Go/Python至少一门语言;
● 了解分布式系统核心概念(微服务、缓存、消息队列),对高并发、高可用系统有热情;
● 对AI技术有好奇心:熟悉Agent技术栈(RAG、Prompt Engineering、Agent Memory等),了解LangChain、Semantic Kernel等框架者优先;
● 有使用AI编程助手(通义灵码、Cursor等)辅助开发经验,认同"AI for Engineering"理念;
● 具备CV/NLP基础,了解大模型算法,有模型训练(SFT、RL)经验者优先。
🌟 实战经验(满足任一即亮眼)
● 参与过Agent/Skill开发、大模型应用、云原生项目或开源贡献;
● 在ACM、Kaggle、天池等竞赛中获奖,或拥有技术博客/专利;
● 熟悉前端框架(React/Vue)并对A2UI交互设计有实践思考;
● 有电商、SaaS、开放平台相关项目经验。
💡 综合素质
● 技术理想主义:思考“技术如何创造真实价值”;
● 用户视角:能共情商家痛点,关注产品体验;
● 成长型思维:乐于在模糊地带探索,主动学习新方向;
● 协作与担当:逻辑清晰,善于沟通,愿与团队共担目标。

🧠(二)AI Agent优化方向
📚 学历与专业
● 本科及以上学历,人工智能、机器学习、计算机科学、数据科学等相关专业,具备扎实的数学与算法理论基础。
⚙️ 算法与工程能力
● 精通Python,具备扎实的数据结构与算法功底,能高效实现复杂算法逻辑;
● 深入理解Agent核心技术栈:熟悉RAG优化、Prompt Engineering、记忆机制、任务规划、MCP/A2A协议等,有LangChain/Semantic Kernel等框架实战经验者优先;
● 具备大模型应用算法经验:熟悉SFT、RLHF/DPO、模型蒸馏、推理加速等技术,在NLP/CV/多模态方向有项目实践;
● 掌握算法工程化能力:了解模型服务化(TensorRT、vLLM)、AB测试、效果归因分析,对高并发场景下的算法稳定性有敏感度;
● 有使用AI工具(通义灵码等)辅助开发经验,践行"AI for Engineering"理念。
🌟 实战经验(满足任一即亮眼)
● 参与Agent核心算法研发(记忆/规划/决策)、大模型应用优化、Skill效果提升等项目;
● 在ACM、Kaggle、天池等竞赛中获奖,或在ACL、KDD、WWW等顶会发表相关论文;
● 有电商、SaaS、开放平台领域算法项目经验,或对商品理解、营销生成、客服对话等场景有深度思考;
● 开源贡献:在HuggingFace、ModelScope等平台发布高质量算法模型或工具。
💡 综合素质
● 算法价值导向:持续追问“算法如何解决真实商家痛点”;
● 极致效果意识:对生成质量、推理逻辑、用户体验有敏锐洞察;
● 探索型思维:乐于追踪Agent前沿进展,主动学习;
● 协同共创力:逻辑清晰,善于将业务语言转化为算法方案。

📮 投递指南
📍 工作地点:杭州 👉 立即投递:联系我,期待与你携手,用代码与算法,温暖千万商家的经营日常 🌼。
#互联网实习##实习##面试##大厂实习#
全部评论
可帮看简历和提供简历修改建议
点赞 回复 分享
发布于 03-13 11:49 浙江

相关推荐

多智能体系统(Multi-Agent Systems)让一群AI Agent分工协作,看起来效率很高,但实际落地时,单个Agent的问题会被成倍放大:流程容易卡死、幻觉连锁传播、Token成本失控。以下是2026年生产环境中最常见的6个坑,以及对应的避开方法。1. 所有Agent都用同一个大模型现象:规划层、执行层、审计层统一用同一个强模型(比如全用Claude 3.5或Grok 4)。为什么坑大:思考能力强的模型被用来跑简单工具调用,Token成本直接拉高;同时不同Agent的输出风格互相干扰,幻觉更容易在链路中放大。避法:分层选模型。规划层(Supervisor)用思考强的模型,执行层Worker换更快、更便宜的专用模型(Qwen3、DeepSeek等)。混合使用能把整体Token成本降低约70%,每个Agent也更专注自己的角色。2. 只靠Prompt记录历史,不做状态管理现象:Agent之间的对话历史直接塞进Prompt,让它们“自己记住就行”。为什么坑大:任务稍长或出现分支,上下文就混乱,前面的决策后面被遗忘,或者重复执行无效步骤。避法:必须采用有状态的图结构(Stateful Graph)或Checkpoint机制。LangGraph在这方面做得成熟,每一步状态都能持久化、回溯和调试。不要把全部记忆压在Prompt上,那不是生产级做法。3. 缺少Verifier和人工干预节点现象:Agent数量增多后,一个Worker的幻觉直接传给后面的分析和写作Agent,最终输出看着合理,实际使用就出问题。为什么坑大:错误在链路中快速传导,生产环境风险极高。避法:在关键节点强制加入Verifier Agent,专门负责事实检查和一致性校验。同时在高风险步骤保留Human-in-the-Loop(人工审核点)。2026年成熟系统几乎都会在全自动链路中加把关机制。4. 工具集成和Agent间通信全靠自定义胶水代码现象:自己手写代码去连接工具、传递消息。为什么坑大:维护成本高,换框架或需要扩展时要重写大量代码。避法:优先采用标准协议。MCP(Model Context Protocol)让Agent以统一方式发现和使用工具,像插统一的“USB接口”一样接入浏览器、API、数据库。A2A(Agent-to-Agent Protocol)负责Agent之间标准发现和委托任务。2026年主流框架都在支持这两个协议,用它们能大幅减少自定义代码,系统也更容易跨框架扩展。5. 一上来就用完全去中心化的Swarm模式现象:所有Agent平等协作,追求“涌现智能”。为什么坑大:复杂任务容易出现死锁、互相等待或输出冲突,调试难度极大。避法:大多数生产场景先从分层结构(Hierarchical)入手——上方Supervisor负责拆任务、分配和汇总,下方是专注的Worker。系统跑稳后再在局部引入Swarm式的并行协作。分层结构控制力强、审计方便,是2026年企业落地最广泛的模式。6. 忽略整体成本和监控现象:集群跑起来后,Token消耗、延迟、错误率失控,尤其是多个Worker并行执行时。为什么坑大:账单和系统稳定性同时出问题。避法:从一开始就接入可观测性工具(LangSmith、Langfuse等),实时监控每个Agent的调用次数、Token用量和成功率。定期压缩记忆,避免历史越积越多。同时设置预算阈值和自动降级机制(复杂任务失败时切换到更简单的流程)。搭AI Agent集群,本质上是搭建一个“数字员工团队”。团队越大,分工必须越清晰,协作协议必须越标准,检查机制必须越严格。避开以上6个坑,系统才能从“看起来能跑”变成“真正稳定、好维护、成本可控”。原文:https://x.com/dss_ws14043/status/2038804249669411229,个人推特。
大厂实习和小厂实习最大的...
点赞 评论 收藏
分享
评论
2
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务