淘宝搜索算法2027实习生内推

内推码 :1VIBKF

团队介绍
我们是淘宝搜索算法团队,是淘天集团内专注于创新和优化搜索技术的核心团队,支撑淘天超大规模检索、相关性、预估、Query理解、顶层机制设计、AI搜,直接驱动千亿级GMV。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。在这一关键角色中,你将参与淘宝搜索功能的核心算法研究,特别是专注于大模型在信息检索领域的应用、AI创新产品和AI搜等创新领域。我们深度理解搜索引擎的工作原理,在生成式排序/检索、大模型全链路应用、模型Scaling和Infra、多模态技术、AI Agent等技术方面持续深耕。作为团队的核心成员,你将不仅要在直接工作领域推动技术突破,还要与团队其他方向,包括召回、个性化预估、相关性、机制等进行全链路联动,共同推进搜索算法的整体优化。
团队技术氛围浓厚,近些年在ICLR、NIPS、KDD、SIGIR、WWW、AAAI等顶会发表论文三十余篇,并斩获CIKM Best Paper Runner Up。且与顶尖高校深度开展AIR/RI科研合作,拥有浓厚的技术交流与创新氛围。

团队亮点
超高的转正率(过往转正率超70%),更有1:1 mentor带教,实习课题专属定制;
高空间的舞台,真实、海量、复杂且高价值的业务场景,让你的技术才能得到最大程度的发挥;
前沿的技术挑战,直接参与定义下一代AI搜索,与行业顶尖人才共同攻克最具挑战性的技术难题;
充足的资源支持,丰富的计算资源与数据资产,以及鼓励创新和试错的文化氛围;
清晰的成长路径,完善的职业发展体系和技术晋升通道,支持个人在技术深度和业务广度上的持续成长。
岗位描述
生成式排序/检索:研究LLM如何赋能电商场景下的个性化CTR/CVR预估和召回,利用模态对齐、用户行为CoT等技术手段让LLM的推理能力扩展到对用户的个性化偏好的理解与推理上,实现更精准的人货匹配;探索个性化生成式预估/召回模型方案,包括搜索推荐领域下生成式模型相较于判别式模型的优劣对比、生成式训练范式设计、生成式模型结构优化、基于RL的排序目标对齐等方向,设计有Scale Up能力的模型方案。
大模型应用与落地:主导设计和优化面向电商场景的Query理解、语义检索与相关性大模型,重点投入Agentic Search/Deep Research、Agentic Reasoning、多模态大模型等前沿方向,从模型层面根本性地提升搜索相关性和用户体验满意度,从而提升商业效率;同时会运用生成式AI技术,为搜索结果页的商品自动生成富有吸引力的标题、精准的卖点摘要,并探索文生图等多模态技术以创造全新的商品图像。
大模型Infra设计与优化:主导设计和优化面向电商场景的Query理解、语义检索与相关性大模型、UGC内容理解和生成,重点投入Agentic Search/Deep Research、Agentic Reasoning、多模态大模型等前沿方向,从模型层面根本性地提升搜索相关性和用户体验满意度,从而提升商业效率;同时会运用生成式AI技术,为搜索结果页的商品自动生成富有吸引力的标题、精准的卖点摘要,并探索文生图等多模态技术以创造全新的商品图像。
AI搜:参与电商下一代AI搜索模型全链路能力建设,聚焦Post-training(SFT、RLVR、Agentic RL、CoT)等核心技术,推动AI搜索技术迭代,通过RAG、Agent等技术提升用户搜索体验,同时构建数据驱动的Agentic闭环链路,支持智能体推理、Case分析、训练数据合成与自动化评估,实现搜索效果的持续优化。
职位要求
计算机、人工智能、电子信息、数学等相关专业硕士及以上学历,博士优先。
具备扎实的机器学习/深度学习理论基础,精通Python编程,熟练使用PyTorch/TensorFlow等至少一种深度学习框架。
对大语言模型(LLM)和多模态大模型(MLLM)有深入理解,熟悉Transformer、Attention机制等核心原理,具备LLM/MLLM(如LLaVA、Qwen-VL、GPT-4V等)的Finetune、Prompt Engineering、RAG(检索增强生成)等方面的实际项目经验。
在以下至少一个领域有深厚的实践经验:搜索、推荐、自然语言处理(NLP)、计算机视觉(CV)。
具备优秀的数据分析能力和问题解决能力,善于从数据中发现问题、定位根源,并提出有效的解决方案。
具备良好的团队协作精神和沟通能力,能够积极主动地推进项目,并与产品、工程等不同角色高效协同。
毕业于2026年11月-2027年10月的校招同学
加分项
在电商搜索、广告、推荐等相关领域有实际工作经验,深刻理解业务。
有Agentic AI或AI Agent相关项目的设计与研发经验。
在CVPR、ICCV、NeurIPS、ICML、ICLR、ACL、SIGIR、KDD等顶级学术会议上发表过论文者优先。
熟悉分布式计算平台(如Spark、Flink、MaxCompute等),有处理海量数据的经验。
有开源社区贡献或在Kaggle等数据科学竞赛中取得优异成绩者优先。

##阿里巴巴##淘宝##搜索##算法##大模型##多模态#
全部评论
点赞 回复 分享
发布于 03-19 16:39 陕西

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务