淘宝搜索算法2027实习生内推

内推码：1VIBKF

团队介绍
我们是淘宝搜索算法团队，是淘天集团内专注于创新和优化搜索技术的核心团队，支撑淘天超大规模检索、相关性、预估、Query理解、顶层机制设计、AI搜，直接驱动千亿级GMV。我们的任务是通过持续研发高效、精准的搜索算法，以提升用户的在线购物体验和满意度，进而推动电商平台的商业成功。在这一关键角色中，你将参与淘宝搜索功能的核心算法研究，特别是专注于大模型在信息检索领域的应用、AI创新产品和AI搜等创新领域。我们深度理解搜索引擎的工作原理，在生成式排序/检索、大模型全链路应用、模型Scaling和Infra、多模态技术、AI Agent等技术方面持续深耕。作为团队的核心成员，你将不仅要在直接工作领域推动技术突破，还要与团队其他方向，包括召回、个性化预估、相关性、机制等进行全链路联动，共同推进搜索算法的整体优化。
团队技术氛围浓厚，近些年在ICLR、NIPS、KDD、SIGIR、WWW、AAAI等顶会发表论文三十余篇，并斩获CIKM Best Paper Runner Up。且与顶尖高校深度开展AIR/RI科研合作，拥有浓厚的技术交流与创新氛围。

团队亮点
超高的转正率（过往转正率超70%），更有1:1 mentor带教，实习课题专属定制；
高空间的舞台，真实、海量、复杂且高价值的业务场景，让你的技术才能得到最大程度的发挥；
前沿的技术挑战，直接参与定义下一代AI搜索，与行业顶尖人才共同攻克最具挑战性的技术难题；
充足的资源支持，丰富的计算资源与数据资产，以及鼓励创新和试错的文化氛围；
清晰的成长路径，完善的职业发展体系和技术晋升通道，支持个人在技术深度和业务广度上的持续成长。
岗位描述
生成式排序/检索：研究LLM如何赋能电商场景下的个性化CTR/CVR预估和召回，利用模态对齐、用户行为CoT等技术手段让LLM的推理能力扩展到对用户的个性化偏好的理解与推理上，实现更精准的人货匹配；探索个性化生成式预估/召回模型方案，包括搜索推荐领域下生成式模型相较于判别式模型的优劣对比、生成式训练范式设计、生成式模型结构优化、基于RL的排序目标对齐等方向，设计有Scale Up能力的模型方案。
大模型应用与落地：主导设计和优化面向电商场景的Query理解、语义检索与相关性大模型，重点投入Agentic Search/Deep Research、Agentic Reasoning、多模态大模型等前沿方向，从模型层面根本性地提升搜索相关性和用户体验满意度，从而提升商业效率；同时会运用生成式AI技术，为搜索结果页的商品自动生成富有吸引力的标题、精准的卖点摘要，并探索文生图等多模态技术以创造全新的商品图像。
大模型Infra设计与优化：主导设计和优化面向电商场景的Query理解、语义检索与相关性大模型、UGC内容理解和生成，重点投入Agentic Search/Deep Research、Agentic Reasoning、多模态大模型等前沿方向，从模型层面根本性地提升搜索相关性和用户体验满意度，从而提升商业效率；同时会运用生成式AI技术，为搜索结果页的商品自动生成富有吸引力的标题、精准的卖点摘要，并探索文生图等多模态技术以创造全新的商品图像。
AI搜：参与电商下一代AI搜索模型全链路能力建设，聚焦Post-training（SFT、RLVR、Agentic RL、CoT）等核心技术，推动AI搜索技术迭代，通过RAG、Agent等技术提升用户搜索体验，同时构建数据驱动的Agentic闭环链路，支持智能体推理、Case分析、训练数据合成与自动化评估，实现搜索效果的持续优化。
职位要求
计算机、人工智能、电子信息、数学等相关专业硕士及以上学历，博士优先。
具备扎实的机器学习/深度学习理论基础，精通Python编程，熟练使用PyTorch/TensorFlow等至少一种深度学习框架。
对大语言模型（LLM）和多模态大模型（MLLM）有深入理解，熟悉Transformer、Attention机制等核心原理，具备LLM/MLLM（如LLaVA、Qwen-VL、GPT-4V等）的Finetune、Prompt Engineering、RAG（检索增强生成）等方面的实际项目经验。
在以下至少一个领域有深厚的实践经验：搜索、推荐、自然语言处理（NLP）、计算机视觉（CV）。
具备优秀的数据分析能力和问题解决能力，善于从数据中发现问题、定位根源，并提出有效的解决方案。
具备良好的团队协作精神和沟通能力，能够积极主动地推进项目，并与产品、工程等不同角色高效协同。
毕业于2026年11月-2027年10月的校招同学
加分项
在电商搜索、广告、推荐等相关领域有实际工作经验，深刻理解业务。
有Agentic AI或AI Agent相关项目的设计与研发经验。
在CVPR、ICCV、NeurIPS、ICML、ICLR、ACL、SIGIR、KDD等顶级学术会议上发表过论文者优先。
熟悉分布式计算平台（如Spark、Flink、MaxCompute等），有处理海量数据的经验。
有开源社区贡献或在Kaggle等数据科学竞赛中取得优异成绩者优先。

##阿里巴巴##淘宝##搜索##算法##大模型##多模态#

淘宝搜索算法2027实习生内推

全站热榜

创作者周榜