淘天集团-语言大模型算法实习生-日常实习生招聘

#### 日常实习生与春招实习生的区别
1)日常实习生与春招实习生不冲突,有独立HC
2)日常实习生不限制毕业时间,低年级学生可报名,积攒实习经验

####职位描述:
1、开展基于大语言模型的Agent的算法研发和评测工作,包括Agent模型研发、通用Agent和垂类Agent构建和评测等;
2、通过CT/SFT/RL等训练方法,提升大模型Planning、复杂推理、RAG、工具调用、数据问答、文案生成等能力;
3、跟进最新人工智能技术和热点,优化、改进现有技术和系统,提升系统的性能和效率,在内外部业务场景验证,形成业内领先的技术服务能力和体系;
4、负责业务技术需求的支持,针对业务场景的真实需求,设计合理的算法解决方案和技术路线,通过技术创新和业务验证,实现业务价值和效率的提升。

#### 职位要求:
【必备项】
1、计算机或相关专业本科以上学历,硕士博士优先;
2、对大模型新技术感兴趣,具有良好的英文阅读能力,可以快速理解前沿论文和技术文档并评测效果;
3、熟练掌握Python编程语言以及PyTorch等深度学习开发框架;  
4、具备NLP大模型算法知识,有Qwen/Llama等大模型的使用或训练经验者优先;
5、出色的问题解决能力和创新能力,能够解决复杂的技术挑战;  
6、具备Prompt工程、Agent构建等相关学术研究或实践经验者优先;
7、实习时间6个月或以上。
【加分项】
1、在校园内或互联网公司有相关实习或项目经历;
2、在ACL、EMNLP等国际顶级会议、期刊上发表论文,或在相关学术会议组织的权威比赛中获奖。

【联系方式】
简历内推邮箱:xinping.gxy@taobao.com
邮件标题格式:淘天-语言大模型算法-日常实习生-姓名
#阿里巴巴##淘天##LLM##实习生招聘##内推##日常实习生#
全部评论

相关推荐

常见的业务题架构理解篇Q1 Transformer模型主要由哪两部分组成?Q2 自注意力机制中的Q、K、V矩阵是什么缩写?Q3 多头注意力中"头"(head)指的是什么?Q4 位置编码的作用是什么?Q5 Encoder和Decoder结构的主要区别?Q6 为什么要使用残差连接(Residual Connection)?基础组件篇Q7 前馈神经网络(FFN)有多少层?Q8 Layer Normalization放在哪个位置?Q9 激活函数ReLU和GeLU的主要区别?Q10 词嵌入(Word Embedding)的维度代表什么?Q11 注意力掩码(Attention Mask)的作用是什么?Q12 为什么要使用dropout技术?训练基础篇Q13 预训练(Pre-training)的目标是什么?Q14 什么是语言模型中的"自回归生成"?Q15 数据并行的基本实现方式?Q16 什么是训练中的批量大小(Batch Size)?Q17 学习率(Learning Rate)过大会导致什么问题?Q18 训练损失(Training Loss)下降说明什么?模型应用篇Q19 什么是文本生成中的贪心解码(Greedy Decoding)?Q20 温度参数(Temperature)如何影响生成结果?Q21 模型推理时为什么要限制生成长度?基础概念篇Q25 参数量(Parameters)和计算量(FLOPs)的区别?Q26 什么是生成式AI(Generative AI)?Q27 预训练模型和传统NLP模型的核心区别?Q28 为什么大模型需要海量训练数据?Q29 什么是过拟合(Overfitting)现象?Q30 模型推理(Inference)是指什么过程?工程实践篇Q31 GPU显存不足时常见的解决方法?Q32 模型权重文件(Checkpoint)包含哪些内容?评估基础篇Q37 如何评估语言模型的生成质量?Q38 困惑度(Perplexity)指标的计算原理?
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务