题量好大
点赞 评论

相关推荐

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。团队介绍:AIDP(AI Data Platform)是深度参与字节跳动 AI 数据管理与模型训练流程的数据基础设施团队,提供数据采集、清洗、标注、合成、验证、管理等全流程的数据服务和全面解决方案。加入我们,你能深度参与字节 AI 核心业务近距离接触真实的大模型训练场景,解决数据处理中的实际问题和优秀团队协作,在数据与模型的交叉领域积累实战经验;在数据与模型领域实现个人价值,推动行业进步。你的工作将直接影响 AI 技术的落地效果,推动技术真正服务于用户。1、围绕Seed大模型数据全生命周期,参与/负责大模型数据管理平台的数据基建的整体架构设计与建设,包括数据接入、处理、检索、跟踪、质量评估、权限合规等基础能力;2、构建Seed大模型海量数据的资产目录、标签体系、元信息管理及血缘分析能力,提升高质量数据挖掘效率与可用性,赋能算法预训练、SFT/RLHF等核心场景;3、协同基础架构/云平台团队,搭建稳定高效的底层数据基础设施(数据湖、对象存储、向量存储、分布式计算、元数据管理系统等);4、主导技术选型与架构优化,基于Spark/Flink/Ray、湖仓一体、向量数据库等技术栈,构建高吞吐、高容错、可扩展的处理存储能力,支撑日PB级数据处理。职位要求1、2027届本科及以上学历,计算机、通信等相关专业优先;2、具备大数据开发相关技能,熟悉Java/Scala语言,包括JVM、类加载、并发等;有较好的SQL基础;3、熟悉Flink、Spark、Kafka、ClickHouse、Doris、Hudi、Icebreg、Paimon中的部分大数据引擎,掌握原理及性能调优优先;4、善于沟通,对数据敏感,责任心强、积极主动;5、每周实习4天以上,连续实习3个月以上。
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务