【内推】【社招】【校招】搜狐NLP算法招聘

基本职责:
1. 研究和实现自然语言处理算法和模型,如文本分类、情感分析、语言模型、实体识别、命名实体识别、关系抽取等;
2. 分析和处理大规模文本数据,包括数据清洗、预处理、特征提取、特征选择等;
3. 开发和维护NLP系统和工具,如文本分析工具、语义搜索引擎等;
4. 与产品经理等团队成员能够进行高效的协作,根据业务需求提供有效的NLP解决方案;
5. 跟踪和研究NLP领域的最新技术和发展动态,掌握业界最新的NLP算法和模型。
公司内部主要职责:
1. 使用NLP常用模型为新闻内容提供准确的内容标签,包括但不限于新闻分类、新闻topic、新闻tag等
2. 使用常用prompt工程技术、大模型微调技术生产新闻的辅助内容,包括但不限于新闻摘要、新闻问答等
基本要求:
1. 具备扎实的计算机科学和数学基础,熟练掌握数据结构、算法和统计学知识;
2. 熟练掌握NLP领域的基础知识和算法,如词向量、词性标注、句法分析、机器翻译等;
3. 熟练使用NLP相关工具和框架,如PyTorch、TensorFlow等;
4. 具有良好的编程能力,熟练掌握Python、Java、C++等编程语言;
5. 具有良好的沟通能力和团队合作精神,能够与产品、数据等团队成员紧密合作,共同完成项目和任务;
6. 校招和社招均可
公司内部主要要求(加分项):
1. 具备扎实的NLP大模型和常用模型部署落地能力,在算法模块的工程架构设计上有丰富的经验
2. 对新闻内容的数据特征有较为深入的认知,针对相关需求能够快速提出有效解决方案
3. 具备大语言模型训练经验或者相关顶会论文发表者优先
*******************************************************
福利:
1.90%以上非特殊情况无加班
2.15天带薪年假实打实可以请假
3.压力较小,认真负责即可
*******************************************************
有意者私信
全部评论

相关推荐

字节一面:1.面试官自我介绍+小组业务介绍:C/C++,GPU,异构计算,从上层的编译到下层异步执行2.机器学习有了解过吗...  学校选修课...3.自我介绍4.实习项目介绍5.项目里为什么用dpdk? 为什么要搞用户态协议栈,不搞原来内核的那一套?内核那一套可能有一些固定的额外的开销... kernel bypass  绕过很多开销 零拷贝...6.有没有深入研究过dpdk? 深度分析?不太了解,vpp用的多,注册函数指针,成员到主结构体,初始化...7.介绍一下项目2 ??8.讲一下外碎片场景?9.项目里怎么合并内存的?10.照你这么说,一直遍历,O(N),效率是不是有点低?  怎么优化?合并机制类似于伙伴系统,有效减少外部碎片,确保大块内存请求的连续性。联系到工程上....   11.对于解耦的意义?  12.加什么锁?   自旋锁会不会?13.工作线程 vs 主线程?   锁竞争?  桶锁粒度?   12.mmap  vs brk ?13.进程地址空间? 独立性? 页表? 写时拷贝?  (面试官:嗯嗯,对,这个这个这个不错,这个能回答到这个点还是比较少???)14.mm_sturct讲一下?  进程独立拷贝?  区间划分?  管理?  空间布局,自上而下?15. mmap会映射到哪个区域?  文件?物理内存?堆区?16.你对Linux系统的内存管理这块了解的咋样?17.内存分配算法?  伙伴系统?  内存交换?18.unordered_map vs map?  底层?  优缺点?19.vector底层?  异地扩容?  底层指针调整?  元素深拷贝?20.智能指针?  unique vs shared(具体的场景有什么,如何具体选择) ? 底层?  作用域?21. RAII?   除了智能指针还有哪里用到RAII ??22.左值右值引用?   传递unique_ptr?   std::move??  底层? static_cast?23.cpp编译链接流程??24.类模板?  生成模板类?   在编译的哪个阶段??<br>25.讲一下生成的.o文件的格式?  ELF?  忘了...26.和.so .a的联系?  联系实习动静态库?<br>27.动态库的加载?  磁盘到内存?  如何链接过去的?  入口?28.符号表那一套...  大哥你别问了....<br>29.聊一聊   <<程序员的自我修养...>>30.Python会吗?  脚本?31.手撕 链表题  10min 调试过你咋不用智能指针??   写算法题习惯了....32.反问:1.面试表现咋样,哪里可以提升? 平时咋学习?智能指针和新特性,底层编译链接,再复习复习.深度比较重要,找一个方向深入一下吧...2.字节的项目管理流程,从开始到结束,流程?车轱辘话....这个流程的话,它这个这个其实没有这种统一的标准,因为它像自觉它是一个比较大的一个公司嘛,对吧?然后各种各样的这种业务,各种各样的这种项目,他可能。每个项目它都是不太一样的对吧?他可能有的可能希望你。给自己做一些很创新的事情,让你自己一个人去深入的研究某1块儿,然后去独立的去。完成整个一个项目。但是有的项目它可能就是希望你去在他规划的这个大项目里边去让你做某1块事情,然后更加讲究这种分工协作。<br><br>
点赞 评论 收藏
分享
头像
04-01 19:37
已编辑
华中科技大学 Java
3.17日 一面 :60min20min 问实习15min 算法:删除无效括号看我算法写的太轻松了,出了个多线程题。用信号量实现读写锁没写出来,晚上睡觉的时候想到,用读锁一次获得一个资源,写锁一次获取所资源上限的资源量。10min https深挖:追问我https为什么安全,到最后问我要是本地证书被攻破了怎么办本地攻破了那确实没办法了,没安装360是这样的反问:3.24 日 二面 70min20min 聊实习20min 八股1,kafka相关,kafka积压怎么解决2,介绍一下http3,sql优化相关4,一次sql理想的io次数30min 算法给了一堆用户访问信息,做一些统计,并统计出topk用户访问量cpp写代码工具都得自己搭建,写的有点慢了,最后findkth写的好像有问题,不过运行是对的,面试官也没看出来写的有问题,有点尴尬3.28日 三面 60min二十分钟问实习十分钟:设计一个单点限流,每个ip只限定100qps回答了zset对每个ip限流,但是造成zset过多的问题。redis本身的淘汰策略不可信,可以用时间分片zset优化,定时清理上一个时间片,如果时间片选的是10min那么这个窗口最多只有10分钟访问ip的zset。三十分钟:最大子数组乘积,并输出左右边界。反问:有没有转正名额。不方便透露hc,但是给我画饼优秀的同学不需要hc就可以留任。4.1日 hr面,面完oc  
Lefty_:没安装360可还行
查看11道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务