中电信人工智能科技(北京)有限公司一面

大模型数据算法实习生
2026.01.09,上午10:00,一面,线上,30多min,只有自己开摄像头,面试官没开
1.自我介绍
2.有没有用过正则表达式处理过数据?
3.假设给一个jsonl数据,和几个关键词,jsonl数据中命中3个以上关键词保留,让用python实现(用了两层循环)
4.往列表里添加一条数据是什么方法(append)
5.python中的多进程和多线程有什么区别?网络请求中是多进程快和多线程快?(答的不好)
6.python中的is和==的区别(说了is主要用于字符串或bool类型判断,==主要用于数值判断,结果面试官让用更“科学”的方式解释)
7.python里面的迭代器和生成器有什么区别?(答的不好)
8.假设给一个100G的jsonl文件,但内存只有10G,如何读取数据(说用pandas处理,结果不让用,让用最原始的方式处理,后来又说了对文件进行压缩)
9.手撕:LeetCode两数之和(哈希表)
10.问平常使用什么系统(说了windows,也用linux)
11.假设linux系统中没有root权限,如何给一个文件赋予读写权限(说了如果知道密码,可以sudo su转成root用户或者chmod -R)
12.给一个路径,求路径下面有多少个文件和文件夹(说了tree)又问如果只统计文件夹呢?(答的不好)
13.一个文件目录下有很多个txt文本文件,如何找到其中包含“乘式”的文件?(答的不好)
14.问了grep
15.问有没有使用过大数据相关的组件(说了hadoop,spark,flink但不熟悉)
反问:
1.部门的主要业务,主要是做大模型和多模态大模型相关的,我这个岗位主要是处理预训练的数据,可能会涉及算法
2.使用什么服务器,A100,H100,910B都有(居然有910B,NPU?!)

感受:没想到一道大模型相关的八股都没问,没想到居然问了一堆python基础,也没想到问了linux的一堆操作#牛客AI配图神器#
全部评论
一面过了吗
点赞 回复 分享
发布于 01-12 19:23 江苏

相关推荐

评论
2
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务