商米科技数据开发笔试
公号:嵌入式未来
《嵌入式软件开发笔试与面试手册》:https://blog.nowcoder.net/zhuanlan/jvN8gj
《嵌入式软件笔试-2023年真题汇总》:https://blog.nowcoder.net/zhuanlan/0oDWVm
题型:15道选择题,其中有单选和多选;3道编程题,核心代码模式,为了方便调试,本文提供ACM
在TCP/IP协议的传输层将数据传送给用户应用进程所使用的地址形式
A.端口号
B.socket地址
C.IP地址
D.MAC地址
多选
高并发测试中,数据库数据问题往往出现很多,下面关于隔离级别描述正确的是
A.不可重复读:同个事务前后多次读取,不能读到相同的数据内容,中间另一个事务也操作了该同一数据
B.幻读:当某个事务在读取某个范围内的记录时,另外一个事务又在该范围内插入了新的记录,当之前的事务再次读取该范围的记录时,发现两次不一样,产生幻读
C.事务的隔离级别越高,事务越安全,并发能力越高。
D.脏读:事务中的修改即使没有提交,其他事务也能看见,事务可以读到未提交的数据称为脏读
解释:
隔离级别越高,事务越安全,但并发能力会降低,而非提高。
作为一种级存工赎:在工作中 Redis得到了大量的应用,下列关于Redis的说法错误的是?
A.使用 Redis查询速度快,因为 Redis 数据存在于内存
B.支持事务,操作都是原子性
C.支持丰富数据类型,例如 string,list, set, Tuple, hash等
D. Redis可以满足互联网高并发需要高速处理数据的场合, 比如抢红包、商品秒杀等场景
Redis支持事务吗?
A支持
B.不支持
多选
数据倾斜是数据处理中中一个很常见的问题,对于数据倾斜的处理方法,正确的是?
A提高作业的并行度
B对数据中的脏数据,统一留到最后再进行处理
C根据维度。对源数据进行聚合
下列关于MySQL的读锁和写锁正确的是?
A使用读锁锁住表的单行时,其他会话可以对这一行数据执行更新操作,但是无法删除
B当使用读锁锁住一行数据且隔离级别为Read Uncommitted时,其他会话可能会脏读此行
C使用写锁锁住单行数据时,此行可以被其他会话读取
解释:读锁防止其他事务修改被锁定的数据行,但允许读取。
关于Zookeeper中的四种类型的数据节点Znodp,下列描述正确的是?
A. EPHEMERAL 临时节点,他的生命周期会与客户端会话绑定,如果这个客户端会话失效,由这个客户端创建的临时节点不会受到影响
B. PERSISTENT 持久节点,除非手动删除,否则节点一直存在于Zookeeper
C. EPHEMERAL_SEQUENTIAL 临时顺序节点,与持久节点相同,增加了顺序属性
D. PERSISTENT SEQUENTIAL 持久顺序节点,与持久节点相同,就是节点名字后面会追加一个由父节点维护的自增整形数字
Kfka可以每秒处理几十万条信息。而且延迟最低只有几亳秒,下列关于Kafka处理速度快的说法错误的是?
A. 使用Zero copy 技术大大提高了应用程序的性能少不必要的内核级冲区跟用户缓冲区间的拷贝
B. 利用Page cache+mmap进行储存管理
C. Kafka 采用批量压缩设计,支持多种压缩方式,允许使用递归的消息集合。
D. Kafka写入数据的时候优先写入级存,会降低拉取消息的速度
在MapReduce中,在数据的Shuffle 阶段中哪个流程是最后进行的?
A分区
B溢写
C合并
D排序
压纳可以哮低磁盘的IO。关于Hive中常见的压缩格式,下列描述错误的是?
A. SequenceFile,存储方式为列式存储,具有使用方便、可分割、可压缩的特点
支持三种压缩选择:NONE,RECORD,BLOCK,一般建议使用 RECORD 压缩
B. TextFile,存储方式为行存储,数据不做压缩,磁盘开销大,数据解析开销大
C. RCFile数据储存按行分块,每块按列存储,能够利用列维度的数据压缩。并且能跳过不必要的列读取
D. ORCFile数据按列储存,压缩快,压缩效率比 RCFile高.
解释:
SequenceFile 是基于行的存储,而非列式存储。
多选
RDD是一种弹性分布式数据集,同时也是 Spark的一种编程模型。RDD的弹性主要表现在哪几点?
A.checkpoint和persist,数据计算之后持久化缓存
B.不需要依赖其他 RDD,可以单独进行计算
C.可以自动的对内存和磁盘管理进行储存转换
D.数据调度弹单性,DAG TASK 调度和资源无关
下面描述TCP握手过程正确的是?
A.第二次握手服务端收到连接请求,如果同意连接,就会发送一个应答。
B.第三次握手客户端收到同意连接的应答后,给服务端发送一个确认报文。
C.第一次握手客户端向服务端发送连接请求。
D.以上都是正确的
多选
MySQL数据库是互联网公司流行的数据库软件。下面说法正确的是
A.select * from product limit 1,10;是分页查询
B.drop table product;是删除product 数据库
C. create database user_db是创建数据库
D.show databases;是列出当下有多少数据库
在数据库系统中,产生数据不一致的根本原因是()
A.数据冗余
B.未对数据进行完整性控制
C.数据存储量太大
D.没有严格保护数据
多选
Spark拥有多种部署模式,下列对于Spark中的四种部采模式,描述正确的是?
A.本地模式,不一定要跑在Hadoop集群,可在本地运行,一般是为了方便调试
B.Spark on yarn模式,分布式部署集群,资源和任务监控交给yarn管理,目前仅支持粗粒度资源分配方式
C.standalone模式,分布式部署集群,自带完整的服务,资源管理和任务监控是Spark自己监控
D.Spark On Mesos模式,Spark运行在 Mesos上,比运行在yarn上更加灵活
编程题:
题目1:不能AC,够时间就自动交卷了,还来不及修改,欢迎友友们提供解法
HTML表格允许 Web开发人员将数据排列到单元格的行和列中。
它们是使用<table>标记创
剩余60%内容,订阅专栏后可继续查看/也可单篇购买
本专栏主要发布嵌入式软件开发相关岗位2023年(2024届)的笔试真题(嵌入式软件开发、通用软件开发、C/C++软件开发、算法工程师、数据开发、测试开发等)主要是算法编程题,其中一些岗位笔试含有对应的选择题、填空题、简单题。