小盲陀

05-16 00:13 已编辑门头沟学院 Java 发布于安徽

关注

百度Java日常实习一面

最近每天更新一篇，都是老素材去年面的。想冲一冲1000人品的奖章。uu们觉得有帮助的话不妨点个追番，送送花，陈某定带你一路飞驰（凡人修仙传台词）。

1.自我介绍

2.项目里有什么技术难点吗？

3.kafka的架构

4.kafka怎么保证数据不丢失

5.kafka怎么解决重复消费问题

6.kafka的消费顺序性怎么保证

7.AQS原理（简历里写了就特别喜欢问）

8. jvm内存划分，垃圾回收

9.JAVA对象的生命周期

10.你用的jdk版本，是哪个垃圾回收器。还了解其它垃圾回收器吗

11.redis数据结构，说几条redis原生命令

12.mysql三大日志，存了什么，作用

13.Spring里怎么实现事务

14.让你自己实现一个@ Transaction注解你怎么写

15.代码题：多线程累加

16.续15.除了用syschronized你还能怎么实现

kafka基于发布订阅模型。一个分区可以看作一个队列，生产者发送消息时指定topic，每个topic内部又有多个partition，这个partition分区就可以看作一个队列。一个Broker是一个独立的kafka实例。而消费者一般都在消费者组里，每个消费者组可以选择订阅一个或多个topic，kafka会按topic将里面的分区平均分配给消费者组里的消费者们。

例如Topic A里有三个分区p1，p2，p3。消费者组1订阅了A，且有两个消费者线程a,b。那么就可能p1，p2分配给a，p3分配给b。

要注意一个分区只能由消费者组里的一个线程来消费，不可能a,b同时都消费某个分区，这是为了保证消费的顺序性。

例如topicA里有两个分区p1,p2。消费者组1里有三个消费者线程a,b,c。这样会有一个消费者空闲，不会出现a,b同时去消费p1的情况。

一个topic可以被多个消费者组订阅，每个消费者组维护自己的offset。

一个消费者组也能订阅多个topic,这时会按分区数量去平均分配.

4.数据持久化机制，拿到数据会持久化到磁盘；

写前日志WAL；

生产者：可能数据调用send后由于网络问题并没有真正发送成功，可以通过把send改为同步操作或者用回调函数；

消费者：消费者可能还没有真正消费就提交了offset，改为消费完了才提交，而不是一拿到就提交；

kafka本身：有个acks参数，设置成all表示所有副本都同步了才响应，安全性最高

5.重复消费的根本原因是因为消费者消费了，但提交offset出了问题。

最好是把提交消息改成幂等操作。例如生产者发送消息时，将唯一的订单id写到消息里，消费者拿到去redis或数据库看该id的订单存不存在，存在就说明已经消费过（可以做成mysql唯一键，这样再写入会失败）。

也可以消费者一拿到消息就提交offset，但这样会出现数据丢失的问题（提交完后有了问题，导致消息没有真正被消费），需要做数据兜底。

6.一个分区partition里的消息是能够保证消费的顺序性的，因为一个分区只有一个线程来消费，所以就要想办法将需要保证顺序性的这些消息都发送到同一个分区，通过给这些消息指定相同的Key来完成，因为kafka默认是通过hash(key)来进行分区，key相同就分到一个区了。producer.send(new ProducerRecord<>("topic", key, value));

7.AbstractQueuedSynchronizer是抽象队列同步器，是java并发包中提供的构建锁和同步器的基本框架。

首先是它有一个volatile修饰的int型变量state，在ReentrantLock里它表示锁被获取的次数，在Semaphore里它表示剩余的许可数量。一般我们通过cas操作来修改这个变量，cas成功表示获取锁成功，否则失败。

同时，aqs内部维护了一个同步队列，用来存储那些等待获取锁的线程。当线程获取锁失败时，就会把线程引用包装成一个结点放到队列里去。当持有锁的线程释放资源时，会调用release方法，在释放锁之后会把队列里的第一个结点唤醒，被唤醒的线程会去尝试获取锁。

aqs是基于模板方法设计的，它定义了一系列模板方法，如acquire，acquireShared，release，releaseShared等等，我们可以写一个aqs的子类，然后自己实现tryAcquired，tryReleased等几个抽象方法。然后就能实现自定义的同步器。

8.每次都有这个，这次就不写在这了

9.加载：通过类的全限定名找到.class文件，并读到内存，在方法区里生成Class对象

验证：检查class文件是否符合规范

准备：为类的静态变量分配内存，并初始化为默认值。如static int count = 1;

解析：将常量池里的符号引用转换为直接引用。

初始化：执行类的<clint>方法。

卸载：将类从JVM中移除。

说到类的卸载，不妨再延伸一下。

怎样的类能被卸载：a.该类的所有实例都不可达；b.类的加载器不再被引用；c.对应的Class对象也不可达

一般类被加载后都会长期驻留，典型的会卸载的场景是热部署场景。

且类的卸载都是fullGC干的，只有fullGC会回收方法区。

10.jdk1.8对应的垃圾回收器是ParrallelGC，在新生代和老年代分别是Parallel Scavenge和Parrallel Old。

jdk9之后默认G1，常见的还有CMS,在jdk14之后就淘汰了。

让gpt对比了一下几种常见垃圾回收器，具体说的话太复杂，一般可以稍微记一段话，好应付面试，其实问这个的也很少。

CMS垃圾回收过程

1：初始标记：从GC Roots找能到达的老年代对象，有STW

2：并发标记：从1阶段标记的对象出发找能不能到其它老对象，并发无STW

3：重新标记：STW，修改并发标记期间产生的变化

4：并发清除

G1:主要是将堆区域划分为了Region，每个region都能根据需要扮演Eden,Survivor或者老年代。

G1最大的特点是它的“停顿时间模型”用户可以指定期待停顿时间（默认为200ms）。

G1会记录每个Region的回收耗时、标准偏差、置信度等统计信息，然后通过这些信息预测现在开始回收的话，有哪些Redion组成回收集才可以在不超过预期停顿时间的约束下获得最高的收益。

——————————————————————————————————————————

这里想到一个比较有趣的问题，Eden，Survivor，老年代在堆中的占比是多少？以及这些垃圾回收器适合用在新生代还是老年代？我们常说的三种垃圾回收算法，标记清除，标记复制，标记整理分别适合用在哪个区域？（也是以前小米一面被问得，也就被问过一次，挺难的）

新生代占堆的1/3，其中Eden可能占新生代的80%。新生代里大部分对象都是朝生夕灭，Eden肯定占大部分，因为每次都是Eden和survivor中一个分区的存活对象复制到另一个区域，能存活下来的比例是比较小的，survivor不适合太大。

至于为什么堆占2/3，这种一般是实验出来的。只能说大致理解一下为什么老年代更大，因为老年代的对象生命周期长，GC频率低，回收成本高，空间小了会导致频繁MajorGC和FullGC，且大对象都是直接进入老年代，老年代需要大空间。

说到Eden,s0,s1其实就是复制标记算法，分为两半，每次活的复制过去嘛。老年代一般适合标记清除和标记整理，因为变动少，用标记复制会浪费空间。

至于各种垃圾回收器适合新生代还是老年代，一般明确说的只有CMS适合老年代，顾名思义，concurrent Mark Sweep，并发标记清除，正如上述，标记清除适合老年代。

11.redis数据结构大家肯定都知道，String Hash Set ZSet List

原生命令用的少确实不记得，用简单的就是set count 1

12.binlog：主从复制，记录的是数据操作日志，是逻辑日志，如将id=10的age改为5。

redolog：持久性，记录的是物理操作日志，那哪个具体位置改了什么.

undolog：原子性，旧版本的值

13.一般都是用的@Transaction注解；

14.

本质是用AOP

首先自定义一个注解，编写AOP切面类，拦截带注解的方法。，在方法执行前开启数据库事务，方法正常执行则提交，发生异常则回滚，确保方法内所有数据库操作作为一个整体执行。

全部评论

推荐最新楼层

莫莫罗

东南大学 C++

1 回复分享

发布于 05-16 01:20 江苏

人狠话不多的番石榴很调皮

安徽省安庆市石化第一小学理财顾问

接好运

点赞回复分享

发布于 05-16 13:38 北京

05-11 21:07

门头沟学院 Java

如何预估/回答接口本身能抗住多少 QPS

与哪些因素有关后端服务器集群节点数量，数量越多，QPS越高后端服务器节点的运行配置：运行内存、Cpu核数等等，硬件资源决定单节点处理能力接口本身做的事情 a. 做的事情多耗时长（预估QPS会相对应低） b. 做的事情少耗时短（预估QPS会相对应高） 4.系统架构 a. 完善的流量负载均衡架构，实现流量的有效分发和负载均衡，避免成为QPS瓶颈 b. 缓存技术，减轻数据库的压力，避免数据库成为QPS瓶颈 c. 集群模式的数据库，避免数据库成为QPS瓶颈 d. 静态资源通过CDN加速，避免成为QPS瓶颈如何预估？首先需要知道一个请求处理完毕的时间（这个请求里可能做很多事情，但是这个我们暂时不管），一...

Java后端开发总结

点赞评论收藏

05-22 08:34

苏州大学 Java

百度日常二面

1.能实习多久2.多快到岗3.线程池底层咋做的，说说你的项目里，线程池参数怎么设置4.aop你的项目里咋做的手撕跳跃路径

查看5道真题和解析

点赞评论收藏

05-14 11:17

已编辑

门头沟学院 Java

小米后端开发日常实习二面

应该是去年10月面的，最近复习八股，就每天往牛客贴一条面试记录，自己也复习一下。1. 没让我自我介绍，而是问我还没找到实习吗？ 。。。找到实习了我还面试干嘛。。。2. 实习做了什么？项目来源？3. redis常见数据结构，用了哪些？4.除了redis还有知道有哪些缓存，回答memcached。追问区别。5.布隆过滤器。（简历里写了用来解决缓存穿透，每次都会被问，面试官真的喜欢问这个）6.jvm内存结构，垃圾回收算法7.除了kafka还了解哪些消息队列，有什么区别，为什么有这么多种8.读过哪些源码9.算法题：快排10.反问对里面的八股我简单贴下回答和扩展（个人理解，有问题欢迎指出）3. Stri...

查看9道真题和解析

点赞评论收藏

05-09 12:12

浙江工业大学 Java

快手后端一面日常

0508实习与项目八股1. 线程池的核心参数、工作流程，如果服务重启上线，线程池队列中的任务还存在吗？2. mysql中索引的数据结构？3. redis为什么性能好，什么是I/O多路复用？4. redis的lru缓存手撕lru缓存

查看4道真题和解析

点赞评论收藏

不愿透露姓名的神秘牛友

05-18 00:05

分库分表

分库分表模式：1. 垂直分库：垂直份库指的是按照业务模块维度将原本集中在一个数据库中的多个表，拆分到多个独立的数据库中。每个数据库只负责一个或几个功能相近的业务模块，例如用户库、订单库、商品库等。本质上，垂直拆库是将一个“通用大库”拆解成“多个专业小库”，使每个库专注于一类业务领域。2. 垂直分表垂直分表指的是将一个表中字段较多、关注点不同的列按功能拆分成多个表，通常以主键（如用户ID）为关联字段，拆分后的表仍具有一对一或一对多的关系。举例：将原 user 表拆成 user_base（基本信息）和 user_detail（扩展信息）两个表。3. 水平分库水平分库是指：将表的数据按某种规则分散到...

运营每日一题牛客创作赏金赛

点赞评论收藏

全站热榜

腾讯暑期补捞

热聊中

创作者周榜

正在热议

# 如果今天是你的last day，你会怎么度过？ #

# 简历无回复，你会继续海投还是优化再投？ #