2025-01-24 18:05 浙江大学算法工程师发布于浙江

关注

米塔碳大数据开发岗位面试经验分享第2弹！！！

基于上一期的问题我再进行一些补充

4.Kafka 高性能原理

为什么 Kafka 速度快？答案通常涉及顺序读写、零拷贝、页缓存等。

-回答： 用直观语言说明 Kafka 的顺序写特性，以及操作系统页缓存对性能的提升作用。

削峰和解耦的具体实现？

-回答：用自己的话讲一下如何通过调整生产者的 batch.size 和 linger.ms 来削峰，以及如何通过消费者组实现解耦。

5.Hudi 与数据湖

Hudi 表的类型有哪些？MOR 和 COW 的特点是什么？

-回答：讲一下MOR和COW是什么/有什么区别。前者适合读取频繁的场景，而后者更适合写入密集的场景。

是否遇到过小文件问题，如何解决？比如，HAR 归档或动态分区合并文件。

-回答：我这主要是说Compaction 策略来合并小文件。

6.常见的大数据工具及同步流程

数据同步工具：DataX、Maxwell、CDC 的使用场景。

-回答：优缺点+使用场景。这不用多说了哈~按照这种结构就好

数据治理：小文件合并、无用表清理。

-回答：提到通过定期调度脚本清理小文件，以及使用 Hive 元数据清理工具保持仓库整洁。

总的来说米塔碳这次面试让我深刻意识到技术栈的重要性。像 Flink、Kafka、Hudi 这些工具是当下大数据开发的核心，熟悉它们的原理和实际应用可以让你脱颖而出。同时，数仓建模和数据治理是基础中的基础，任何想从事大数据开发的人都要扎实掌握！回答问题时也要结合实际经验，更有说服力。

ps:面试官很有趣哈~话很有梗但也非常专业，我有些缺失的点他最后都会给我讲明白，蛮好的！

#程序员##面试时最害怕被问到的问题##大数据##米塔碳#

全部评论

推荐最新楼层

04-07 22:13

西安石油大学网络安全

腾讯云智技术运营

想问一下各位大佬，笔试的题难不难啊，主要考哪些知识点，心里没底不太敢答

点赞评论收藏

昨天 16:14

数字马力（长沙）信息技术有限公司_后端开发

公司打分

[吃瓜 ing]办公环境：★★★★ 办公室挺新，设施齐全工资福利：★★☆☆ 五险一金齐全成长空间：★★★ 能接触项目，但晋升看机遇加班强度：★★☆ 偶尔加班，整体还能接受团队氛围：★★★★ 同事都挺好，技术氛围还行心累指数：★★★ 打工人嘛，都懂总结：适合想稳定发展的，追求快速晋升的 Might 慎重。反正没有完美的工作，看自己取舍呗。[狗头][保命]

给工作过的公司写一条大众...

点赞评论收藏

03-17 11:10

数字马力（长沙）信息技术有限公司_后端开发

忆往昔

暑假实习应该是腾讯云智给我的面试，当时可紧张了，到处找人问，当时也是没准备好，第一次面试，网上了解了很多tx系会问的，结果都没闻到，现在看来问的都是些简单的，估计也是kpi面试吧。

春招/暑实第一面是哪家？

点赞评论收藏

03-24 09:35

门头沟学院 Java

腾讯云智国产数据库B是云一吗？

各位大佬 腾讯云智国产数据库是云一吗？  云智提前实习薪资是怎么算的捏～ 有大佬能解答下嘛～

点赞评论收藏

04-07 10:27

已编辑

门头沟学院全栈开发

有没有投搜狐畅游的uu

各位佬现在都什么进度了呀，方便给小弟透露透露吗

点赞评论收藏

招聘动态

OPPO

2027届寻梦实习招聘

蚂蚁集团

2026春季校园招聘

阿里巴巴集团

2027届实习生校园招聘

正浩创新EcoFlow

2026届春季校园招聘

AI网申助手

网申字段一键填写

招商银行数字金融训练营

火热报名中

新华三

2026届春季校园招聘

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

全站热榜

创作者周榜

正在热议

# 给工作过的公司写一条大众点评，你会怎么写？ #

米塔碳大数据开发岗位面试经验分享 第2弹！！！

全站热榜

创作者周榜

米塔碳大数据开发岗位面试经验分享第2弹！！！