#hive##优化Hive配置设置hive.merge.mapfiles和hi_牛客网

牛客网ID612527157

2024-03-06 20:07 门头沟学院 Python

关注

#hive##优化Hive配置
设置hive.merge.mapfiles和hive.merge.mapredfiles为true
调整hive.merge.size.per.task和hive.merge.size.smallfiles.avgsize参数
使用更大的hive thrift socket time out
数据处理优化
减少数据倾斜，避免全表扫描
避免笛卡尔积产生，减少不必要的计算
分区粒度设计更细，减少后续任务处理数据量
JVM重用与优化
开启JVM重用，特别是在处理小文件或Task数量多的情况下
Job执行模式调整
将Job交给Yarn执行，以提高效率
SQL查询优化
不要使用MapReduce进行查询
避免在SQL字符串中配对操作
使用Parquet或ORC格式存储数据，提高读写速度
数据导入策略
确保Hive采取读时模式(Schema On Read)，以提高导入速度
解决特定问题
对于map阶段缓慢，考虑开启map端聚合等优化措施
解决任务执行进度卡在99%的问题，通过调整Counters平均值来优化

全部评论

推荐最新楼层

04-08 09:27

门头沟学院 Java

不是背了多少,而是用了多少

先给核心结论：Agent面试的核心逻辑，永远是「基础概念验证→落地能力验证→思考深度验证」，所有的问题都围绕这三层展开，面试官不是看你背了多少概念，是看你有没有真的把Agent用起来、有没有解决过真实的落地问题。下面分6大模块，把Agent面试的高频问题、回答核心要点、加分技巧，全给大家讲透，建议收藏。一、基础概念必问题（面试开场第一道门槛，答错直接凉）这类题是面试的敲门砖，主要验证你对Agent有没有基础认知，答错了基本一面就挂，回答核心是「讲清本质，结合自己的理解，别只背概念」。你理解的AI Agent是什么？和大模型对话、RAG应用有什么本质区别？1. 核心定义：AI Agent是能感知...

Agent面试会问什么？

点赞评论收藏

分享

04-07 00:22

广西大学算法工程师

蚂蚁 AI应用开发二面

1. 你之前接触过的中间件里，挑一个最熟的讲讲它的核心设计，重点说为什么要这样设计如果讲消息队列，比较容易拉开差距的不是背概念，而是把吞吐、可靠性、顺序性和扩展性之间的取舍讲清楚。比如一套高吞吐 MQ 通常会采用顺序写磁盘、分区模型、批量发送、批量拉取和零拷贝来提升吞吐，但这么设计以后，消费顺序只能在单分区内严格保证，跨分区顺序就必须交给业务自己兜底。再比如可靠性不是简单开个副本就完事了，生产端要考虑重试和幂等，Broker 要考虑刷盘和副本同步策略，消费端还要考虑重复消费和位点提交时机。真正难的是理解这些机制不是孤立存在的，而是围绕吞吐、延迟、可恢复性一起做平衡。2. 软件工程里的设计原则你...

查看11道真题和解析

点赞评论收藏

分享

不愿透露姓名的神秘牛友

04-02 10:41

小厂实习怎么了，不耽误我拿offer

之前一直在牛客刷大家帖子，看到了很多人吹捧大厂多好多好。但是说个会被喷的事实：双非本，秋招拿了5个offer，比我那个在某大厂实习的室友还多一个。他在大厂做了三个月，负责链路中的一个中间模块。听起来很厉害对吧？但面试的时候面试官追问这个特征是怎么选的召回策略谁定的，他只能说这部分是算法团队负责的。我在旁边听得都替他尴尬。我呢？在一家不过百人的小公司做了个后台管理系统，全流程就我一个人。你问我任何一行代码为什么这么写，我都能给你掰碎了讲，因为踩过的坑我全记得——凌晨两点调CORS跨域问题的那种刻骨铭心你懂吗。说到底面试官要的不是你title多好看，是你到底有没有真正做过这件事。大厂名字能帮你过简历关，但到了面试那一步，你做的东西是不是你的，一问就知道了。后来我室友也想明白了，他说我那三个月最大的收获就是知道了食堂哪个窗口最好吃。我不知道他是在自嘲还是在认真的。

沉淀小子：能力就是大于title的，支持楼主。你的室友吃方面你还得跟他学

大厂实习和小厂实习最大的...

点赞评论收藏

分享

04-03 10:26

中国矿业大学 Java

hr先为昨天的delay道歉了，态度很温柔也很专业。主要问一些压力的克服实习内容与成长，困难怎么克服到岗时间与实习时长为什么不考研先打了个mentor和leader比较忙的预防针反问：工作节奏，offer时间

二十岁的编程男神王大...：兄弟，到岗时间你说的多少呀，我们导师只能要求六月走，感觉说六月会不会给挂了offer

查看4道真题和解析

点赞评论收藏

分享

昨天 18:10

福州大学 Java

三月到四月面试总结....

投递岗位：后端开发/agent各平台沟通情况：boss1500+，猎聘200+，智联200+，网申60+。面试情况：约面30+，简历挂10+，小厂oc4家，中大厂oc2家，周五准备入职，不能等了，边面边投吧。面经不再赘述，就写一些我的面试感受和一些小经验吧：对于小厂，遇到的基本上就一轮面，30min左右面试时间，个别会考察代码，其他的话多结合八股来考察，也不会很深，你只要不紧张，发挥稳定，基本上就oc了。对于中大厂，多轮面试，我分为技术面和HR面来说说吧。技术面的话一般是八股+算法，同时公司规模越大，对项目考察度越深，具体到某个技术在你项目的应用，为什么使用这个技术，某个环节出了问题引发了什么...

从投递到OC，你用了多久

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

米哈游2026校园招聘

应届生春招&全年实习生专项

招商银行信用卡中心

2027届暑期训练营

阿里巴巴集团

2027届实习生校园招聘

正浩创新EcoFlow

2026届春季校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

滴滴

2027届秋招储备实习生招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 父母问你工作找得怎么样，怎么回 #

8325次浏览 118人参与

# 面试被问期望薪资时该如何回答 #

389576次浏览 2176人参与

# 厦门银行科技岗值不值得投 #

19672次浏览 427人参与

# 哪些公司面试还在问八股？ #

3871次浏览 43人参与

# 想从事Agent应该学习哪些技术？ #

1696次浏览 55人参与

# 从投递到OC，你用了多久 #

8427次浏览 74人参与

# 你的秋招第一面感觉怎么样 #

146765次浏览 821人参与

# 有哪些公司在面试时考察AICoding？ #

3060次浏览 42人参与

# 什么人最适合大厂？ #

4256次浏览 39人参与

# 你觉得机械有必要实习吗 #

82158次浏览 515人参与

# HR面都在聊什么？ #

2847次浏览 42人参与

# AI时代还有必要刷leetcode吗？ #

1720次浏览 29人参与

# 哪一刻你突然觉得实习“有点值了” #

6919次浏览 53人参与

# kpi面有什么特征 #

106082次浏览 504人参与

# 硬件人的简历怎么写 #

341268次浏览 3120人参与

# 一人一道大厂面试题 #

133281次浏览 1331人参与

# 稳定和高薪机械人更看重哪个？ #

582452次浏览 5568人参与

# 总结:哪家公司最喜欢泡池子 #

171651次浏览 620人参与

# 四大天坑是哪四家？ #

113814次浏览 246人参与

# 计算机有哪些岗位值得去？ #

395237次浏览 2928人参与

# 哪些公司一直卡在简历筛选 #

109870次浏览 384人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务