09-20 19:53 已编辑广州商学院数据采集发布于广东

关注

26届钛动科技数据开发实习，线上一面完30分钟后就发offer了

公司不大不小给我来说足够了，可惜好像很难转正。说是数据开发实际上是数据采集，能感觉到面试官对数据采集也不是很熟悉问的问题更倾向项目内容，名创优品的爬虫面试就是纯拷打了从基础到深入的技术问题。
第一个：playwright跟selenium的区别，因为从一开始就用playwright我只知道一个异步，也回答了因为从一开始就使用了playwright框架所以对selenium也不太了解。
第二个：谈谈反爬经历，我主要讲了youtube逆向以及cloudflare的绕过
第三个：出现爬不到内容该如何排查，网页结构，ip池，cookies池，u-a头
第四个：最难的项目，上份实习的监控系统youtube逆向以及cloudflare的绕过还有一个网页的逆向，最后是crawlab爬虫管理技术
第五个：验证码，我实话实说没有接触验证码，因为通常拿playwright指纹绕过会更简单快捷，所以基本没有接触过验证码的绕过。
第六个：大规模数据的保存，先用redis保存到一千到五千时再统一存入mysql
第七个：mysql的运用，当时说了一个系统的mysql使用逻辑
第八个：问我上份实习部署工作是是否为我做的，我说了是自己使用docker部署到服务器的
第九个：ai技术如何运用到爬取，我说了使用openai可以很有效的解决爬虫对于数据模糊爬取难的情况，以及crawl4ai的工作原理
第十个：爬虫的开发流程，我说主要是根据时间以及爬取的量，短时间可以用自动化工具，如果量大而且有时间则是用逆向加scrapy的协议爬虫，他说我太笼统了，于是我追加了crawlab的爬虫监控技术还有docker的多容器通信这些。
后面就没了，面试官也介绍了一下他的团队，3点半左右线上面试结束，4点左右hr就在boss问我一会是否有时间电话沟通确认到岗时间还有薪资情况，说第二天就发offer了

全部评论

推荐最新楼层

橙留香拉里拉里

北部湾大学测试工程师

好像他们公司都没开26届的校招岗，都是实习

点赞回复分享

发布于 10-10 15:30 广东

10-13 11:38

同济大学前端工程师

有惊无险，应届生勇闯互联网

【选择携程】我对携程有一定的了解，因为我特别喜欢旅行，当时携程也是我买票的首选软件，但在节假日的时候，票不是那么好抢的，我当时想能不能去弄一个抢票爬虫程序帮助我抢票。我学习爬虫的同时也学习了前端，后面在爬虫抢票的过程中，注意到携程有很多反爬机制，并且都还挺牛的，这也成为我选择携程最大加分项，所以，后面研二实习的时候就是去投携程的研发岗。开始实习的时候是有点紧张的，但是遇到了特别好的mentor和同事，尽管我的小问题很多，我的mentor会耐心的去引导我，并且会时不时分享技术经验，同事闲下来的时候也会帮我细心指出我写的代码块哪里的不足，哪里需要得到优化，我当时就有种感觉，说是同事，不如说大家是我...

携程公司氛围 121人发布

点赞评论收藏

分享

10-22 20:51

The University of Sydney 大数据开发工程师

JD 数据开发一面

22分钟 真快啊自我介绍Spark 对比其他引擎优劣处SparkAQE的功能数据倾斜的成因、解法SQL中DENSE_RANK vs ROW_NUMBER()场景题：200亿条user_id 要求全局有序对湖仓了解吗？对特征平台了解吗？提到擅长对问题的“抽象能力”，如何举例说明？怎么理解数据工程？怎么理解ETL？有offer吗？会AI、大模型吗？感慨：很紧张，好几个答的不知道对不对，而且场景题准备过结果突然愣神了唯一一个实习面试，希望能过吗

查看13道真题和解析

点赞评论收藏

分享

10-29 23:36

科华数据股份有限公司_自动化测试工程师(准入职员工)

科华数据内推，科华数据内推码

科华数据 提前批 硬件工程师（2026届）面经投递时间：7月24日，投完简历过后收到测评，5个工作日内完成。7月30日收到笔试通知，笔试内容包括数电模电电力电子方面的内容（我个人遇到模电里反馈组态考得比较多，还有个Buck拓扑电路题）8月6号收到面试通知8月8日HR电话面试，（HR面没啥专业问题）面试过程很轻松：1.自我介绍2.从自我介绍中凝练三个自身优势3.性格自我评价优缺点4.有做过大功率吗5.有面试其他公司吗？手里有offer吗6.有考虑公务员和电网吗7.对科华有了解吗8.有女朋友吗9.问期望薪资待遇，为什么这个期望，组内师兄姐待遇还有一些不太记得了反问：1.公司晋升渠道。答：技术、管理...

点赞评论收藏

分享

10-26 10:08

门头沟学院大数据开发工程师

字节数开一面

1.自我介绍2.你学数学为什么想做数据开发？3.介绍一下实习期间的工作？4.实习期间团队规模？主要的业务是什么？5.接受实习期间最有难度的项目？6.你是怎么对接需求的？怎么做到前端的看板？7.有没有过直接处理数据源的经历？还是所有的数据对你来说都已经落到 hive 表了8.有考虑过数仓分层设计吗？9.你对于业务域和公共层的划分有了解吗？10.在实习过程中遇到数据倾斜情况吗？怎么处理？11.数据倾斜的主要原因是什么？12. mapreduce 了解过吗？大概介绍一下。13. spark 有学习过吗？spark 如何划分 stage?14. 介绍一下星型模型和雪花模型15.实习过程中最大的收获16.未来的职业规划17.sql 手撕：用户互相关注18.如何优化这个任务

点赞评论收藏

分享

10-30 23:19

超参数科技_数据挖掘工程师(准入职员工)

超参数科技内推，超参数科技内推码

超参数秋招二面（后台开发）这家的一面面得特别顺利，但是二面直接翻了几倍的难度。第一次见女面试官，然后也是第一次见到有公司校招问system design的（国外都没碰到过）。面试官很有水平，上来没有自我介绍，直接深挖简历，提的基本都是工作中会实际遇到的问题。但是感觉有点是在问他们要的我会不会，而不是我会的有哪些，所以有些问题答起来有点别扭。总之还是很有独角兽风格的。全球科技独角兽-超参数科技2026校园招聘提前批启动啦！✅超参数科技成立于2019年，是一家将A1和游戏深度融合的创新型科技公司✅公司连续获得红杉中国、高瓴资本、五源资本、高榕资本等的多轮投资。在2022年跻身全球科技独角兽招聘岗位...

点赞评论收藏

分享

评论

1

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 我来点评面试官 #

6400次浏览 52人参与

# 实习教会我的事 #

37206次浏览 320人参与

# 京东开奖 #

442157次浏览 2489人参与

# 今年秋招是回暖还是遇冷 #

14529次浏览 88人参与

# 如果不考虑收入，你最想做什么工作？ #

36557次浏览 225人参与

# 你实习是赚钱了还是亏钱了？ #

15693次浏览 152人参与

# 商战，最累的是我们 #

24818次浏览 91人参与

# 京东工作体验 #

17355次浏览 104人参与

# 同bg的你秋招战况如何？ #

163906次浏览 953人参与

# 教师节，你送祝福了吗 #

9686次浏览 71人参与

# 用一句话形容你的团队氛围 #

9538次浏览 115人参与

# 秋招开始捡漏了吗 #

53012次浏览 361人参与

# 三一重工求职进展汇总 #

21730次浏览 82人参与

# 找工作八股要背到什么程度？ #

8730次浏览 143人参与

# 考研人，我有话说 #

150591次浏览 1199人参与

# 硬件人，你被哪些公司给挂了 #

69074次浏览 932人参与

# 58同城求职进展汇总 #

39000次浏览 260人参与

# 你找工作是从容有余 or 匆忙滚爬？ #

5635次浏览 64人参与

# 华为存储OD事变 #

144252次浏览 724人参与

# 上班后，才发现大学__白学了 #

9073次浏览 57人参与

# 大学生该如何认清当下的就业环境？ #

107981次浏览 637人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务