百度度秘:(一面挂)

我面的是NLP岗位。

面试形式是微信视频+collabedit编程。

面试官一上来就让我做了几句简单的自我介绍,然后就开始考我代码了。第一个代码题是敏感词检测问题。用户输入query长文本,而系统有个敏感词列表,要求检测用户的query是否有敏感词。我没啥很好的思路,就和面试官尴尬了大概几分钟吧,然后他就换题了。这次换的是二叉搜索树转双向链表,要求在一块空白页面上先自己定义类,再构建树,最后转为双向链表,限时20分钟。我时间到了还是没写完,面试官就让我说一下思路。我简单说了一下,他说我思路是对的,就开始和我聊实习和项目了。感觉面试官对我的实习经历和项目经历不是特别看得起,随便问了一些有的没的,还时不时流露出一股鄙视感。没过多久,他就开始转问我各种机器学习和深度学习的基础了,无非是LR、随机森林、xgboostgbdt之间的那些事情,深度学习就问了点CNN为什么能用在NLP中,激活函数RELUSigmoid之间的区别,优缺点之类的。我答得一塌糊涂,因为还在实习,没有好好复习,甚至都让面试官觉得我是不是才转机器学习的。大哥,你问的这些问题不背是答不出来的啊!后面他就让我说一下有什么想问他的,然后就结束了。唉!难得的一次面试就这么挂了,我实在是太菜了。

最后,求求大佬告诉我第一题的敏感词检测怎么做啊!#百度##算法工程师##内推##秋招##提前批#
全部评论
看来我在贴吧发的贴子30%被删不是没有理由的 百度研发的重心都在敏感词库上了,我的贴子天天莫名其妙中枪
点赞 回复 分享
发布于 2018-08-11 21:04
kmp -> 字典数 -> ac自动机吧
点赞 回复 分享
发布于 2018-08-11 20:58
敏感词可以用字典树,状态机来做
点赞 回复 分享
发布于 2018-08-11 20:51
之间好像见过类似的敏感词检测,用树去存储敏感词,如果第一个字是敏感词就从根节点开始往下找,如果找到符合的支路就证明找到敏感词。可以用hashMap嵌套去实现这个结构,用一个标志作为最内层的结束符。然后用你的数据和这些hashMap去做匹配查找。
点赞 回复 分享
发布于 2018-08-11 20:52
倒排文档?
点赞 回复 分享
发布于 2018-08-13 23:21
我也是一面挂
点赞 回复 分享
发布于 2018-08-12 10:15
你咋知道自己挂了按?
点赞 回复 分享
发布于 2018-08-11 21:29
同度秘nlp一面挂😂今下午刚面的
点赞 回复 分享
发布于 2018-08-11 21:10
楼上正解。。。ac自动机,不过这玩意要手写真要命。
点赞 回复 分享
发布于 2018-08-11 21:01
敏感词检测我也不会,上次面携程机器学习也问到
点赞 回复 分享
发布于 2018-08-11 20:51
楼主在哪实习的
点赞 回复 分享
发布于 2018-08-11 20:42

相关推荐

点赞 评论 收藏
分享
评论
点赞
27
分享

创作者周榜

更多
牛客网
牛客企业服务