钉钉27暑期后端ai研发一面面经 1h

攒人品中,祝大家都能拿到满意的Offer!
1.深度参与项目,产出
2.OCR为什么做文件识别;部署的哪个
3.传统的读取pdf docx api sdk有用过吗
4.文本内容为啥还要用ocr
5.pdf图片内容;图片,图表的理解,怎么做;饼状图,折线图怎么提取语义信息
6.ocr背后的原理,给一个饼图,然后怎么输出内容
7.是否真的了解怎么识别占比类比这样的语义识别
8.有看过ocr调用,语义保留这样的指标的评估
9.怎么做评估;完全识别的指标又是怎么评估;九十分一百分怎么打分
10.图表识别怎么评估打分,怎么评判,有哪些依据
11.为啥选768维度
12.讲下embedding模型,怎么做embedding
13.embedding模型底层;什么是token;为啥100wtoken最大token数
14.大语言模型参数了解吗;在显存消耗的哪个层面消耗的
15.transfomer词表是怎么构建的吗
16.ES怎么构建的;这里面的关键词怎么构建的;BM25基于什么原理
17.一部分milvus语义召回,一部分ES关键词召回;怎么返回用户的
18.精排维度是多少,原理是什么
19.rerank精排基于什么;为啥精排效果更好
20.针对上述的你提的问题,说出自己解法
21.最核心的一个指标的什么;最核心的指标;归纳出最核心的一个综合指标
22.Function Calling、MCP、Skill分别解释概念;用到什么场景;分别解决了什么问题
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务