钉钉27暑期后端ai研发一面面经 1h
攒人品中,祝大家都能拿到满意的Offer!
1.深度参与项目,产出
2.OCR为什么做文件识别;部署的哪个
3.传统的读取pdf docx api sdk有用过吗
4.文本内容为啥还要用ocr
5.pdf图片内容;图片,图表的理解,怎么做;饼状图,折线图怎么提取语义信息
6.ocr背后的原理,给一个饼图,然后怎么输出内容
7.是否真的了解怎么识别占比类比这样的语义识别
8.有看过ocr调用,语义保留这样的指标的评估
9.怎么做评估;完全识别的指标又是怎么评估;九十分一百分怎么打分
10.图表识别怎么评估打分,怎么评判,有哪些依据
11.为啥选768维度
12.讲下embedding模型,怎么做embedding
13.embedding模型底层;什么是token;为啥100wtoken最大token数
14.大语言模型参数了解吗;在显存消耗的哪个层面消耗的
15.transfomer词表是怎么构建的吗
16.ES怎么构建的;这里面的关键词怎么构建的;BM25基于什么原理
17.一部分milvus语义召回,一部分ES关键词召回;怎么返回用户的
18.精排维度是多少,原理是什么
19.rerank精排基于什么;为啥精排效果更好
20.针对上述的你提的问题,说出自己解法
21.最核心的一个指标的什么;最核心的指标;归纳出最核心的一个综合指标
22.Function Calling、MCP、Skill分别解释概念;用到什么场景;分别解决了什么问题
1.深度参与项目,产出
2.OCR为什么做文件识别;部署的哪个
3.传统的读取pdf docx api sdk有用过吗
4.文本内容为啥还要用ocr
5.pdf图片内容;图片,图表的理解,怎么做;饼状图,折线图怎么提取语义信息
6.ocr背后的原理,给一个饼图,然后怎么输出内容
7.是否真的了解怎么识别占比类比这样的语义识别
8.有看过ocr调用,语义保留这样的指标的评估
9.怎么做评估;完全识别的指标又是怎么评估;九十分一百分怎么打分
10.图表识别怎么评估打分,怎么评判,有哪些依据
11.为啥选768维度
12.讲下embedding模型,怎么做embedding
13.embedding模型底层;什么是token;为啥100wtoken最大token数
14.大语言模型参数了解吗;在显存消耗的哪个层面消耗的
15.transfomer词表是怎么构建的吗
16.ES怎么构建的;这里面的关键词怎么构建的;BM25基于什么原理
17.一部分milvus语义召回,一部分ES关键词召回;怎么返回用户的
18.精排维度是多少,原理是什么
19.rerank精排基于什么;为啥精排效果更好
20.针对上述的你提的问题,说出自己解法
21.最核心的一个指标的什么;最核心的指标;归纳出最核心的一个综合指标
22.Function Calling、MCP、Skill分别解释概念;用到什么场景;分别解决了什么问题
全部评论
相关推荐
查看13道真题和解析 点赞 评论 收藏
分享
爱读书的小师弟很失落:继续找吧,别灰心,一般你这种学历,基础不太差最后都能找到的。 官网不能再投的,多在boss上捞捞 点赞 评论 收藏
分享