4.8 钉钉-S项目-暑期实习java研发一面

1.自我介绍
2.深度参与项目，产出
3.OCR为撒做文件识别；部署的哪个
4.传统的读取pdf docx api sdk有用过吗
5.文本内容为啥还要用ocr
6.pdf 图片内容；图片，图表的理解，怎么做；饼状图，折线图怎么提取语义信息
7.ocr背后的原理，给一个饼图，然后怎么输出内容
8.是否真的了解怎么识别占比类比这样的语义识别
9.有看过ocr调用，语义保留这样的指标的评估
10.怎么做评估；完全识别的指标又是怎么评估；九十分一百分怎么打分
完全识别
11.图表识别怎么评估打分，怎么评判，有哪些依据
12.为啥选768维度
13.讲下embedding模型，怎么做embedding
14.embedding模型底层；什么是token；为撒100wtoken最大token数
15.大语言模型参数了解吗；在显存消耗的哪个层面消耗的
16transfomer词表是怎么构建的吗
17.ES怎么构建的；这里面的关键词怎么构建的；BM25基于什么原理
18.一部分milvus语义召回，一部分ES关键词召回；怎么返回用户的
19.精排维度是多少，原理是什么
20.rerank精排基于什么；为撒精排效果更好
21.你觉得这些策略涉及有哪些问题；讲了四个问题
权重；向量维度；双向量检索的策略；切分策略（切分维度）
22.针对上述的你提的问题，说出自己解法
23.最核心的一个指标的什么；最核心的指标；归纳出最核心的一个综合指标
24.function calling mcp skill，解释概念；用到什么场景；分别解决了什么问题
答得不好
25.prompt engining ，context engining，hareness enginering 解释什么问题
答得不好
26.抽象类和接口却别
27.jvm内存回收；什么情况下适合标记清除，什么标记整理
28存活时间怎么定义

这里列下六个ai概念和解释
24. Function Calling、MCP、Skill：概念、场景与解决的问题
这三个概念其实代表了 AI 智能体（Agent）与工具交互的三个不同层级：底层协议、通信标准、业务封装。
1. Function Calling (函数调用)
概念：这是大模型的一种底层能力。它让模型不仅能输出文本，还能输出结构化的数据（如 JSON），告诉程序“我要调用哪个函数，参数是什么”。
解决的问题：解决了“模型说不清楚，程序读不懂”的问题。它打破了模型只能聊天的限制，让模型有了“手”，能触发外部动作。
场景：
简单的工具调用：查天气、计算器、查询数据库。
提取结构化信息：把用户的一段话转换成 JSON 对象。
2. MCP (Model Context Protocol，模型上下文协议)
概念：由 Anthropic 提出的标准化通信协议。你可以把它理解为 AI 界的 USB-C 接口。它定#牛客AI配图神器#义了一套标准，让 AI 应用（Client）能统一地连接到各种数据源和工具（Server）。
解决的问题：解决了“连接碎片化”和“上下文孤岛”的问题。以前每接一个工具都要写一套适配代码，现在只要工具支持 MCP 协议，AI 就能直接连，不用重复造轮子。
场景：
企业级应用集成：统一连接本地文件、Google Drive、Slack、GitHub 等。
跨平台工具共享：开发者开发一个 MCP Server，所有支持 MCP 的 AI 客户端都能用。
3. Skill (技能)
概念：这是面向业务的能力封装。它通常是一个包含指令、脚本、资源和提示词的“文件夹”或集合。Skill 往往基于 Function Calling 构建，但更复杂。
解决的问题：解决了“工具零散，无法完成复杂业务”的问题。它把一个个原子化的函数（如“查航班”、“查酒店”）组合成一个有意义的业务能力（如“订机酒套餐”）。
场景：
复杂任务处理：比如“帮我策划一次旅行”，Skill 会自动规划步骤，依次调用查天气、订机票、订酒店的函数。
垂直领域专家：比如“法律助手 Skill”，里面封装了查法条、写文书的特定流程和提示词。
📌 总结对比表
表格
概念本质定位核心解决问题形象比喻
Function Calling底层交互协议模型输出结构化指令神经信号（告诉手要动）
MCP通信与调度层统一连接标准，避免重复开发USB 接口（通用插头）
Skill业务能力层复杂任务编排与封装操作手册（怎么做菜）
🧠 25. Prompt Engineering、Context Engineering、Harness Engineering
这三个概念代表了 AI 应用开发从“手工作坊”到“系统工程”的进化过程。
1. Prompt Engineering (提示词工程)
解释：这是最早期的阶段。核心是“写咒语”。通过精心设计自然语言指令（如“你是一个专家，请一步步思考...”），引导模型输出更好的结果。
局限：它是一次性的、静态的。如果任务太复杂，光靠一段话很难控制模型。
2. Context Engineering (上下文工程)
解释：这是目前的主流趋势。核心是“构建信息流水线”。
它不再只关注那一句提示词，而是关注如何把最有效的信息（知识、历史、工具描述）在恰当的时机喂给模型。
它包括 RAG（检索增强）、记忆管理、摘要压缩等技术。
解决问题：解决了模型“记性差”、“知识过时”和“幻觉”问题。它把模型从一个“聊天机器人”变成了一个“拥有外部知识库的专家”。
3. Harness Engineering (编排工程/智能体工程)
注：Harness 在这里通常指“智具编排”或“系统 harness”，类似于 LangChain 或 AutoGen 这类框架所做的工作。
解释：这是最高阶的阶段。核心是“系统级管控”。
它不仅仅是给信息，而是设计一个工作流。比如：先让模型 A 写代码，再让模型 B 审查代码，如果报错再让模型 A 修改。
它涉及多智能体协作、循环反馈、工具调用的逻辑编排。
解决问题：解决了复杂任务的自动化执行和可靠性问题。
📌 一句话总结进化史
Prompt Engineering：教模型“怎么说话”。
Context Engineering：给模型“参考资料和记忆”。
Harness Engineering：给模型“ teammates（队友）和工作流程”。

4.8 钉钉-S项目-暑期实习java研发一面

全站热榜

创作者周榜