腾讯ai应用开发日常实习二面分享 1h
攒人品中,祝大家都能拿到满意的Offer!
1、你们团队的multi-agents是你自己设计的?还是你只是完成了其中的一部分?
2、所以你只是做了,没有参与底层设计对吧,讲讲你在团队里日常都做什么?
3、你门团队的agent端到端成功率和工具误调用率是怎么量化的?用了什么工具?怎么去进行改进的?
4、我看你还有做医学语料的预处理工作,这块你们是怎么分工的?
5、你刚才讲了那么多步骤,所有工作都是你一个人完成的吗?或者说你主要负责哪几个环节
6、论文有很多不同的形式,你在做layout-aware parsing的时候,具体用的哪个工具去解析pdf?有没有横向对比其他工具?
7、噪声剔除的工作你平时是怎么做的?技术方案是什么?能不能详细讲一下
8、有多篇文章出现了重复片段,你是怎么去识别并归纳的?
9、业界对chunk切分和边界修正的主流策略是什么?
10、假设我现在有一个表格被切分成了两半,你怎么在众多paper中找到并纠错?
11、你们做的Graph RAG用了什么工具去进行评价?
12、你说的这个Graph里的三元组使用LLM去进行抽取的吗?怎么保证大模型不会因上下文过长而出现幻觉?
13、那你在设计三元组的时候是人工操作还是AI?有没有用到学术界提供的映射表之类的?
14、假设大模型在抽取实体的时候出现错误了,你怎么去排查?
15、我看你有在Graph RAG基础上做community summary,讲一下你这个设计思路
16、你怎么看待你做的这个图检索增强生成,和市面上常见的向量检索、混合检索有什么区别?
17、不同的RAG有做横向对比并量化成效吗?
笔试题:
用AI IDE写一个工具,语言不限,要求是能准确的从给定文本提炼出关键实体,并把对应的entity、relationship、claim用标准json形式输出。
1、你们团队的multi-agents是你自己设计的?还是你只是完成了其中的一部分?
2、所以你只是做了,没有参与底层设计对吧,讲讲你在团队里日常都做什么?
3、你门团队的agent端到端成功率和工具误调用率是怎么量化的?用了什么工具?怎么去进行改进的?
4、我看你还有做医学语料的预处理工作,这块你们是怎么分工的?
5、你刚才讲了那么多步骤,所有工作都是你一个人完成的吗?或者说你主要负责哪几个环节
6、论文有很多不同的形式,你在做layout-aware parsing的时候,具体用的哪个工具去解析pdf?有没有横向对比其他工具?
7、噪声剔除的工作你平时是怎么做的?技术方案是什么?能不能详细讲一下
8、有多篇文章出现了重复片段,你是怎么去识别并归纳的?
9、业界对chunk切分和边界修正的主流策略是什么?
10、假设我现在有一个表格被切分成了两半,你怎么在众多paper中找到并纠错?
11、你们做的Graph RAG用了什么工具去进行评价?
12、你说的这个Graph里的三元组使用LLM去进行抽取的吗?怎么保证大模型不会因上下文过长而出现幻觉?
13、那你在设计三元组的时候是人工操作还是AI?有没有用到学术界提供的映射表之类的?
14、假设大模型在抽取实体的时候出现错误了,你怎么去排查?
15、我看你有在Graph RAG基础上做community summary,讲一下你这个设计思路
16、你怎么看待你做的这个图检索增强生成,和市面上常见的向量检索、混合检索有什么区别?
17、不同的RAG有做横向对比并量化成效吗?
笔试题:
用AI IDE写一个工具,语言不限,要求是能准确的从给定文本提炼出关键实体,并把对应的entity、relationship、claim用标准json形式输出。
全部评论
相关推荐
点赞 评论 收藏
分享
