算法打工人小旺

2025-08-02 22:19 中山大学算法工程师发布于山东

关注

Qwen3 Embedding 与 BGE 有什么区别？

🌟Encoder 架构的词嵌入模型
数据格式：[ CLS ]句子 A [ SEP ]句子 B [ SEP ]并行计算：同时感知上下文，计算速度快向量表示： Encoder 会在输入的最前面加一个特殊的[ CLS ]标记。在经过计算后使得[ CLS ］标记向量能够代表整句话的含义
Qwen3 Embedding 基于Qwen3模型，嵌入模型将单个文本段作为输入，用［ EOS ]标记所对应的向量代表整句话的向量。
Qwen3 Embedding 的训练过程
1.使用大合成数据进行弱监督学习利用Qwen3基座模型直接合成数据，而 BGE 与E5等模型都是从开源社区收集数据。
2.利用高质量合成数据进行 SFT 对筛选出的高质量合成数据和公开监督数据集进行监督训练。
3.模型合并
将微调过程中的多个模型检查点保存，采用 slerp 技术进行模型融合，增加泛化能力。
🌟Qwen3 Embedding 的数据合成
Qwen3 Embedding 模型加入信息检索、比对挖掘、分类和文本相似度四类合成数据。
以信息检索为例
1.输入：多语种文档＋候选角色
Qwen3-32B决策：选择最可能对文档感兴趣的角色、问题类型与难度（高中／大学的知识）
2.构造检索对：输入上一阶段的文档与角色，对问题类型、难度进行限制。从角色视角出发，按需求生成文档对应的自然语言查询。
🌟Qwen3 Embedding 的新用法
Qwen3 Embedding 模型的 query 前能加一个 prompt ，这个 prompt 会与 query 一起向量化。
那么我们就可以在向量化 query 前加一个 prompt :寻找写作风格相似的其他文档。
🌟总结🍊
1．训练数据不同。以前词嵌入模型采用公开数据，现在的训练数据会使用大模型加工合成，更精细可控，站在了巨人的肩膀上。
2．模型结构不同。在生成式大模型采用 Decoder 架构后，词嵌入模型也借鉴了 Decoder ，使用[ EOS ]标签对应的向量来表示句子向量。
3．训练方法改进。 Encoder 架构的训练方式是 Mask 猜词与相似度计算。而Qwen3词嵌入模型采用多阶段训练与合并结果，让模型效果更上一层楼。
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

03-07 09:24

门头沟学院 Java

面试AI技术研发岗的必刷题单

备战AI技术研发岗（算法/大模型/多模态）面试，刷题不能盲目！以下题单覆盖面试90%高频考点，不用贪多，刷透这些就够了！一、算法基础必刷题（重中之重，刷50-60题）核心目标：应对面试手撕代码，基础不丢分，这是入门门槛，不能偷懒！刷题范围：LeetCode 中等难度为主，重点刷数组、链表、栈队列、二叉树、动态规划、贪心，不用刷难题怪题，聚焦高频题。必刷重点：两数之和、二叉树的遍历（前中后序，递归+迭代）、最长回文子串、最长递增子序列、LRU缓存机制、TopK问题、二分查找（各种变体）。刷题数量：每天1-2题，总共刷50-60题，刷完复盘总结，确保同类题能举一反三，避免刷了就忘。二、机器学习必刷...

查看27道真题和解析

点赞评论收藏

分享

03-08 00:25

门头沟学院推荐算法

大模型算法实习面经——百度

攒人品中，祝大家都能拿到满意的Offer！1.介绍DPO和PPO2.DPO损失函数怎么算的3.梯度检查点如何提升效率4.详细讲一下deepseed5.以7B的模型为例，计算训练需要多少显存说明都有哪些部分，每部分怎么算的，以及用deepseed每一个阶段节省多少内存，怎么节省的，计算过程中都有乘以2字节是为什么，什么原理6.做Rag 时候的分块策略7.BM25原理，RRF的原理8.Kl散度的输入是什么，怎么来的手撕：用torch实现kl散度

点赞评论收藏

分享

03-08 20:25

门头沟学院后端工程师

转码选手的寻找暑期实习之路（3）-Shopee虾皮后端日常一面

自我介绍如何理解Mysql中的事务？对于Java内存模型是否有了解？JUC并发编程中的数据结构用到过哪些？是否有JVM调优经验？Mysql中有一个表，有a,b,c三列，b是索引，a是主键，当where b = 1时，要经历多少次IO？Mysql中聚簇索引和非聚簇索引的区别？如果出现慢SQL了怎么查看执行计划？项目中用到的RAG有哪些了解？对于分布式锁有哪些了解？如何用redis实现分布式锁？对于垃圾回收是否有了解？手撕 最长的不包含重复字符的子字符串感觉对于Mysql与Redis的询问更多，需要自我加强！

点赞评论收藏

分享

03-08 12:01

中南林业科技大学 Java

厦门南讯软件后端实习生一二面(已拿offer)

时间有几天了，可能有些地方不是记得很清楚了一面:1、自我介绍2、讲两个你认为做的很好的项目亮点，是你自己想到的吗？那你是怎么实现的呢？3、讲讲Java常用的集合有哪些？4、HashMap的底层和原理？5、什么是线程安全？6、线程创建有哪几种方式？7、数据库索引有哪些？8、索引有哪些失效的情况？9、你说你算法基础不错，那项目里有用到哪些传统算法解决什么问题？10、平常ai是怎么使用的？有用过哪些ai？11、反问环节二面:1、自我介绍2、把你认为你做过最难的项目功能详细讲一下？你说到rag检索功能，那具体实现算法讲一下，你是怎么实现的呢？3、llm怎么知道调用tool的？你是怎么具体实现的？4、有用到mcp吗？5、你的rag检索的文本有多大？是ai生成的还是你自己在电商爬取的数据？6、这个智能ai客服功能在最初实现前是你自己想的吗？选择了哪些架构和中间件？为什么选这些？7、反问环节两轮面试都挺短的，都是20分钟左右结束，没有手撕算法环节，八股文问的也不多不难，主要是偏向项目实际落地上，整体对我的ai技术点追究很多，感觉最近大大小小的公司对ai都很上心啊。上学期为了找第一份实习边学边看牛客给我整得失眠还吃上褪黑素了，结果还是0offer，寒假在家修养了一个月过完年就开投发现机会比9、10、11月份多，也是得偿所愿了。开始正式从学生向社会过渡，也不知道有哪些讲究。我这边也想问一下牛友们，实习生的穿着是不是要正式一点？平时午休和下班是自己看时间走吗，有没有铃声提醒？平时午休需要回去吗？还是直接在公司里休息？上班期间如果是带自己电脑可以使用ai或者百度问题吗？最开始怎么和同事打好关系？(本人比较内向，社交能力不足)感谢大伙解答了

大三一定要找到实习：恭喜恭喜，去了么感觉如何

点赞评论收藏

分享

03-07 08:35

门头沟学院机器学习

阿里淘天大模型算法实习面经好难啊

继续来分享下之前的面经~欢迎友好讨论，信息共享1. Transformer中Attention的本质是什么？你能从数学角度简要解释一下吗？2. 在Agent多轮对话任务中，你觉得Attention的局限性体现在哪些方面？3. 简要介绍一下SFT的核心流程，以及数据集的构建策略，SFT之后常见的Post-Training还有哪些？它们之间的目的有何区别？4. 什么是RAG，它是怎么提升生成质量的？与传统检索＋模型生成的流程有何不同？如何评估一个RAG系统是否work的？5. PPO和DPO在大模型对齐中的主要区别是什么？DPO训练通常有哪些注意事项？用过GRPO么？6. 项目里的Modular Agent，你能讲讲它是如何实现多步规划的吗？7. 项目提到了多个工具调用链路，调度策略是如何设计的？是否有异常fallback策略？8. Agent评估体系包括哪些维度？如何衡量planning能力 vs hallucination rate？9. 项目里微调Qwen，选择的训练阶段和Loss函数是如何决定的？10. Prompt自动推荐模块用了哪些优化策略？有没有尝试过Prompt压缩或embedding表示的方式？11. 场景题：假如一个Agent 推理链路包含3个工具+高频请求，系统整体延迟较高，你会如何优化？12. 代码：岛屿数量

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

74104次浏览 593人参与

# 你是怎么和mt相处的？ #

101904次浏览 496人参与

# 华泰星战营，提前锁定校招offer #

13726次浏览 389人参与

# 打工人的工作餐日常 #

95988次浏览 550人参与

# 拼多多集团-PDD笔试 #

86479次浏览 593人参与

# 网易游戏雷火笔试 #

11493次浏览 108人参与

# 26届秋招投递记录 #

123507次浏览 683人参与

# 招银网络科技（深圳）有限公司成都分公司笔试 #

5128次浏览 20人参与

# 毕业论文怎么查AI率 #

85407次浏览 1963人参与

# 网易笔试 #

171322次浏览 812人参与

# 简历上如何体现你的“AI”能力？ #

17345次浏览 382人参与

# 找不到大厂实习可以去小厂吗？ #

23176次浏览 278人参与

# 你总挂在第__面？ #

12344次浏览 148人参与

# 哪些AI项目值得做？ #

27148次浏览 663人参与

# 如何准备秋招 #

81852次浏览 871人参与

# 0offer互助地 #

769982次浏览 4723人参与

# 实习时最怕听到的一句话 #

23982次浏览 226人参与

# 多益网络工作体验 #

70114次浏览 312人参与

# 没有面试的日子里，你在做什么 #

14882次浏览 387人参与

# 秋招被挂春招仍然能投的公司 #

31803次浏览 241人参与

# 秋招开始捡漏了吗 #

244556次浏览 1058人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务