首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
首页 /
cot推理加速
#
cot推理加速
#
461次浏览
3人互动
收藏话题
分享
此刻你想和大家分享什么
热门
最新
06-13 22:18
字节跳动_算法工程师
【论文分享】CAR:推理长度自适应新框架,提升精度同时还降低推理token数!!
论文题目:Prolonged Reasoning Is Not All You Need: Certainty-Based Adaptive Routing for Efficient LLM/MLLM Reasoning论文地址:https://arxiv.org/pdf/2505.15154论文详解:https://mp.weixin.qq.com/s/_Rhj8TQFgRFka9xj3xwBpQ核心贡献1、提出了一个基于模型置信度动态切换短答案和长形式推理的 CAR 新框架,实现了准确性和计算效率之间的最佳平衡。2、通过广泛的初步研究,验证了困惑度(PPL)可以作为模型置信度的可靠指标,并通过高斯建模建立了其与答案正确性的关系。3、在 LLM 和 MLLM 上进行的广泛实验表明,CAR 在保持推理准确性的同时,显著减少了推理标记的使用,优于短答案和长形式推理方法。4、CAR 超越了以前的推理标记减少方法。例如,使用 Qwen2.5 时,CAR 在整体准确率上提高了 6.9%,同时减少了 21.4% 的标记消耗。使用 Llama3.1 时,它实现了 5.5% 的准确率提升和 39.0% 的标记使用减少。实现方法1、使用包含短答案和长形式推理答案注释的示例进行训练,通过标准指令调整过程优化交叉熵损失。2、在训练数据集的所有示例上进行短答案推理,计算每个短答案的 PPL 值。3、假设正确和错误短答案的 PPL 分布遵循高斯分布,通过训练数据估计这些分布的参数。4、对于新的输入示例,首先生成短答案并计算其 PPL 值,然后根据 PPL 值在正确和错误分布下的概率进行决策。如果短答案被认为是正确的,则直接输出;否则,模型将执行长形式推理以获得更准确的答案。
算法学习交流
点赞
评论
收藏
分享
玩命加载中
创作者周榜
更多
热议话题
更多
1
...
如何提高实习转正率?
0
2
...
第一份工作应该只看薪资吗
0
3
...
你被哪些公司秒挂过?
0
4
...
你想留在一线还是回老家?
0
5
...
大厂面试初体验
0
6
...
你后悔自己读研吗?
0
7
...
选完offer后,你后悔学本专业吗
0
8
...
月薪多少能在一线城市生存
0
9
...
你认为哪些项目算烂大街?
0
10
...
当下环境,你会继续卷互联网,还是看其他行业机会
0
牛客网
牛客网在线编程
牛客网题解
牛客企业服务