学会“原子化”Prompt

经验就一条:Prompt 一定要拆开,任务一定要变简单。

在面对小模型时,它们能力有限,如果把一堆要求(比如整篇文章+要求)塞进一个 Prompt,可能回答的就牛头不对马嘴了——不是主语识别不全,就是逻辑硬伤,或者答案缺斤少两。要把 Prompt 变成“工作流”,每一步只处理一个问题。

比如“根据文章提问”,我通常拆成三步:

  1. 第一步:只让模型识别文章的主语。
  2. 第二步:根据主语去编问题。
  3. 第三步:再针对问题生成答案。每步只干一件事,模型想出错都难。

再比如做长文本的“分块(Chunk)”处理:不要让模型重写全文,除非你的token值够用,而且还会增加它的思考难度。

你可以把原文段落编上号,让模型只输出:“标题1,插入原文第4行;标题2,插入第17行之前”。

这种“定位式”的输出,不仅省 Token 费用,而且模型理解起来极简单。任务变轻了,普通的 Instruct 模型也能跑出顶尖的效果。

总结一下:把复杂的思考题变成简单的填空题或定位题。只要流程拆得够细,小模型也能出奇迹。

全部评论

相关推荐

嵌入式的小白:其实就是看你除了工作外,生活压力大不大,比如有的人有孩子有父母有房贷等,或者那类加班多的,就看你个人生活占用多长时间 知道这个问题的目的,这类问题就知道怎么回答了每次面试我就说有房贷,入职后可以说房子卖了没房贷没压力,别整天觉得我压力大好压榨我
面试官问过你最刁钻的问题...
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务