首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
ouyouy
昨天 00:14
门头沟学院 Python
发布于北京
关注
已关注
取消关注
AI算力公司测开一面
自我介绍
实现时候接口自动化的框架什么样,由什么组成
Agent项目内容是什么
Agent项目用的模型是什么
Agent评测怎么做的,效果评测有哪些维度
LLM-as-Judge 怎么实现的,入参是什么。两次打分区别很大是什么问题
优缺点、未来规划
手撕:
python+伪代码实现批量读数据集跑评测,生成评测报告
vibe coding实现以上功能,只写prompt即可
提示
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
05-27 17:27
已编辑
腾讯_后端开发实习生(实习员工)
来🦢的第一个需求就是3000行skill
在我来鹅之后,接到的第一个完整大需求就是需要编写一个skill,之前的实习也写过一些skill,但是在我的理解中skill就是跟提示词没差,把你需要的目标全写上就好了,所以第一次mr我提交了一个超过1200行的md,被mt打了回去,为了完成这个需求,我又赶紧请教了我身边的大神同学,获取一些写skill的经验,将原先1200行的md进行了对应的references拆封,又通过我朋友教我的验证机制验证这个skill的效果,最后完成了我的第一个需求。正好前两篇文章给大家分享了写好的用来包装简历的skill,那么今天来给大家分享怎么去写一个好的,可以实际用来工作的skill,摆脱只会写提示词的尴尬。构建 Skill 的五个步骤Step 0:先写 EvalsEval(Evaluation,评估)是一套结构化的、可重复运行的测试用例集,用来判断 Skill 的表现是否符合预期。它不是泛指"测试一下",而是开发 Skill 的前提条件。一个典型的 Skill eval 集至少包含三类用例:- 正例(Positive):用户说“帮我看一下这个 PR 能不能合”,验证 Skill 应该被加载- 负例(Negative):用户说“帮我把代码格式化一下”,验证 Skill 不该被加载——路由别跑偏到不该触发的地方- 边界(Edge):“这个 PR 改了一行日志,要不要审”,验证边界情况下的路由行为正例和负例都要写,而且负例往往比正例更值钱——误触发是 Skill 路由的头号失败模式。Eval 不只是测一次。Perplexity 的 eval 分三个层次:如下图每种都要在 GPT、Claude Opus、Claude Sonnet 不同的 orchestration 模型上分别跑——Sonnet 和 GPT 的 Skill 行为差异很大,只在一种模型上过了不够。没有 evals,你改 description 就是在盲改,一个新 Skill 也可能悄悄搞坏已有的十个 Skill。Step 1:写 Description(最难的一行)description 是路由触发器,不是文档。写好它不需要关心 Skill 的内容,只需要关心能不能在正确的时间加载、有没有意外触发到不应该触发的地方——误触发是头号失败模式,每加一个 Skill 都有可能让其他 Skill 变差。糟糕的 description 描述 Skill 做什么,好的 description 说什么时候加载。举个监控 PR 的例子:不要写这个 Skill 做什么,要写工程师感到焦虑时会说什么——"babysit"、"watch CI"、"make sure this lands"。快速检查清单:- 以"Load when…"开头- 控制在 50 词以内- 描述用户意图,最好来自真实查询- 不总结工作流程Step 2:写 Body跟同事讲工作流程和跟 LLM 讲工作流程完全是两回事。对几乎任何面世超过一年的软件工具,只要提名字,模型已经知道怎么用。所以跳过模型已经懂的部分。不用写出每一步命令。比如不要写 git log → git checkout main → git checkout -b clean-branch → git cherry-pick commit。写 "Cherry-pick the commit onto a clean branch. Resolve conflicts preserving intent. If it can't land cleanly, explain why." 模型在后者上表现好得多,尤其是事情不按预期走的时候。太规定的指令比灵活的指令更脆弱。然后聚焦 gotchas 和反例,它们是最高信噪比的内容。每次 Agent 搞砸了就加一条,gotcha 会自然地累积起来。条件逻辑或内容太重的东西移出 SKILL.md,放到 accessory file 里渐进加载。Step 3:用层级结构- scripts/ —— 确定性逻辑,模型不用每次重新发明- references/ —— 重型文档,条件触发才读("如果 API 返回非 200,读 api-errors.md")- assets/ —— 输出模板,模型直接复制填充- config.json —— 首次运行设置,问一次保存下来对于极其复杂的 Skill,进一步考虑是否应该拆成一组 Skill,用 depends: 声明加载关系。Step 4:迭代切分支出来,在无 Skill 的状态下跑 hero query(核心用户场景查询),建 eval 集,反复调。提交 review 时最好一个 changeset 里自带 eval 集。Description 里的小词改动对路由影响很大,甚至会 spillover(溢出)到其他 Skill,所以这些在 Step 5 之前做完。Step 5:发布大家快把这5步实行起来,成为写skill专家吧!
琉璃梦忆:
直接skill creator 管你这那的
AI了,我在打一种很新的...
点赞
评论
收藏
分享
05-20 18:33
算法工程师
从互联网到制造业:头部大厂不同岗位的薪资天花板在哪里?
提到“大型厂商”,很多人的第一反应就是高薪、体面、福利好。但具体能拿到多少钱,却是一个因公司、行业、岗位、城市甚至学历背景而天差地别的问题。本文将基于公开的行业报告、招聘平台数据及员工分享,为您勾勒出当前中国主流大型厂商的薪资轮廓。一、 互联网科技巨头:金字塔尖的“总包”游戏以腾讯、阿里巴巴、字节跳动为代表的头部互联网公司,其薪资结构通常为“基本工资 + 年终奖(通常3-6个月)+ 股票/期权”,业内称之为“总包”。应届生(白菜价): 技术岗(算法、后端)年包约在 30万-45万元;非技术岗(产品、运营)约 20万-28万元。部分顶尖博士(如华为“天才少年”)可达百万级。7xfga.cn中级工...
点赞
评论
收藏
分享
05-03 20:36
济南大学 大数据开发工程师
求助 2026移动校招
已经参加了AI测评,怎么能知道过没过啊,看别的省份有的都出后续了,山东的同学有收到后续通知的吗
点赞
评论
收藏
分享
05-24 16:04
已编辑
门头沟学院 测试工程师
东莞汇均——测试工程师
时间:2025.9.1老板面(30min)+填表做题(20min)(共一轮):-----------------------------------------------------------------------------------------------依旧填表和做题,题目有很多逻辑题,类似如此: 1.一个商人带一只骆驼跨越1000公里,想卖多少根根萝卜来着,但是一只骆驼只能带x根,骆驼每走一公里吃n根,后面的忘了 2.盲人怎样在一筐有黑色和白色的袜子,各拿到一双颜色 3.拿彩色球概率问题什么的 4.眼前有摆几瓶营养液,其中有几瓶带有毒药,老鼠需要最少喝多少瓶会喝到带毒的?---...
查看2道真题和解析
点赞
评论
收藏
分享
05-27 18:56
门头沟学院 Java
还是得去实习啊
家人们,主包最近实习公司可以爽用ClaudeCode 太牛了 mentor哥给了我几个skill,什么需求分析、写代码等;小的需求主包就能直接上手做了;实习之前因为穷没用过,现在每天都在用,有种乡下人进城了的感觉 太爽了虽然公司不大,但是token真舍得烧啊,主包还用他润色简历,看看老项目有啥AI结合的空间大家有什么好用的skill,评论区求推荐!!
勇敢的烤冷面在写总结:
前端设计的:https://github.com/Leonxlnx/taste-skill
点赞
评论
收藏
分享
一键发评
框架组成?
接好运
爱信等
Agent模型?
评测维度?
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
来🦢的第一个需求就是3000行skill
4.4W
2
...
父母还是太爱我们
1.8W
3
...
27届暑期大厂后段高频面试汇总
1.6W
4
...
10年代码经验,分享我常用的AI工具
1.1W
5
...
我可能就是大家口中的"工贼"
4060
6
...
凉经-腾讯音乐软件开发(后台开发)一面
4044
7
...
26届学院本总结
3820
8
...
父母就是我求职路上最大的山
3677
9
...
大厂嘉豪图鉴
2982
10
...
大厂工贼 - 恐怖如斯
2921
创作者周榜
更多
正在热议
更多
#
实习生的蛐蛐区
#
999136次浏览
5081人参与
#
国企是春招机械人最好的去处吗
#
153920次浏览
585人参与
#
发面经攒人品
#
8873541次浏览
98477人参与
#
硬件人的简历怎么写
#
350892次浏览
3147人参与
#
27届实习投递记录
#
163627次浏览
1663人参与
#
AI了,我在打一种很新的工
#
208711次浏览
2238人参与
#
万物皆可发面经
#
4724次浏览
58人参与
#
实习,不懂就问
#
229557次浏览
1763人参与
#
运营人求职交流聚集地
#
260328次浏览
1135人参与
#
秋招投递攻略
#
296098次浏览
2643人参与
#
你的mentor是什么样的人?
#
67260次浏览
852人参与
#
实习生至暗时刻
#
93716次浏览
942人参与
#
实习如何「偷」产出?
#
772563次浏览
8615人参与
#
从mentor身上学到了__
#
67753次浏览
949人参与
#
父母对你找工作是助力还是阻力?
#
52752次浏览
467人参与
#
你觉得mentor喜欢什么样的实习生
#
64190次浏览
1090人参与
#
我和mentor的爱恨情仇
#
121596次浏览
1047人参与
#
非技术投递记录
#
741718次浏览
6979人参与
#
找实习记录
#
282583次浏览
1664人参与
#
第一次找实习,我建议__
#
90038次浏览
923人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务