2022-04-03 【Creamlittlemoon】打卡_牛客网

Creamlittlemoon

2022-04-03 10:36 晶科能源股份有限公司_IT 架构规划部_数仓BI工程师

关注

coming

在牛客打卡19天，今天学习：刷题 5 道

每日监督打卡

全部评论

推荐最新楼层

05-17 20:33

已编辑

南京邮电大学 Java

Agent开发中最混乱的领域——一文读懂Agent 评测现状

一、为什么 Agent 评测比 LLM 评测更难？ 传统 LLM 评测（现在当然更复杂维度更多元化）关注的是文本生成质量——回答是否流畅、事实是否正确、格式是否合规。但 Agent 是一个完整的系统，它要自主决策、调用工具、与环境交互、在多轮对话中保持状态。这意味着：  不能只看最终输出，还要看中间过程是否合理（中间过程非常重要） 不能只看单次执行，还要看重复执行是否稳定 不能只看功能正确性，还要看性能、成本、并发能力 不能只在单一场景测试，还要覆盖工具调用、长上下文、多轮对话等维度（工具调用的能力评测也是目前的难点与重点）  LLM 评测像测发动机，Agent 评测像测整车——必须综合考察在...

点赞评论收藏

分享

昨天 19:23

门头沟学院前端工程师

AI 为什么总喜欢写防御性代码？

AI 生成代码时，经常会写出一种看起来很谨慎的风格：到处判断空值、到处给默认值、到处包 try/catch，读取环境变量时还特别喜欢加 trim() 和 fallback。比如下面这种代码很常见： const port = Number(process.env.PORT?.trim() || 3000); const apiKey = process.env.API_KEY?.trim() || ""; const timeout = Number(process.env.TIMEOUT || 5000); try { // do something } catch (er...

我与AI的日常

点赞评论收藏

分享

04-02 19:24

武汉城市学院测试工程师

投了好多份 找不到工作 简历有问题吗😓没招了 求职

站队站对牛：现在不光是你大家就业都难

投了多少份简历才上岸

点赞评论收藏

分享

05-12 15:26

北京邮电大学 C++

10天四面，速通字节，终于结束了😡

回家当保安：今天刚过字节一面，接佬的好运

我的求职进度条

点赞评论收藏

分享

05-14 21:09

鱼鸢网络_CEO

微信面试官：“你有 CLI 开发经验么？” 我怒了：“这年头大厂还做这个？不优化下存储空间吗？”

大家好，我是程序员鱼皮。 最近不知道大家有没有注意到，互联网大厂的风向又变了。 Google 率先开源了 Workspace CLI，紧接着短短一周之内，飞书、钉钉、企业微信不约而同地在 GitHub 上开源了自己的 CLI 工具。  一时间，CLI 这个计算机世界里最古老的交互方式，突然又火了。 奇了怪了，CLI 不就是黑不拉几的命令行窗口吗？都什么年代了，各大厂不去卷更漂亮的界面，反而集体开起了倒车？  这篇文章，我会依次分享：  什么是 CLI？ 怎么用 CLI？ 为什么大厂都在卷 CLI？ 有哪些 CLI 开源项目？ 怎么自己做个 CLI？  一次性把 CLI 给你讲明白，建议收藏~ ...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 26届春招投递记录 #

28704次浏览 205人参与

# 我与AI的日常 #

9453次浏览 129人参与

# 27届实习投递记录 #

107023次浏览 1054人参与

# 你是怎么和mt相处的？ #

109077次浏览 566人参与

# 我的求职总结 #

507527次浏览 7044人参与

# 数字马力求职进展汇总 #

356719次浏览 2405人参与

# 工作压力大怎么缓解 #

169391次浏览 1381人参与

# 腾讯工作体验 #

644784次浏览 3905人参与

# 材料专业就业可以去哪些企业岗位 #

68838次浏览 396人参与

# 不考虑薪资和职业，你最想做什么工作呢？ #

168288次浏览 913人参与

# 我的租房踩坑经历 #

222856次浏览 1156人参与

# 同花顺工作体验 #

17089次浏览 27人参与

# 牛客租房专区 #

206754次浏览 2582人参与

# 你的房租占工资的比例是多少？ #

101524次浏览 906人参与

# 滴！实习打卡 #

860036次浏览 6897人参与

# 嵌入式转岗的难度怎么样 #

141390次浏览 2842人参与

# 如果公司降薪，你会跳槽吗？ #

168164次浏览 965人参与

# 产运销实习日记 #

107293次浏览 740人参与

# 摸鱼被leader发现了怎么办 #

206803次浏览 937人参与

# 你在职场上见过哪些“水货”同事 #

41403次浏览 175人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务