TCL算法一面记录

1. 专业方向 职业规划方向
2. 有无训推经验 用的什么模型
3. 八股
softmax公式 sigmoid公式
temperature用来干嘛的 怎么实现的
topk topp什么作用
beam-bandwidth什么作用
模型回答的长短用什么参数控制
模型生成答案重复率高 调什么参数
4. 问项目*1
遇到的困难 怎么评估
整个pipeline最大的难点
全部评论
请问是base哪呀?有手撕嘛?
点赞 回复 分享
发布于 10-27 09:59 上海

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务