首页 > 试题广场 >

在使用知识蒸馏(Knowledge Distillation

[单选题]

在使用知识蒸馏(Knowledge Distillation)时，温度参数T的作用是什么？

T越小，教师模型的软标签越平滑

T越大，教师模型输出的概率分布越平滑(softmax输出更均匀)，能传递更多关于类别间相似性的暗知识(Dark Knowledge)

```
T仅影响训练速度
```
```
T应始终设为1
```

查看答案及解析

这道题你会答吗？花几分钟告诉大家答案吧！

提交观点

问题信息

机器学习

难度：

0条回答 0收藏 4浏览

热门推荐

相关试题

扫描二维码，关注牛客网
意见反馈
下载牛客APP，随时随地刷题

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号