【ai产品】1.基础模型概述:大语言模型

最近没更新,因为去干了件大事,我辞职啦!!!离职前,因为工作性质原因,确实各种内耗,严重影响心里健康了,这里离职后,发现不上班是真的爽,短期也没有找工作的打算了,也打算好好理一下我的职业或者说人生规划。这次还是先总结这段时间对ai方面的学习。

课程中,对于大模型的介绍,是按大模型从训练到评测的过程来安排的,包括:数据集、预训练、微调、强化学习、模型评测5个方面。

数据集方面,现在已有众多公开的数据集,如GLM-130B等,要求数据集高质量、大规模、丰富性。同时,需要对数据集进行评测,对于不同的数据类型(文字、图片、音频)有不同的标注方法。

预训练:预训练数据集的构建、效果评测

微调:其实主要是指令微调,因为模型训练本质是预测,并不是问答,微调主要就是通过有监督的训练,是模型能更好的对话。其实可以在prompt中使用few show来告知模型需要怎么样的回答,但是对于数据较多情况,就不适用了。

强化学习:因为模型会产生有害性以及幻觉,因此需要使用强化学习,人工告诉模型结果是好还是坏。

模型测评:现在模型评测已经比较多了,有考察客观题的c-eval,还有集合客观与主观的openCampus。
全部评论

相关推荐

头像 会员标识
10-01 22:53
中南大学 C++
📍面试公司:深信服🕐面试时间:9.28💻面试岗位:ai 应用开发❓面试问题:1.询问机试感受2.目标北京,深圳可以接受吗(接受意愿很低)3.询问高中noip情况4.询问本科acm情况5.如何衡量自己学习和竞赛之间的投入6.本科专业(非科班)7.高考原因,高中作息8.是不是抗压比较差(我现在抗压可强了)9.本科的项目有吗10.是保研吗?为什么选择这个专业(非科班)11.询问课题组情况(我们课题组非常坑)12.目前论文情况13.研究生期间出差都干什么14.你做的方向很多,为什么?(我被导师换了4次方向,大四就被骗进组了)15.让我详细讲一下和导师之间的交流(里面老师很多操作不可理喻,我尽量的去跟老师争取)16.为什么会出现这种问题(整个课题组都非常抽象,解释了好久)17.你是怎么确定自己的研究方向的(讲了自我救赎的过程)18.暑期实习的offer?19.你为啥不投算法(你们给我统一改的啊)20.讲一下ai coding,平常用吗?21.前两个面试官不会 ai infra,可能后面要加5面22.为什么不实习转正(导师追的紧啊)23.你们实验室其他同学能找到工作吗24.你有其他offer吗,大约薪资多少,你期望薪资多少🙌面试感想:怎么感觉比技术面还压力,因为线下,问的太碎了,很多都记不起来了,面了近50分钟一直问我们课题组,我已经不想回忆这个痛苦的记忆了(提前一年进组,导师没有任何指导,组内没有博士按时毕业,还有一位博8的师兄,我也被导师pua抑郁了,吃了一年多的药了。前两天还把我叫过去,说我们去企业就是浪费人才,想让我留在课题组帮忙管理电脑????被我直接回绝了)
查看23道真题和解析
点赞 评论 收藏
分享
评论
2
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务