Datawhale AI夏令营记录
Datawhale AI夏令营记录
- task 2 赛事理解
- 原理
- 操作
task 2 赛事理解
原理
教师-学生训练法:学到深处,一通百通。要训练一个大模型,所需运算量太大,消耗大量资源,所以一种常用的做法是先训练出一个通用大模型,虽然对于具体问题不能有非常好的效果,但是对于任何一个具体问题,给出的回答都在及格线附近,就像是一个每项技术都懂一点的人。针对具体问题时,使用具体的数据,对这个大模型进行小幅度修改,从而得到与具体问题适配的新的大模型,相当于一个对某一门技术精通的人。对于一个模型,最重要的是其参数,所以修改的也是参数。
baseline采用的就是这种思想。
操作
1.运行结果为空
直接运行给出的baseline.ipynb是不行的,输出结果为空,需要修改参数token。
修改方法:进入https://cloud.siliconflow.cn/me/models,登录个人账户,在左侧边栏中下划,找到“API密钥”,进行新建,复制生成的密钥,在代码中找到
headers = {"Authorization": "填入token","Content-Type": "application/json"}
将“填入token”改为“Bearer 复制的密钥”,再去运行。
2.查看指南或者文档
还是上一步中的网址,在左侧边栏,找到“模型广场”,随便点击一个显示的模型,在弹出的页面中点击“API文档”,如下图所示,左侧可以找到“用户指南”,右侧可以切换模板的引用语言。