当前位置: 首页 > ops >正文

Datawhale AI夏令营记录

Datawhale AI夏令营记录

  • task 2 赛事理解
    • 原理
    • 操作

task 2 赛事理解

原理

教师-学生训练法:学到深处,一通百通。要训练一个大模型,所需运算量太大,消耗大量资源,所以一种常用的做法是先训练出一个通用大模型,虽然对于具体问题不能有非常好的效果,但是对于任何一个具体问题,给出的回答都在及格线附近,就像是一个每项技术都懂一点的人。针对具体问题时,使用具体的数据,对这个大模型进行小幅度修改,从而得到与具体问题适配的新的大模型,相当于一个对某一门技术精通的人。对于一个模型,最重要的是其参数,所以修改的也是参数。
baseline采用的就是这种思想。

操作

1.运行结果为空
直接运行给出的baseline.ipynb是不行的,输出结果为空,需要修改参数token。
修改方法:进入https://cloud.siliconflow.cn/me/models,登录个人账户,在左侧边栏中下划,找到“API密钥”,进行新建,复制生成的密钥,在代码中找到

headers = {"Authorization": "填入token","Content-Type": "application/json"}

将“填入token”改为“Bearer 复制的密钥”,再去运行。
2.查看指南或者文档
还是上一步中的网址,在左侧边栏,找到“模型广场”,随便点击一个显示的模型,在弹出的页面中点击“API文档”,如下图所示,左侧可以找到“用户指南”,右侧可以切换模板的引用语言。
在这里插入图片描述

http://www.xdnf.cn/news/16472.html

相关文章:

  • 第二十二节 MATLAB转置向量、MATLAB追加向量
  • v4l2_ctrl_handler_setup()函数详解
  • JavaWeb 新手学习路线:从零到全栈开发,系统掌握企业级 Web 开发技能
  • 智能制造--EAP设备自动化程序
  • Ubuntu “apt”安装
  • 搜索引擎高级搜索指令大全(Google、百度等浏览器通用)
  • 枚举策略模式实战:优雅消除支付场景的if-else
  • ANSYS Products 2025 R2 安装配置全流程教程(图文详解)
  • Kafka 顺序消费实现与优化策略
  • 【智慧物联网平台】编译jar环境 Linux 系统编译IOT物联网——仙盟创梦IDE
  • MySQL SQL性能优化与慢查询分析实战指南:新手DBA成长之路
  • 接口测试核心概念与实践指南
  • Error reading config file (/home/ansible.cfg): ‘ACTION_WARNINGS(default) = True
  • ABP Framework + EF Core 迁移命令失败问题完整解决记录
  • 开发笔记 | 实现人物立绘的差分效果
  • 全面解析MySQL(4)——三大范式与联合查询实例教程
  • LeetCode|Day28|67. 二进制求和|Python刷题笔记
  • 【MySQL学习|黑马笔记|Day1】数据库概述,SQL|通用语法、SQL分类、DDL
  • 归档日志-binlog
  • 元宇宙工厂前端新形态:Three.js与WebGL实现3D产线交互的轻量化之路
  • XCF32PVOG48C Xilinx Platform Flash PROM
  • Maven中的bom和父依赖
  • [Linux]线程池
  • 【免费可用】【提供源代码】对YOLOV11模型进行剪枝和蒸馏
  • 跨境协作系统文化适配:多语言环境下的业务符号隐喻与交互习惯
  • Java项目:基于SSM框架实现的社区团购管理系统【ssm+B/S架构+源码+数据库+毕业论文+答辩PPT+远程部署】
  • Nuxt3 全栈作品【通用信息管理系统】修改密码
  • 亚远景-“过度保守”还是“激进创新”?ISO/PAS 8800的99.9%安全阈值之争
  • 【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 微博文章数据可视化分析-点赞区间实现
  • 【HTTP】防XSS+SQL注入:自定义HttpMessageConverter过滤链深度解决方案