当前位置: 首页 > ai >正文

Datawhale AI夏令营 task2 笔记问题汇总收集

一、跑完整体但是没有json文件

   查看权限问题是否出错。特别注意添加Bearer,否则没有权限,也会出现跑完整体没有json文件的情况。

二、生成qa问答对json格式问题

(所有方法可结合并行)
方法一、try except将格式不正确(格式强校验)的数据记录,然后无法转换的数据重新进行二次循环跑。

方法二、修改提示词部分加强格式稳定性,或者换成更加优良格式化的模型api

方法三、drop掉不符合格式的数据

三、有关于一直卡在遍历生成答案的问题

  主要原因是因为国内硅基流动调用api太慢,建议换成其他厂家的api。
同时也可以尝试更多类型的大模型,记得要更改api请求格式哦!

赛题理解

  有关于本次赛题理解,主要是着重在数据集的处理。
数据集处理分别为两块。
一是数据量的选择,是否可以选择大量的有效数据。

  二是问题多样性也就是数据多样性。

  通过这两个方式进行提升数据集的资料,以得到更高的分数。

  基于此,可以针对赛题写出不同的提示词,以让数据更加多种多样。

  同时也可对问题进行二次蒸馏,留下真正有意义的数据哦~

http://www.xdnf.cn/news/16426.html

相关文章:

  • 前端实现银河粒子流动特效的技术原理与实践
  • 安装及使用vscode
  • window显示驱动开发—Direct3D 11 视频播放改进
  • TDengine 中 TDgpt 用于异常检测
  • Java 笔记 transient 用法
  • 四、计算机组成原理——第3章:存储系统
  • JVM 垃圾回收机制全景解析:从对象回收到收集算法
  • 正向代理和反向代理的理解
  • 数据分析干货| 衡石科技可视化创作之仪表盘控件如何设置
  • laravel chunkById导出数据乱序问题
  • Open CV图像基本操作可莉版
  • 学习游戏制作记录(改进剑投掷状态)7.28
  • Leetcode_349.两个数组的交集
  • SPI通信协议
  • 分布式渲染效能探析:关键网络性能要素
  • 机器学习基础-matplotlib
  • linux系统----Ansible中的playbook简单应用
  • 计算机视觉---Halcon概览
  • 【算法训练营Day17】二叉树part7
  • 【学习路线】Android开发2025:从入门到高级架构师
  • linux命令grep的实际应用
  • MySQL 与 PostgreSQL 对比
  • Redis四种GetShell方式完整教程
  • 【WRF-Chem第二期】WRF-Chem有关 namelist 详解
  • 1.DRF 环境安装与配置
  • 零基础学习性能测试第九章:全链路追踪-系统中间件节点监控
  • LeetCode 刷题【18. 四数之和】
  • 计算机网络编程-Socket通信以及实战
  • 企业级JWT验证最佳方案:StringUtils.hasText()
  • 使用Ettus USRP X440对雷达和EW系统进行原型验证