当前位置: 首页 > web >正文

服务器对kaggle比赛的数据集下载

1.在本地获取 Kaggle API Key(kaggle.json)

登录你的 Kaggle 账号。

点击右上角头像 → Setting。

滚动到 API 区域,点击 Create New Token。

会下载一个文件:kaggle.json(包含用户名和密钥)。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

2.建议安装conda环境进行隔离

3.安装 Kaggle CLI

pip install kaggle命令即可
在这里插入图片描述

4.配置 Kaggle 密钥文件

创建 .kaggle 文件夹:

mkdir -p ~/.kaggle

手动创建:

vim ~/.kaggle/kaggle.json

使用i进入编辑模式,看到下面最后一行有INSERT即可以编辑,去复制步骤一下载的kaggle.json文件,使用Ctrl+Shift+V命令粘贴 kaggle.json 的内容进去
然后esc退出编辑模式,:wq保存并退出即可

也可以设置权限:

chmod 600 ~/.kaggle/kaggle.json

如果不设置也行,就是下载数据集的时候有warning
在这里插入图片描述

5.下载数据集

一般来说,kaggle的数据集下载分为竞赛数据集、公开数据集和特定文件

如果数据集属于某个 Kaggle 竞赛(如 classify-leaves),使用 competitions download 命令:

kaggle competitions download -c <竞赛名称>

示例:

kaggle competitions download -c classify-leaves

文件会以 zip 格式下载到当前目录,解压命令:

unzip classify-leaves.zip

下载公开数据集
如果数据集是公开的(如 titanic 数据集),使用 datasets download 命令:

kaggle datasets download -d <数据集作者/数据集名称>
http://www.xdnf.cn/news/16167.html

相关文章:

  • Linux第三天Linux基础命令(二)
  • NumPy 数组拼接的高级技巧与实践
  • [深度学习] 大模型学习3下-模型训练与微调
  • 利用aruco标定板标定相机
  • 【faiss】用于高效相似性搜索和聚类的C++库 | 源码详解与编译安装
  • 友华PT104E关闭LED
  • 从零开始学习大模型之文本数据处理
  • MSTP实验
  • 字节跳动视觉算法面试30问全景精解
  • 检索增强型生成助力无人机精准数学推理!RAG-UAV:基于RAG的复杂算术推理方法
  • Node.js:RESPful API、多进程
  • linux-日志服务
  • SQLAlchemy 2.0简单使用
  • Linux 使用 screen 窗口会话稳定挂载jar包到后台运行
  • 初识opencv01——基本api操作
  • 解决pip指令超时问题
  • Android AppCompat:实现Material Design向后兼容的终极指南
  • TTL+日志的MDC实现简易链路追踪
  • 【Java SE】Object类
  • 高并发场景下的缓存问题与一致性解决方案(技术方案总结)
  • day059-zabbix自定义监控与自动发现
  • 哔哩哔哩视觉算法面试30问全景精解
  • 【Pytorch】数据集的加载和处理(一)
  • 从效率瓶颈到自动化:火语言 RPA 在日常工作中的技术实践
  • (Arxiv-2025)HiDream-I1:一种高效图像生成基础模型,采用稀疏扩散Transformer
  • Android Surface创建流程
  • CSS自适应布局实战指南
  • Selenium+Java 自动化测试入门到实践:从环境搭建到元素操作
  • TIM定时中断
  • 一些Avalonia与WPF内容的对应关系和不同用法