服务器对kaggle比赛的数据集下载
1.在本地获取 Kaggle API Key(kaggle.json)
登录你的 Kaggle 账号。
点击右上角头像 → Setting。
滚动到 API 区域,点击 Create New Token。
会下载一个文件:kaggle.json(包含用户名和密钥)。
2.建议安装conda环境进行隔离
3.安装 Kaggle CLI
pip install kaggle命令即可
4.配置 Kaggle 密钥文件
创建 .kaggle 文件夹:
mkdir -p ~/.kaggle
手动创建:
vim ~/.kaggle/kaggle.json
使用i
进入编辑模式,看到下面最后一行有INSERT
即可以编辑,去复制步骤一下载的kaggle.json文件,使用Ctrl+Shift+V
命令粘贴 kaggle.json 的内容进去
然后esc
退出编辑模式,:wq
保存并退出即可
也可以设置权限:
chmod 600 ~/.kaggle/kaggle.json
如果不设置也行,就是下载数据集的时候有warning
5.下载数据集
一般来说,kaggle的数据集下载分为竞赛数据集、公开数据集和特定文件
如果数据集属于某个 Kaggle 竞赛(如 classify-leaves),使用 competitions download 命令:
kaggle competitions download -c <竞赛名称>
示例:
kaggle competitions download -c classify-leaves
文件会以 zip 格式下载到当前目录,解压命令:
unzip classify-leaves.zip
下载公开数据集
如果数据集是公开的(如 titanic 数据集),使用 datasets download 命令:
kaggle datasets download -d <数据集作者/数据集名称>