DAY 22 Kaggle 比赛
Kaggle 的比赛如何运作
- 加入比赛
阅读挑战赛描述,接受比赛规则并访问比赛数据集。 - 开始工作
下载数据,在本地或 Kaggle Notebooks(我们的免设置、可自定义的 Jupyter Notebooks 环境,带有免费 GPU)上构建模型,并生成预测文件。 - 提交 将您的预测作为提交
上传到 Kaggle 并获得准确率分数。 - 查看排行榜
查看您的模型在我们的排行榜上与其他 Kaggler 的排名。 - 提高你的分数
查看论坛,找到来自其他竞争对手的大量教程和见解。
我将在本次比赛中使用哪些数据?
在本次比赛中,您将可以访问两个类似的数据集,其中包括乘客信息,如姓名、年龄、性别、社会经济阶层等。一个数据集的标题为,另一个数据集的标题为 。train.csv
test.csv
Train.csv
将包含机上乘客子集(准确地说是 891 人)的详细信息,重要的是,将揭示他们是否幸存,也称为“基本事实”。
该数据集包含类似的信息,但没有透露每位乘客的 “真实情况”。预测这些结果是你的工作。test.csv
使用您在数据中找到的模式,预测机上其他 418 名乘客(在 中找到)是否幸存下来。train.csv
test.csv
查看 “Data” 选项卡以进一步探索数据集。一旦您认为您已经创建了一个有竞争力的模型,请将其提交给 Kaggle,以查看您的模型
提交文件格式:
您应该提交一个 csv 文件,其中包含 418 个条目和一个标题行。如果您有额外的列 (超出 和 ) 或行,您的提交将显示错误。PassengerId
Survived
该文件应恰好有 2 列:
PassengerId
(按任意顺序排序)Survived
(包含您的二进制预测:1 表示存活,0 表示已故)
明白了!我已准备好开始。如果我需要帮助,可以在哪里获得帮助?
- 如需竞赛帮助:泰坦尼克号论坛
Kaggle 没有专门的团队来帮助排查您的代码问题,因此您通常会发现,通过在相应的论坛中提出您的问题,您会更快地收到回复。论坛上充满了有关数据、指标和不同方法的有用信息。我们鼓励您经常使用这些论坛。如果你分享你的知识,你会发现其他人会反过来分享很多!
关于 Kaggle Notebooks 的最后一句话
正如我们之前提到的,Kaggle Notebooks是我们的无需设置、可定制的Jupyter Notebooks环境,配有免费的GPU和一个巨大的社区发布数据和代码库。
在每场比赛中,您都会发现许多 Notebook 分享,其中包含令人难以置信的见解。这是值得熟悉的宝贵资源。在此处查看本次比赛