永久免费的Google Colab 入门指南
相信很多同学在学习人工智能 (AI) 和数据科学 (Data Science) 的初期,都曾被繁琐的环境配置劝退过:安装 Python、管理虚拟环境、处理各种库的依赖冲突、想用 GPU/TPU 加速却发现配置复杂或硬件成本高昂…… 这些痛点是不是让你感同身受?
今天,我要向大家隆重介绍一款能彻底解决这些烦恼的神器 —— Google Colaboratory,我们通常简称它为 Colab。
为什么说 Colab 是 AI 和数据科学的最佳起点?
- 零配置,上手快: 你几乎不需要进行任何本地安装和设置。所有主流的 AI 和数据科学库(如 TensorFlow, PyTorch, Pandas, NumPy, Matplotlib 等)都已为你 预装并配置好。别人还在搜索如何安装软件时,你已经可以在 Colab 里敲代码了!
- 浏览器即是 IDE: 你可以在浏览器中直接 编写、运行和分享 Python 代码。无论你用的是手机、平板还是笔记本电脑,只要能上网,就能随时随地开始你的项目。
- 免费计算资源: Colab 免费提供 CPU、GPU 甚至 TPU 计算资源!这对于需要大量计算的深度学习任务来说,简直是福音。
- 云端存储与分享: 你在 Colab 中创建的所有内容(代码、笔记)都会自动保存在你的 Google Drive (谷歌云端硬盘) 中,方便你随时访问、管理,并且可以像分享普通文件一样,通过一个简单的链接将你的代码分享给任何人。
- Jupyter Notebook 的云端升级版: 如果你熟悉 Jupyter Notebook,那么可以把 Colab 理解为一个 托管在 Google 服务器上的 Jupyter Notebook,并在此基础上增加了许多便捷的功能,使其在 AI 和数据科学社区中广受欢迎。
话不多说,让我们直接上手体验 Colab 的魅力吧!
一、 开始使用 Colab
1. 访问 Colab: 在你的浏览器中搜索 "Google Colab",通常第一个结果就是 colab.research.google.com
。点击进入。
2. 初识 Notebook: Colab 的核心是 Notebook (笔记本)。首次访问时,你会看到一个弹出窗口,显示你最近使用过的 Notebooks。可能还会有一个名为 "Welcome to Collaboratory" 的官方介绍 Notebook。
3. 创建新 Notebook: 点击左上角的“文件 (File)” -> “新建笔记本 (New notebook)” 或在弹出窗口中直接点击 “新建笔记本”。
4. 重命名 Notebook (关键一步!): 新创建的 Notebook 会有一个默认的名字,比如 Untitled0.ipynb
。为了方便日后查找和管理,强烈建议立刻给它重命名!点击顶部的默认名称,输入一个有意义的名字,例如 Colab入门教程
。养成良好的命名习惯,几个月后再回来看代码,也能一目了然。
5. 自动保存: 请放心,你在 Notebook 中的所有修改都会自动保存到你的 Google Drive 中,无需手动保存。
二、 Colab 的基本单元:代码单元格与文本单元格
Notebook 由一系列 单元格 (Cell) 组成,主要有两种类型:
1. 代码单元格 (Code Cell):
-
这是你编写和运行 Python 代码的地方。
-
代码并非在你的本地电脑上运行,而是在 Google 的服务器 上执行。
-
首次运行时,Colab 会自动连接到 Google 的服务器。
-
如何运行代码?
- 点击单元格左侧的 播放按钮 (▶️)。
- 使用快捷键
Cmd/Ctrl + Enter
(运行当前单元格)。 - 使用快捷键
Shift + Enter
(运行当前单元格,并自动在下方创建一个新的代码单元格,这是最常用的方式)。
# 这是一个代码单元格 print("Hello Colab! 我在 Google 服务器上运行!")
运行上面的代码试试看!
2. 文本单元格 (Text Cell):
-
用于添加说明性文字、标题、注释、插入图片、视频、列表等。
-
支持富文本格式,可以通过上方的工具栏设置 加粗、斜体、标题、项目符号等。
-
它实际上使用的是 Markdown 语言。初学时不必深入学习 Markdown,但了解它可以让你写出格式更优美的文档。
Markdown## 这是一个二级标题这里可以写一些解释性的文字,对代码进行说明。* 列表项 1 * 列表项 2我们甚至可以插入图片: 
通过组合使用代码单元格和文本单元格,你可以创建出既能运行代码,又包含丰富解释和文档的交互式 Notebook。
三、 解锁硬件加速:运行时与 GPU/TPU
我们提到代码在 Google 服务器上运行。Colab 允许你选择不同的硬件来执行代码:
1. 更改运行时类型: 点击菜单栏的 “代码执行程序 (Runtime)” -> “更改运行时类型 (Change runtime type)”。
2. 硬件加速器选项:
- None (无): 默认选项,代码将在 CPU 上运行。适用于简单的 Python 脚本和不需要大量计算的机器学习任务。
- GPU (图形处理单元): 最常用的硬件加速器,可以显著加快许多 AI 和数据科学计算,特别是深度学习模型的训练。Colab 免费提供 GPU 资源!
- TPU (张量处理单元): Google 自主研发的专用芯片,专门为加速 AI 计算设计,尤其擅长处理大型机器学习模型。Colab 也免费提供 TPU 资源!
如何选择?
- 刚开始学习或运行简单代码,选
None
。 - 进行深度学习模型训练或复杂的科学计算,优先选择
GPU
。 - 处理超大规模模型或想体验极致加速,可以尝试
TPU
。
注意:
- 当你选择 GPU 或 TPU 时,Colab 会提示你:如果不需要硬件加速,请勿占用资源,以便 Google 能更有效地将资源分配给真正需要的人。
- 如果你的 Notebook 长时间(几小时)处于非活动状态,Colab 会自动断开与服务器的连接以节省资源。别担心,你的代码都还在,只是需要重新运行。可以通过 “代码执行程序 (Runtime)” -> “全部运行 (Run all)” 来重新执行所有单元格。
四、 内置宝库:预装的库与安装新库
Colab 的一大核心优势就是 预装了绝大多数常用的 AI 和数据科学库。
1. 直接使用预装库: 像 TensorFlow, PyTorch, NumPy, Pandas, Matplotlib, Scikit-learn 等库,你无需安装,直接 import
即可使用。
Python
import tensorflow as tf
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import torch# 可以检查一下版本
print("TensorFlow Version:", tf.__version__)
print("NumPy Version:", np.__version__)
print("Pandas Version:", pd.__version__)
print("PyTorch Version:", torch.__version__)
2. 安装其他库: 如果需要使用 Colab 未预装的库,也非常简单。只需在 pip install
命令前加上一个 感叹号 !
,即可在 Colab 环境中执行终端命令。
Python
# 安装一个未预装的库,例如 'seaborn'
!pip install seaborn# 安装完成后,就可以正常导入使用了
import seaborn as sns
print("Seaborn 安装并导入成功!")
五、 Notebook 管理与分享
1. 创建与打开: 通过“文件 (File)”菜单可以方便地创建新 Notebook 或打开 Google Drive 中已有的 Notebook。
2. 处理教程/共享代码 (重要!): 当你打开别人分享的 Colab Notebook (例如教程) 时,通常是只读模式。为了能够运行和修改代码,你需要先 “文件 (File)” -> “在云端硬盘中保存副本 (Save a copy in Drive)”。这会在你自己的 Google Drive 中创建一个可编辑的副本。
3. 分享你的成果: 点击 Notebook 右上角的 “共享 (Share)” 按钮,你可以像分享 Google Docs 一样,生成一个链接,将你的 Notebook 分享给其他人。对方只需拥有 Google 账户和网络连接,就能查看甚至运行你的代码(取决于你设置的权限)。这使得协作和教学变得极其方便。
4. 下载 Notebook: 如果你想将 Notebook 保存到本地,可以通过 “文件 (File)” -> “下载 (Download)” 选择下载为 .ipynb
文件(Jupyter Notebook 的标准格式)或 .py
文件(纯 Python 脚本)。
为什么 .ipynb
更受欢迎? .ipynb
文件格式特别适合数据科学和机器学习,因为它:
- 可以同时保存代码、代码的 输出结果 以及文本注释。
- 单元格是模块化的,可以方便地 调整顺序、删除、添加注释。
六、 总结
Google Colab 无疑是进入 AI 和数据科学领域的强大助力。它凭借 零配置、免费计算资源 (GPU/TPU)、云端集成、易于分享 等核心优势,极大地降低了学习和实践的门槛。
你只需一个 Google 账户和浏览器,几秒钟内就能开始编写、运行和分享你的代码,而无需担心本地环境的任何配置问题。