全面安装指南:在Linux、Windows和macOS上部署Apache Cassandra
引言
Apache Cassandra 是一款分布式、开源的 NoSQL 数据库系统,旨在跨多台服务器管理海量数据,以确保高可用性和高性能。凭借其横向可扩展性,Cassandra 在要求高可靠性、速度和持续运行时间的应用场景中表现出色。本指南将带您逐步完成在 Linux、Windows 及 macOS 系统上安装和配置 Cassandra 的过程,指导您如何配置系统、连接 Cassandra Shell,并为大规模数据管理做好准备。
Cassandra 最初由 Facebook 开发,后由 Apache 软件基金会接管,因其能够在多台服务器之间处理巨量数据且无单点故障而著称。它采用独特的数据存储机制,即数据存储模型,并且是“点对点”架构,即系统中不存在中央服务器,所有节点地位平等。这一方式赋予 Cassandra 出色的容错能力,非常适用于需要持续在线和快速访问数据的应用,如电商、实时分析和物联网(IoT)。
架构与核心特性
Cassandra 的点对点分布式架构消除了单点故障,实现了无缝的横向扩展,非常适合需要持续在线的关键业务应用。通过可调一致性模型,Cassandra 为用户提供在每次查询时平衡延迟与数据准确性的灵活性,满足从快速搜索到安全订单处理等多样化应用需求。其列式数据模型支持高速写入,尤其适合处理高频率数据,如物联网、日志聚合和时序数据库。将新节点加入 Cassandra 集群非常简便,系统会自动管理数据分布,确保网络内的数据高效分配与负载均衡。
大数据生态中的应用场景与集成
Cassandra 广泛应用于实时推荐系统、分析平台和去中心化存储系统等领域,特别适合社交媒体、金融、电信等对数据访问速度和可靠性要求极高的行业。此外,Cassandra 能与 Apache Spark、Apache Kafka 等大数据工具无缝集成,是高性能实时数据管道的理想选择,满足高效处理和存储的双重需求。
无论您是在处理时序数据、管理大规模数据集,还是构建需要实时数据处理的应用,Cassandra 都凭借其高性能、可扩展和去中心化的设计,为您提供强大的解决方案。
前置条件
安装和配置 Cassandra 之前,请确保您满足以下要求:
- 基本命令行知识:熟悉命令行操作将简化安装流程;
- 操作系统兼容性:您的系统需运行以下之一:
- Linux(Ubuntu/Debian 或 Red Hat/Rocky Linux)
- Windows(通过 Windows 子系统 Linux, WSL)
- macOS
- 网络连接:需要联网以下载 Cassandra 和相关依赖;
- 管理员权限:需有权限在系统上安装软件,尤其是在 Windows 和 Linux 系统上。
安装步骤详解
在 Linux 上安装 Cassandra
首先介绍如何在 Ubuntu/Debian 及 Red Hat/Rocky 等 Linux 发行版上安装 Cassandra。
Ubuntu/Debian 系统安装步骤:
安装 Java:Cassandra 依赖 Java,先安装 OpenJDK。打开终端,输入:
sudo apt update sudo apt install openjdk-11-jdk
验证 Java 安装:
java -version
添加 Cassandra 仓库:为了获取最新稳定版,添加 Cassandra 源:
echo "deb https://www.apache.org/dist/cassandra/debian 40x main" | sudo tee -a /etc/apt/sources.list.d/cassandra.sources.list
添加 GPG 密钥:为安全安装需导入 Cassandra 仓库密钥:
curl https://www.apache.org/dist/cassandra/KEYS | sudo apt-key add -
更新软件包列表并安装 Cassandra:
sudo apt update sudo apt install cassandra
启动并设置 Cassandra 开机自启:
sudo systemctl start cassandra sudo systemctl enable cassandra
Red Hat/Rocky Linux 系统安装步骤:
安装 Java:
sudo yum install java-11-openjdk
添加 Cassandra 仓库:
sudo nano /etc/yum.repos.d/cassandra.repo
在文件中添加如下内容并保存:
[cassandra] name=Apache Cassandra baseurl=https://www.apache.org/dist/cassandra/redhat/40x/ gpgcheck=1 repo_gpgcheck=1 gpgkey=https://www.apache.org/dist/cassandra/KEYS
安装 Cassandra:
sudo yum install cassandra
启动并设置 Cassandra 开机自启:
sudo systemctl start cassandra sudo systemctl enable cassandra
在 Windows 上安装 Cassandra
Windows 平台通过 Windows 子系统 Linux(WSL)安装 Cassandra:
启用 WSL2(需 Windows 10 2004 及以上或 Windows 11):以管理员身份打开 PowerShell,输入:
wsl --install
通过 Microsoft Store 安装 Ubuntu,安装完成后打开 Ubuntu 进行初始化。
在 Ubuntu(WSL)中安装 Java:
sudo apt update sudo apt install openjdk-11-jdk
添加 Cassandra 仓库及密钥:
echo "deb https://www.apache.org/dist/cassandra/debian 40x main" | sudo tee -a /etc/apt/sources.list.d/cassandra.sources.list curl https://www.apache.org/dist/cassandra/KEYS | sudo apt-key add -
安装 Cassandra:
sudo apt update sudo apt install cassandra
启动 Cassandra:
sudo service cassandra start
测试安装:连接 Cassandra Shell 并运行命令验证
cqlsh
如看到
cqlsh>
提示符,则表示连接成功。
在 macOS 上安装 Cassandra
通过 Homebrew 安装 Cassandra 是 macOS 下最便捷的方法。确保系统已安装 Homebrew,如未安装可运行如下命令:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
安装 Java:
brew install openjdk
安装 Cassandra:
brew install cassandra
启动 Cassandra(需手动启动):
brew services start cassandra
测试安装:打开 Cassandra Shell 验证运行状态
cqlsh
输入
ping
检查连接,如收到提示,则安装成功。
Cassandra 服务管理
Cassandra 启动后,您可以按如下方式启动、停止或重启服务:
启动 Cassandra:
sudo systemctl start cassandra
停止 Cassandra:
sudo systemctl stop cassandra
重启 Cassandra:
sudo systemctl restart cassandra
结语
本指南介绍了如何在 Linux、Windows 和 macOS 上安装与配置 Apache Cassandra,如何启动和停止服务,如何通过 cqlsh 连接及测试 Cassandra 的功能。Cassandra 的分布式点对点架构使其成为管理海量数据的强大且可扩展的解决方案。
其对多平台的兼容性,令广泛用户都能轻松上手。一旦 Cassandra 部署完成,您即可深入探索其丰富的数据管理功能,轻松应对分布式大数据的挑战。