【AWS入门】Amazon SageMaker简介
【AWS入门】Amazon SageMaker简介
[AWS Essentials] Brief Introduction to Amazon SageMaker
By Jackson@ML
机器学习(Machine Learning,简称ML) 是当代流行的计算机科学分支技术。通常,人们在本地部署搭建环境,以满足机器学习的要求。
AWS是Amazon Web Service,即亚马逊云科技,其提供给用户超过200种云产品和服务。用户无需搭建硬件环境,就可以实现科学计算、数据分析、项目开发和运维、大数据、无服务器应用开发、人工智能等一系列技术创新和迭代。
访问AWS官网,可以看到Amazon SageMaker主页面。
图1 Amazon SageMaker主页面
AWS提供了机器学习的专有产品和服务,就是 Amazon SageMaker,利用业界先进的AI技术,在云平台上应用和完成机器学习。
1. 什么是Amazon SageMaker?
Amazon SageMaker AI 是一项云托管服务,它对机器学习 (ML) 服务完全托管。借助 SageMaker AI,广大用户包括数据科学家、人工智能专家、软件开发者,均可以快速、便捷地构建和训练 ML 模型,并将其快速部署到生产环境中。
Amazon SageMaker AI为运行 ML 工作流提供了用户界面体验,使 SageMaker AI ML 工具可在多个集成开发环境 (IDE) 中使用。
有了 SageMaker AI,用户就可以存储和共享数据,而无需构建和管理自己的服务器。这样,企业或用户就有更多时间来协作构建和开发特定功能的 ML 工作流程,并且可以高效完成工作。
SageMaker AI提供受控的ML算法,可在分布式环境中针对超大数据量运算高效运行。SageMaker AI 内置支持自带算法和框架,提供灵活的分布式训练选项,可根据用户需要的特定工作流程进行调整。用快捷的步骤,就能从 SageMaker AI 控制台将模型部署到安全、可扩展的环境中。
2. Amazon SageMaker主要功能
1) Amazon SageMaker新版发布
2024 年 12 月 03 日,AWS亚马逊云科技发布了新一代 Amazon SageMaker。
Amazon SageMaker 是数据、分析和人工智能的统一平台。新一代 SageMaker 集合了 AWS 机器学习和分析功能,为分析和人工智能提供了集成体验,可统一访问您的所有数据。
2) Amazon SageMaker 包括以下功能:
- Amazon SageMaker AI(前身为 Amazon SageMaker)- 利用完全托管的基础架构、工具和工作流,构建、训练和部署 ML 和基础模型;
- Amazon SageMaker Lakehouse - 跨 Amazon S3 数据湖、Amazon Redshift 和其它数据源统一数据访问;
- Amazon SageMaker 数据和 AI 治理 - 利用基于 Amazon DataZone 构建的 Amazon SageMaker Catalog 安全地发现、治理和协作数据和 AI;
- SQL 分析 – 结构化查询语言(Structured Query Language)即SQL,是关系型数据库必不可少的语言。 借助 Amazon Redshift 最具性价比的 SQL 引擎获得洞察力;
- Amazon SageMaker 数据处理 - 使用 Amazon Athena、Amazon EMR 和 AWS Glue 上的开源框架分析、准备和集成数据,以进行分析和人工智能;
- Amazon SageMaker Unified Studio - 在单一开发环境中使用所有数据和工具进行构建,以进行分析和人工智能;
- Amazon Bedrock - 构建和扩展生成式 AI 应用程序
- 通过DeepL.com(免费版)翻译
3. 安装Amazon SageMaker
要使用 Amazon SageMaker AI 中的功能,首先必须有访问 Amazon SageMaker AI 的权限。
通过设置 Amazon SageMaker AI 及其功能,有以下安装选项:
- 快速安装: 使用默认设置,为个人用户进行快捷安装配置。
- 自定义安装: 面向企业机器学习 (ML) 管理员,这些高级配置对于那些为多用户或组织设置 SageMaker AI 的 ML 管理员来说,显示是个理想的选项。
4. 访问AWS门户和身份验证
AWS通过网络门户,对所有AWS账户分配对应用程序的单点登录访问,通过AWS的 IAM 身份验证和访问。
关于具体如何登录 AWS 访问门户、登录提示以及如何退出 AWS 访问门户,作为 IAM Identity Center 用户,可登录 AWS 访问门户,详细步骤请参阅《AWS 登录指南》中的相关章节,进一步了解如何登录 AWS 访问门户。
图2 在AWS登录IAM控制台
5. Amazon SageMaker AI域
Amazon SageMaker AI 使用域(domain)来组织用户配置文件、应用程序及其相关资源。
Amazon SageMaker AI 域由以下部分组成:
- 相关的亚马逊弹性文件系统(亚马逊 EFS)卷
- 授权用户列表
- 各种安全、应用程序、策略和 Amazon 虚拟私有云 (Amazon VPC) 配置
每个域中都有私有应用程序和共享空间,如下图所示:
要访问大多数 Amazon SageMaker AI 环境和资源,用户必须使用 SageMaker AI 控制台或 AWS CLI 完成 Amazon SageMaker AI 域入门流程。
有关如何根据访问 SageMaker AI 的方式开始使用 SageMaker AI,以及必要时如何设置域的指南,请参阅 Amazon SageMaker AI 设置指南。
6. Amazon SageMaker的优势
1) 融通式合作开发工作室
Amazon SageMaker 融通式合作开发工作室提供集成式体验,让用户可以使用适用于分析和人工智能的所有数据和工具。
通过发现数据,并使用熟悉的 AWS 工具(适用于模型开发、生成式人工智能、数据处理和 SQL 分析)将数据用于实处。
使用统一的笔记本电脑处理计算资源,使用内置的 SQL 编辑器发现和查询不同的数据来源,大规模训练和部署人工智能模型,快速构建自定义的生成式人工智能应用程序。创建并安全共享分析和人工智能构件,例如数据、模型和生成式人工智能应用程序,以更快地将数据产品推向市场。
2) 整套安全的人工智能开发功能
借助一整套设计安全的人工智能开发功能,推进 SageMaker 中的人工智能发展。在高性能且经济高效的基础设施上训练、自定义和部署机器学习和基础模型(Fundation Model, 即FM)。
使用可满足整个人工智能生命周期需求的专用工具,覆盖高性能集成式开发环境(IDE)和分布式训练到推理、人工智能运维、治理和可观测性等领域。
使用尖端模型和专用数据,快速创建为业务量身定制的生成式人工智能应用程序。使用 Amazon Q Developer加快人工智能开发,帮助用户更加容易、轻松地发现数据、构建和训练机器学习模型、生成 SQL 查询以及创建和运行数据管道任务,所有这些都可通过自然语言完成。
3) 统一数据,减少数据孤岛
使用Amazon SageMaker数据湖仓,统一用户在 Amazon Simple Storage Service(Amazon S3)数据湖和 Amazon Redshift 数据仓库中的所有数据。
使用所有与 Apache Iceberg 兼容的工具和引擎,在分析数据的单个副本上灵活地访问和查询数据。
通过定义应用于湖仓中的分析和人工智能工具的精细权限来保护数据。通过零 ETL 集成,将运营数据库和应用程序中的数据近实时地导入湖仓。
此外,通过跨第三方数据来源的联合查询功能访问和查询数据。
4) 端对端数据和人工智能治理
通过贯穿整个数据和人工智能生命周期的内置治理,确保企业安全。Amazon SageMaker 确保用户能够控制正确的用户,用以出于正当理由访问正确的数据、模型和开发构建。
通过 Amazon SageMaker Catalog 的精细访问控制,使用单一权限模型一致地定义和强制执行访问策略。使用数据分类、毒性检测、防护机制和负责任的人工智能政策,以保护您的人工智能模型安全。
通过数据质量监控和自动化、敏感数据检测以及数据和机器学习任务流水线,让整个组织安心无忧。
关于Amazon SageMaker应用及开发,还有很多。
- 鸣谢:AWS亚马逊云科技
AWS技术好文陆续推出,敬请关注、收藏和点赞👍。
您的认可,我的动力!😃
相关阅读:
- 【AWS入门】Amazon Bedrock简介
- 【AWS入门】Amazon Q Developer简介
- 【AWS入门】AWS Lambda应用简介
- 【AWS入门】Amazon Nova简介
- 【AWS入门】Amazon S3简介
- 【AWS入门】Amazon EC2简介
- 【AWS入门】Amazon云计算简介
- 【AWS入门】创建并使用AWS Builder ID
- 【AWS入门】AWS亚马逊云科技账户注册指南
- 2025最新版Python 3.13.3安装使用指南