当前位置：首页 > web >正文

AI 入门：关键概念

web 2025/7/3 18:26:29

1. 基础概念

1.1 AI（Artificial Intelligence，人工智能）

1.2 Machine Learning（机器学习，ML）

1.3 Deep Learning（深度学习）

1.4 Neural Network（神经网络）

2. 核心技术

2.1 Natural Language Processing（NLP，自然语言处理）

2.2 Large Language Model (LLM, 大语言模型)

2.3 Computer Vision（CV，计算机视觉）

2.4 Reinforcement Learning（强化学习）

2.5 Generative Adversarial Network（GAN，生成对抗网络）

2.6 Prompt Engineering (提示词工程)

2.7 Transfer Learning (迁移学习)

2.8 Multimodal (多模态)

2.9 Parameters (参数)

2.10 Hyperparameters (超参数)

3. 数据相关

3.1 Big Data（大数据）

3.2 Data Mining（数据挖掘）

3.3 Labeling（数据标注）

4. 模型与算法

4.1 Supervised Learning（监督学习）

4.2 Unsupervised Learning（无监督学习）

4.3 Transfer Learning（迁移学习）

4.4 Transformer

5. 应用场景

5.1 Autonomous Driving（自动驾驶）

5.2 Recommendation System（推荐系统）

5.3 Large Language Model（大模型）

6. 行业术语

6.1 AGI（Artificial General Intelligence，通用人工智能）

6.2 AIoT（人工智能物联网）

6.3 Edge AI（边缘 AI）

6.4 MaaS（Model as a Service，模型即服务）

6.5 Agent (智能体)

6.6 Expert System (专家系统)

6.7 AIGC (AI-Generated Content, AI 生成内容)

7. 伦理与治理

7.1 Algorithm Bias（算法偏见）

7.2 Explainable AI（可解释 AI）

7.3 Federated Learning（联邦学习）

1. 基础概念

1.1 AI（Artificial Intelligence，人工智能）

人工智能，简单来说，就是模拟人类智能的机器系统。这些系统具备学习、推理、决策等能力，能够执行通常需要人类智能才能完成的任务，比如图像识别、语言翻译、疾病诊断等。它让机器 “学会思考”，代替人类完成一些复杂、重复性的工作，极大地提高效率。比如在安防监控中，AI 可以快速识别出异常行为；在电商领域，能根据用户浏览和购买记录精准推荐商品。

1.2 Machine Learning（机器学习，ML）

机器学习是 AI 的重要分支，它致力于让计算机通过数据自动学习规律，无需为每个任务进行显式编程。就像一个小孩通过不断观察和尝试，学会区分苹果和橘子，计算机也能在大量数据中找到模式。以垃圾邮件分类为例，给计算机大量的正常邮件和垃圾邮件，它通过学习这些邮件的特征（如关键词、发件人等），就能自动判断新邮件是否为垃圾邮件。电商平台的商品推荐也是利用机器学习，分析用户行为数据，为用户推荐他们可能感兴趣的商品。

1.3 Deep Learning（深度学习）

深度学习属于机器学习的范畴，它基于神经网络，尤其擅长处理图像、语音等复杂数据。其原理类似于人类大脑神经元的工作方式，通过构建多层神经网络，从大量数据中自动提取特征。在人脸识别系统里，深度学习模型学习大量人脸图像数据，能够精准识别出不同人的面部特征，实现门禁解锁、安防监控等功能。自动驾驶领域，深度学习帮助汽车识别道路、行人、交通标志等，保障车辆安全行驶。

1.4 Neural Network（神经网络）

神经网络是模拟人脑神经元结构的计算模型。它由大量节点（神经元）相互连接构成，每个节点接收输入信号，经过特定计算后输出结果。数据在这些节点中层层传递，不断被处理和转换。以简单的手写数字识别为例，输入的数字图像经过神经网络各层节点处理，逐步提取线条、形状等特征，最终判断出数字是几。它是深度学习模型的基础架构，让模型具备强大的学习和处理复杂数据的能力。

2. 核心技术

2.1 Natural Language Processing（NLP，自然语言处理）

自然语言处理致力于让机器理解、生成人类语言。生活中常见的聊天机器人、翻译系统都离不开它。聊天机器人通过对用户输入的文字进行语义分析，理解用户意图，再生成合适的回复。在机器翻译场景中，NLP 技术将一种语言的文本转化为另一种语言，比如把中文新闻翻译成英文，方便全球读者阅读。它涉及文本分类、情感分析、信息抽取等多个子领域，推动着人机交互更加自然流畅。

2.2 Large Language Model (LLM, 大语言模型)

大语言模型是基于海量文本数据训练的深层神经网络模型，像 GPT、BERT 等。它们拥有强大的语言理解和生成能力，能够处理复杂对话，进行内容创作。你使用的智能写作助手，可能就是基于大语言模型开发的，输入主题或要点，它能帮你生成文章、报告等内容。在智能客服领域，大语言模型可以快速准确回答客户问题，提升服务效率和质量。

2.3 Computer Vision（CV，计算机视觉）

计算机视觉赋予机器 “看懂” 图像或视频的能力。在医学影像分析中，它能帮助医生识别 X 光、CT 图像中的病变，辅助诊断疾病；安防监控利用计算机视觉进行目标检测，识别可疑人员和行为。智能零售领域，通过分析监控视频，了解顾客行为习惯，优化商品陈列和店铺布局。它涵盖图像处理、特征提取、目标检测等技术，让机器从视觉数据中获取有价值的信息。

2.4 Reinforcement Learning（强化学习）

强化学习通过试错和奖励机制训练智能体。以 AlphaGo 为例，它在与自己不断对弈的过程中，根据每一步棋的结果（赢了获得奖励，输了受到惩罚），学习到最优的下棋策略，最终战胜人类顶尖棋手。在机器人控制方面，强化学习让机器人在复杂环境中不断尝试不同动作，根据动作带来的结果（如是否成功完成任务、是否避开障碍物等）调整策略，实现高效、智能的行动。

2.5 Generative Adversarial Network（GAN，生成对抗网络）

生成对抗网络由生成器和判别器组成，两者相互对抗又相互促进。生成器负责生成新的数据（如图像、文本等），判别器则判断生成的数据是真实的还是生成器伪造的。以图像生成来说，生成器尝试生成逼真的图片，判别器努力分辨真假，在不断对抗中，生成器生成的图像越来越逼真，像 Deepfake 技术就是利用 GAN 生成以假乱真的人脸图像。它在图像生成、数据增强等领域应用广泛。

2.6 Prompt Engineering (提示词工程)

在使用大语言模型时，提示词工程非常关键。它通过设计有效的提示语（prompt），引导模型生成符合需求的输出。比如，你想让大语言模型写一篇关于春天的散文，精心设计的提示词 “请创作一篇优美的散文，描绘春天的自然风光、动植物变化，展现春天的生机与活力”，会比简单说 “写一篇春天的文章”，让模型生成更优质、更符合你期望的内容。近年来，随着大语言模型的广泛应用，提示词工程成为一项热门技能。

2.7 Transfer Learning (迁移学习)

迁移学习可以将在一个领域学到的知识迁移到另一个相关领域，从而减少新领域的数据需求和训练时间。例如，在 ImageNet 数据集上对图像分类模型进行预训练，学习到通用的图像特征。当进行医学图像分类任务时，利用迁移学习，在少量医学图像数据上微调预训练模型，就能快速得到一个性能不错的医学图像分类器，节省大量训练资源和时间。

2.8 Multimodal (多模态)

多模态 AI 系统具备同时处理多种数据类型（如文字、图像、语音）的能力。比如智能助手，不仅能理解用户语音指令（语音模态），还能识别用户发送的图片（图像模态）并根据图片内容进行回复，极大提高跨领域应用的灵活性和效果。在自动驾驶中，融合摄像头图像（视觉模态）、雷达数据（距离感知模态）等多模态信息，让车辆更准确感知周围环境，做出安全驾驶决策。

2.9 Parameters (参数)

模型内部通过训练自动学习并调整的数值，例如神经网络中的权重和偏置。这些参数决定了模型对输入数据的处理方式和输出结果。在一个简单的线性回归模型 y = wx + b 中，w 和 b 就是参数，模型训练的过程就是寻找最优的 w 和 b 值，使模型预测结果与真实值尽可能接近。模型的性能很大程度上取决于参数的取值，复杂的深度学习模型往往拥有海量参数，以学习复杂的数据模式。

2.10 Hyperparameters (超参数)

超参数是在训练前需要手动设置的配置项，对模型训练效果有重要影响。比如神经网络的层数、学习率、批量大小等。学习率决定了模型在训练过程中参数更新的步长，过大的学习率可能导致模型训练不稳定，无法收敛；过小的学习率则会使训练速度极慢。选择合适的超参数需要经验和多次试验，不同的任务和数据集可能需要不同的超参数配置。

3. 数据相关

3.1 Big Data（大数据）

大数据指的是海量、高增长、多样化的数据集合，它是 AI 模型训练的基础。如今，互联网、物联网设备每天产生海量数据，如社交媒体上的用户动态、电商平台的交易记录、传感器收集的环境数据等。这些数据为 AI 模型提供丰富的学习素材，通过对大数据的分析和学习，AI 模型能够发现复杂的模式和规律，提升自身性能。例如，视频平台利用大数据分析用户观看习惯，为用户推荐个性化视频内容。

3.2 Data Mining（数据挖掘）

数据挖掘是从大量数据中提取隐藏规律的技术。在用户行为分析中，通过数据挖掘可以发现用户购买商品的关联规则，比如购买纸尿裤的用户往往也会购买奶粉，商家根据这些规律优化商品推荐和营销策略。在市场预测方面，数据挖掘分析历史销售数据、市场趋势等，预测未来产品销量，帮助企业制定生产和库存计划。它为企业决策提供有力支持，从看似杂乱无章的数据中挖掘出有价值的信息。

3.3 Labeling（数据标注）

数据标注是为数据添加标签，用于监督学习模型训练。以图像标注为例，要训练一个识别猫和狗的图像分类模型，就需要人工对大量猫和狗的图片进行标注，标记出每张图片是猫还是狗。这些带标签的数据作为训练数据，让模型学习猫和狗的特征差异，从而具备识别新图片中动物类别的能力。数据标注的质量直接影响模型训练效果，准确、全面的标注数据能使模型学习到更精准的模式。

4. 模型与算法

4.1 Supervised Learning（监督学习）

监督学习使用带标签的数据训练模型。在预测房价任务中，收集大量房屋数据，包括房屋面积、房间数量、房价等信息，其中房价就是标签。模型通过学习这些数据特征与房价之间的关系，建立预测模型。当输入新房屋的面积、房间数量等特征时，模型就能预测出该房屋的价格。在疾病诊断场景，利用已确诊患者的症状、检查结果等数据（标签为是否患病及患病类型）训练模型，用于诊断新患者的疾病。

4.2 Unsupervised Learning（无监督学习）

无监督学习从无标签数据中发现模式。比如在客户分群中，分析客户的消费行为、购买偏好等数据，虽然没有预先定义的客户类别标签，但通过无监督学习算法（如聚类算法），可以将具有相似行为特征的客户划分到同一群，帮助企业更好地了解客户群体，制定差异化营销策略。在异常检测中，无监督学习能发现数据中与正常模式不同的异常点，例如检测网络流量中的异常行为，防范网络攻击。

4.3 Transfer Learning（迁移学习）

前文已介绍过，迁移学习将已训练模型的知识迁移到新任务，节省训练资源。比如在训练一个识别鸟类的图像分类模型时，可以先利用在大规模通用图像数据集上预训练好的模型，这些模型已经学习到了图像的通用特征，如边缘、纹理等。然后在鸟类图像数据集上对预训练模型进行微调，模型能快速适应新任务，减少对大量鸟类图像数据的依赖，提高训练效率和模型性能。

4.4 Transformer

Transformer 是基于自注意力机制的模型架构，革新了 NLP 领域，像 GPT、BERT 等大语言模型都采用了这种架构。自注意力机制让模型在处理文本时，能更好地捕捉文本中不同位置词汇之间的关联，而不像传统循环神经网络那样按顺序依次处理词汇。比如在翻译句子 “我喜欢苹果，因为它很甜” 时，Transformer 模型能同时关注 “苹果” 和 “它” 之间的指代关系，更准确地进行翻译。它极大提升了语言模型对长文本的处理能力和语义理解能力。

5. 应用场景

5.1 Autonomous Driving（自动驾驶）

自动驾驶通过 AI 实现车辆自主行驶。车辆上配备多种传感器，如摄像头、雷达、激光雷达等，这些传感器收集周围环境数据，AI 算法对数据进行处理和分析，识别道路、行人、交通标志等。同时，结合路径规划算法，为车辆规划出安全、高效的行驶路径。以特斯拉 Autopilot 为例，利用 AI 技术实现自适应巡航、自动泊车等功能，提升驾驶安全性和便利性，是 AI 在交通领域的重要应用。

5.2 Recommendation System（推荐系统）

推荐系统根据用户行为推荐内容。在电商平台，分析用户的浏览历史、购买记录、收藏商品等行为数据，通过机器学习算法预测用户可能感兴趣的商品并进行推荐。抖音等视频平台根据用户观看、点赞、评论等行为，为用户推荐个性化视频，增加用户粘性和平台活跃度。它广泛应用于电商、内容平台、音乐视频平台等，为用户提供个性化服务，促进业务增长。

5.3 Large Language Model（大模型）

如前文所述，大模型参数量巨大，经过海量数据预训练，具备多任务处理能力。除了内容创作、智能客服，还能用于智能辅导，为学生解答各种学科问题，提供学习建议；在代码生成领域，输入功能描述，大模型能生成相应的代码框架甚至完整代码，提高开发效率。它推动了 AI 应用的智能化和多样化发展，成为当前 AI 领域的研究和应用热点。

6. 行业术语

6.1 AGI（Artificial General Intelligence，通用人工智能）

通用人工智能具备人类水平的多领域智能，能够像人类一样灵活地应对各种认知任务，目前尚未实现。它不仅能理解和处理多种类型的信息，还能在不同领域之间进行知识迁移和应用。一旦实现，AGI 将对社会、经济、科技等各个方面产生深远影响，但目前面临着诸多技术和理论挑战。

6.2 AIoT（人工智能物联网）

AIoT 是 AI 与物联网的结合。在智能家居场景中，各种设备（如智能音箱、智能灯光、智能门锁等）通过物联网连接起来，AI 技术让这些设备能够理解用户指令，自动调节家居环境。比如智能音箱根据用户语音指令开关灯光、调节空调温度。在工业领域，通过传感器收集设备运行数据，AI 分析数据预测设备故障，实现预测性维护，提高生产效率和设备可靠性。

6.3 Edge AI（边缘 AI）

边缘 AI 是在本地设备（而非云端）运行 AI 模型。在智能安防摄像头中，采用边缘 AI 技术，摄像头可以直接在本地对拍摄的视频进行分析，识别异常行为，如入侵检测、烟火检测等，无需将大量视频数据上传到云端处理。这样不仅降低了数据传输延迟，还能保护用户隐私，适用于对实时性和隐私要求较高的应用场景。

6.4 MaaS（Model as a Service，模型即服务）

MaaS 通过 API 提供预训练模型，方便开发者使用。OpenAI 的 GPT 接口就是典型的 MaaS，开发者无需自己训练复杂的语言模型，通过调用接口，就能利用 GPT 模型的语言处理能力，开发聊天机器人、智能写作工具等应用。它降低了 AI 应用开发门槛，加速了 AI 技术在各个领域的应用和创新。

6.5 Agent (智能体)

智能体是能够感知环境、作出决策并采取行动的自主 AI 系统。在自动驾驶汽车中，控制模块就是一个智能体，它通过传感器感知车辆周围环境信息（如路况、其他车辆位置等），根据内置的 AI 算法做出决策（如加速、减速、转弯等），并控制车辆执行相应动作。聊天机器人也是智能体，它感知用户输入的文本信息，分析理解后做出回复决策，并生成相应文本输出。

6.6 Expert System (专家系统)

专家系统是 AI 的早期形式，模拟人类专家的决策过程，用于解决特定领域问题。早期的医疗诊断系统，收集医学专家的知识和经验，建立知识库，当输入患者症状、检查结果等信息时，系统依据知识库中的规则进行推理，给出诊断建议。虽然现在专家系统逐渐被更先进的 AI 技术取代，但它为 AI 发展奠定了基础，在一些特定领域仍有应用。

6.7 AIGC (AI-Generated Content, AI 生成内容)

AIGC 利用 AI 技术生成各种内容，包括文本、图像、视频、音频等。在内容创作领域，AI 可以生成新闻稿件、小说、诗歌等文本内容；在设计领域，能生成海报、插画等图像。视频平台上一些特效视频、虚拟主播的内容也可能由 AI 生成。它丰富了内容创作方式，提高内容生产效率，在营销、娱乐、教育等多个领域得到广泛应用。

7. 伦理与治理

7.1 Algorithm Bias（算法偏见）

算法偏见指因数据或设计导致的歧视性结果。在招聘系统中，如果训练数据存在性别、种族等偏见，比如某些行业历史上男性从业者居多，数据中男性相关特征更多，那么基于这些数据训练的招聘算法可能会更倾向于选择男性候选人，产生性别偏见，不利于公平招聘。算法偏见可能加剧社会不平等，因此在 AI 开发过程中，需要注意数据的代表性和算法的公平性设计。

7.2 Explainable AI（可解释 AI）

随着 AI 模型越来越复杂，其决策过程往往难以理解，可解释 AI 致力于让 AI 决策过程透明化。在医疗诊断中，医生不仅需要 AI 给出疾病诊断结果，还希望了解模型是如何得出这个结论的。可解释 AI 通过可视化技术、解释性算法等手段，向用户展示模型决策依据，增强用户对 AI 系统的信任，尤其是在医疗、金融等对决策可靠性要求较高的领域，可解释 AI 至关重要。

7.3 Federated Learning（联邦学习）

联邦学习是一种分布式训练模型的方式，能保护用户数据隐私。在多个医院联合训练一个疾病诊断模型时，如果直接将患者数据集中到一起训练，会涉及患者隐私问题。联邦学习让各医院在本地利用自己的数据训练模型，只上传模型参数（而非原始数据）进行汇总和更新，既实现了模型的联合训练，又保护了患者数据隐私，促进数据在安全合规的前提下流通和利用。

查看全文

http://www.xdnf.cn/news/3888.html