当前位置: 首页 > ai >正文

【浙江大学DeepSeek公开课】人类经验与AI算法的镜像之旅

人类经验与AI算法的镜像之旅

  • 人类经验与 AI 算法的镜像之旅
    • 一、语言的奥秘:人类如何解码世界
    • 二、从符号到智能:AI 的语言理解之路
    • 三、DeepSeek - V3:大语言模型的构建与进化
    • 四、DeepSeek - R1:推理模型的诞生与突破
    • 五、智能体时代:AI 如何重塑教育未来

人类经验与 AI 算法的镜像之旅

一、语言的奥秘:人类如何解码世界

  • 语言的重要性 :人和动物的根本区别在于人具有创造性地运用语言的能力。语言赋予人类秩序,是思维的工具和合作的纽带。理解人类使用的不太精确、可能有歧义、混乱的语言是实现通用人工智能的有效途径。
  • 人类理解语言的方式 :人类大脑通过理解每个词语的意思、进行词语组装,从而得到句子的意思,甚至推断出句子背后的含义。理解语言的基础是理解词语及词语间的关联关系,且人类语言的精准解译与语义歧义的消解具有显著的语境依赖性,需通过系统性整合上下文信息构建语义解析模型。

二、从符号到智能:AI 的语言理解之路

  • 计算机的数字化世界 :计算机理解一切信息的基础是将信息进行数字化。在处理图像时,会将图像的每一个像素转换为数字信号,通常使用颜色的 RGB 值来表示每个像素。
  • 语言的数字化 :计算机无法直接理解离散的人类语言,需借助词向量和词与词之间的位置关系来处理语言。词向量模型存在缺陷,同一个词在不同上下文中意思不同,但传统词向量模型中同一个词只有一个向量,会造成歧义问题。
  • 注意力机制与上下文建模 :大语言模型通过使用 Transformer 架构,可以为每个词生成一个上下文相关的词向量,解决了传统词向量无法处理多义词和上下文依赖的问题。一个单词的真实含义,取决于它自身以及句子中的其它上下文信息,其向量值需要融合从句子上下文中的其他单词中的信息,即所有单词的向量值的加权平均,权重值称为注意力权重。

三、DeepSeek - V3:大语言模型的构建与进化

  • 大模型的工作原理 :大语言模型最令人印象深刻的能力是它能够通过对话的方式回答用户的问题,其原理很像文字接龙游戏,会基于前面的话不断地生成下一个合成的词汇,直到觉得不必继续生成为止。数学家陶哲轩认为大模型不是魔法,是基于概率的猜测机。
  • DeepSeek - V3 配置 :DeepSeek - V3 有 16B,236B 和 671B 三种配置,B 代表 Billion 即 10 亿。
  • 大模型参数的学习与训练流程
    • 参数的学习 :大模型的参数通过大量数据的学习,逐渐调整和优化,将数据的分布规律压缩到参数中,以便对新的数据进行更准确地预测和生成合适的输出。
    • 训练流程 :包括预训练、指令微调、对比数据、奖励函数、强化学习等环节。预训练环节通过整合多种来源的数据资源构建训练集,形成总量达万亿单词级的多样化语料库,基于超级计算集群和分布式训练算法,逐步优化深度神经网络的数千亿参数,最终形成具备通用语义理解能力的基座模型。指令微调阶段通过向模型提供明确任务指令来实现参数优化,训练数据通常由少量高质量样本构成。强化学习阶段主要采用基于人类反馈的强化学习方法,模型通过与奖励模型的交互,优化其生成策略以最大化奖励。

四、DeepSeek - R1:推理模型的诞生与突破

  • 什么是推理模型 :推理模型是指能够进行复杂推理任务的大型语言模型,能够处理需要多步推导、计算或分析的问题,通常涉及多个中间步骤,这些模型不仅能够解决基本的推理问题,还能应对更复杂的任务,如解谜、数学证明等。推理模型中的中间步骤可以通过显式地出现在回答中或进行多次迭代(用户不可见)两种方式呈现。
  • 推理模型 R1 - Zero 的炼成 :通过纯强化学习训练,训练过程中有准确度激励和格式激励,但没有推理过程的激励。在 RL 过程中,DeepSeek - R1 - Zero 自然地学会了通过更多的思考时间来解决推理任务,且没有用到中间的过程推理数据来监督训练模型。
  • 推理模型 R1 的炼成 :DeepSeek - R1 - Zero 存在可读性差和语言混淆的缺陷,通过有监督微调和强化学习来克服这些问题,并利用 DeepSeek - R1 和 DeepSeek - V3 产生的数据进一步微调小规模 LLM,实现模型蒸馏。

五、智能体时代:AI 如何重塑教育未来

  • DeepSeek 的多领域应用

    • DeepSeek + Kimi:自动生成 PPT :打开 Kimi,点击左侧状态栏找到 PPT 助手,向 PPT 助手中粘贴生成的内容即可。
    • DeepSeek 辅助编程 :协助编程相关工作。
    • DeepSeek + 即梦 AI:生成图片 :复制生成的提示词到即梦 AI 中生成图片。
  • 苏格拉底式教学智能体 :构建苏格拉底式教学智能体,赋能教与学,实现从知识本位教育向能力本位教育转变。大模型更多是以知识问答的形式向学生传授知识,而苏格拉底教学法的核心在于教师通过一系列的问题引导、讨论、问答和辩论,揭示学生思维中的矛盾和不足,促使他们自主地推理和反思,最终得出正确的结论。围绕苏格拉底式教学智能体,构建教与学赋能平台,鼓励学生思考与探索,培养学生批判性思维和自主学习能力。


在这里插入图片描述

http://www.xdnf.cn/news/2720.html

相关文章:

  • 考研系列-计算机组成原理第七章、输入/输出系统
  • 解锁健康密码:养生的多维智慧
  • 【手册】Linux服务器应急排查实战指南
  • 《Learning Langchain》阅读笔记11-RAG(7)索引优化:RAPTOR方法和ColBERT方法
  • C++:BST、AVL、红黑树
  • 惠普P1108打印机信息
  • gre over ipsec (神州数码)
  • 巧记英语四级单词 Unit6-中【晓艳老师版】
  • SpringBoot启动后自动执行方法的各种方式-笔记
  • 【MCP】第三篇:Cline工具链路追踪——解码“协议引擎“的神经传导奥秘
  • Pytest-mark使用详解(跳过、标记、参数 化)
  • 夜莺 v8.0.0-beta.10 部署
  • 新能源汽车声纹监测技术的发展趋势是什么?
  • 机器学习:【抛掷硬币的贝叶斯后验概率】
  • 【MySQL】-- 增删改查操作(1)
  • AI辅助编程-cursor开发煤矿持证上岗管理程序需求与设计篇
  • python tk.text不可编辑
  • 高效运维,智慧监测:COMEM光纤温度测量系统在电力行业中的应用
  • 云服务器被黑客攻击应急响应与加固指南(上)
  • Shiro学习(七):总结Shiro 与Redis 整合过程中的2个问题及解决方案
  • 网络安全入门综述
  • 深入了解指针(6)
  • day004-习题
  • Python实例题:Pvthon实现键值数据库
  • 入门版 鸿蒙 组件导航 (Navigation)
  • 游戏打击感实现
  • frp内网穿透的基础使用
  • 如何选择靠谱的软件测试外包公司?软件测试外包需要多少费用和时间?
  • Python抽象类:ABC模块的优雅之道与手动实现的隐性陷阱
  • QT采用mqtt进行通信(17.1)