当前位置: 首页 > news >正文

大模型笔记1:大致了解大模型

大模型训练三部曲:

1.预训练:会给大模型输入大量的数据:网页、书籍、代码等,模型通过学习这些数据的语言规律和知识结构,为后续训练打下基础。

2.SFT监督微调阶段:这个阶段工匠般的标注数据被用于对模型进行精细打磨,通过监督学习的方式,让模型能够更好的理解和生成符合人类语言习惯的内容。提升准确性和可靠性。

3.RLHF基于人类反馈的强化学习:人性化的调试,使用的数据集中会带有分数,模型需要尽量给低分内容打低分,高分内容打高分。这么做的目的是让模型不要输出不合法不合规的内容。

大模型的四个特点:

1.规模和参数量大

2.适应能力强,灵活能力强

3.有广泛数据集的预训练

4.计算资源需求大

按照应用场景,大模型可以大致分为:

1.大语言模型LLM

2.多模态模型

大模型的工作流程

1.分词化与词表映射

三种分词化:词粒度、字符粒度、子词粒度

然后会为每个词映射一个token id,也就是建立了词表映射,映射的token id才是最终交给计算机处理的部分。因为计算机或者说模型可没法直接看懂自然语言,它只能看懂数字。

2.文本生成的过程

生成的过程可以拆解为:输入问题、分词化、神经网络计算、概率选择、自回归生成和输出结果。

学到这里我有一个顿悟:大模型给出你想要的内容,其实就是根据你提供的内容,接着你的内容去生成的内容。也就是它的回答不是重新从0生成的,而是接着问题后面生成的,它根本没有把输入的内容看成是一个问题,而是把它看成一个上文,他需要做的是根据上文填写下文。而下文就是你想要的答案。

http://www.xdnf.cn/news/1030717.html

相关文章:

  • Burgers方程初值问题解的有效区域
  • JVM 参数调优核心原则与常用参数
  • 【无标题】在 4K 高分辨率(如 3840×2160)笔记本上运行 VMware 虚拟机时平面太小字体太小(ubuntu)
  • 如何在 ArcGIS 中使用 Microsoft Excel 文件_20250614
  • 【软测】node.js辅助生成测试报告
  • 写作词汇积累(A):颇有微词、微妙(“微”字的学习理解)
  • Veeam Backup Replication系统的安装与使用
  • ABP vNext 多语言与本地化:动态切换、资源继承与热更新
  • webuploader分片上传示例,服务端上传文件到腾讯云CDN Teo 应用示例
  • React 第三方状态管理库的比较与选择
  • 后端通过nignx代理转发,提供接口供前端在防火墙外访问
  • 计算机网络-自顶向下—第一章概述重点复习笔记
  • AI应用:计算机视觉相关技术总结
  • Elasticsearch从安装到实战、kibana安装以及自定义IK分词器/集成整合SpringBoot详细的教程ES(四)查询、排序、分页、高亮
  • 打卡Day53
  • 2025虚幻5蓝图编辑器的细节面板调不出来
  • MySQL-DQL数据查询语句深度解析与实战指南
  • 使用docker中的ollama
  • Python实战应用-Python操作MySQL数据库
  • 雪豹速清APP:高效清理,畅享流畅手机体验
  • python打卡day53@浙大疏锦行
  • DAY 53 对抗生成网络
  • 操作系统知识(1)
  • 造轮子系列:从0到1打造生产级HTTP客户端,优雅封装OkHttp/HttpClient,支持异步、重试与文件操作
  • 自定义表单右侧属性使用v-bind绑定渲染
  • 知识点|MVC模式(Model–view–controller)
  • 中英双配毕业祝福(毕业季快乐!)
  • MRI中的“髓鞘探测器”:T1w/T2w比值揭秘
  • 【面板数据】A股上市公司注册地所在地数据集(1991-2023年)
  • securecrt里如何把会话管理器固定在会话的左侧?