当前位置: 首页 > java >正文

【阿里云大模型高级工程师ACP学习笔记】2.7 通过微调增强模型能力 (下篇)(⭐️⭐️⭐️ 重点章节!!!)

学习目标

特别说明:由于这一章节是2025年3月官方重点更新的部分,新增内容非常多,因此我不得不整理成上、下两篇,方便大家参考。

备考阿里云大模型高级工程师ACP认证时,深入钻研《2.7通过微调增强模型能力(下篇)》,期望达成以下目标:

  • 掌握高效微调技术:深入理解预训练与微调的差异,熟练掌握如LoRA等高效微调方法的原理和应用场景,能依据不同任务需求选择合适的微调技术。
  • 学会模型微调实践:借助ms - swift框架,独立完成模型微调实验,精准调整学习率、LoRA的秩、数据集学习次数等关键参数,有效解决微调过程中出现的过拟合、欠拟合等问题。
  • 了解微调拓展知识:熟悉微调在其他机器学习任务中的应用,掌握更多高效微调方法,明晰微调数据集的构建策略和模型评测常用指标,拓宽大模型微调的知识视野。

知识点汇总

知识点知识内容重要性学习难易度
预训练与微调- 预训练:在大规模通用数据集上开展训练,让模型学习广泛的基础知识与特征表示,这些知识具有通用性,并非针对特定任务。采用自监督/无监督的学习方式,使用互联网海量文本数据,无需人工标注,可有效节省人力成本。例如,常见的预训练模型有Qwen2.5 - Max、DeepSeek - V3、GPT - 4等。
- 微调:以预训练模型为基础,运用特定任务的小规模数据集进一步训练。通过有监督学习,借助标注数据指导模型完成任务,使模型适应具体的下游任务,如医疗、法务等专业领域。微调所需样本数量通常在几千到几万条。
- 两者区别:预训练旨在学习通用特征,微调则是为了适应特定任务;预训练使用大规模通用数据,微调使用小规模任务相关数据;预训练采用自监督/无监督的训练方法,微调采用有监督的训练方法;预训练时所有参数可训练,微调时部分或全部参数可训练;预训练用于基础模型构建,微调用于特定任务优化
LoRA微调- 原理:LoRA(Low - Rank Adaptation)即低秩适应微调,它不依赖模型架构,通过矩阵运算将微调需更新的参数分解为两个较小的低秩矩阵 A d × r A_{d×r} Ad×r B r × d B_{r×d} Br×d进行训练,而模型原有的矩阵不参与训练,公式表示为 W d × d 微调后 = W d × d 微调前 + A d × r ⋅ B r × d W_{d×d}^{微调后}=W_{d×d}^{微调前}+A_{d×r}⋅B_{r×d} Wd×d微调后=Wd×d微调前+Ad×r
http://www.xdnf.cn/news/3175.html

相关文章:

  • C#学习第20天:垃圾回收
  • C#规避内存泄漏的编码方法
  • ZStack Cloud 5.3.28正式发布
  • 【蓝桥杯省赛真题59】Scratch收集松果 蓝桥杯scratch图形化编程 中小学生蓝桥杯省赛真题讲解
  • 跨境电商生死劫:IP筛查三法则破解封号魔咒
  • 编译原理实验二:构建TINY语言的词法分析器
  • 【数据链路层】网络通信的“桥梁建设者”
  • 在Carla中构建自动驾驶:使用PID控制和ROS2进行路径跟踪
  • WPF性能优化举例
  • python中库pydantic的作用和基本用法
  • 《ESP32音频开发实战:I2S协议解析与WAV音频录制/播放全指南》
  • 90.如何将Maui应用安装到手机(最简) C#例子 Maui例子
  • 西门子PLC S7-1200电动机软启动、软停止的控制实例
  • Android 移动开发:ProgressBar(转圈进度条)
  • 基于go的简单管理系统(增删改查)
  • Linux基础 -- Generic Netlink 框架详解与开发实践
  • UI设计之photoshop学习笔记
  • ⛺️ Sui Basecamp 2025 最新日程
  • C# 类的基本概念(从类的内部访问成员和从类的外部访问成员)
  • AXI总线设计高带宽or低带宽?你需要做个选择
  • 大规模克希霍夫积分法叠前深度偏移中,并行化和旅行时表处理
  • 11.模方ModelFun工具-指定置平
  • 【Docker】Docker拉取部分常用中间件
  • 音视频项目在微服务领域的趋势场景题深度解析
  • 为Mac用户定制的云服务器Vultr 保姆级教程
  • 运维打铁: 存储方案全解析
  • 《可信数据空间 技术架构》技术文件正式发布
  • 出现Invalid bound statement (not found)问题的原因可能有哪些
  • 分布式数字身份:迈向Web3.0世界的通行证 | 北京行活动预告
  • IoTDB集群部署中的网络、存储与负载配置优化