当前位置: 首页 > web >正文

【大模型原理与技术-毛玉仁】第五章 模型编辑

5 模型编辑

5.1 模型编辑简介

大语言模型有时会产生一些不符合人们期望的结果,如偏见、毒性和知识错误等。

偏见是指模型生成的内容中包含刻板印象和社会偏见等不公正的观点,毒性是指模型生成的内容中包含有害成分,而知识错误则是指模型提供的信息与事实不符。

然而,重新预训练存在成本过高等缺陷,微调存在过拟合、灾难性遗忘等缺陷。

为规避重新预训练和微调方法的缺点,模型编辑应运而生。其旨在精准、高效地修正大语言模型中的特定知识点,能够满足大语言模型对特定知识点进行更新的需求。

模型编辑思想

模型编辑定义

模型编辑挑战

模型编辑性质

常用数据集

在模型编辑的相关研究中,使用最广泛的是由Omer Levy 等人提出的zsRE数据集。

zsRE是一个问答任务的数据集,通过众包模板问题来评估模型对于特定关系(如实体间的“出生地”或“职业”等联系)的编辑能力。

在模型编辑中,zsRE数据集用于检查模型能否准确识别文本中的关系,以及能否根据新输入更新相关知识,从而评估模型编辑方法的准确性

5.2 模型编辑经典方法

如果将大语言模型比作冒险游戏中的勇者,那么模型编辑可被看作一种满足“升级”需求的方法,可以分别从内外两个角度来考虑。

外部拓展法:通过设计特定的训练程序,使模型在保持原有知识的同时学习新信息。

内部修改法:通过调整模型内部特定层或神经元,来实现对模型输出的精确控制。

外部拓展法

外部拓展法包括知识缓存法附加参数法

内部修改法

内部修改法包括元学习法定位编辑法

方法比较

5.3 附加参数法:T-Patcher

补丁的位置

 补丁的形式

补丁的实现

5.4 定位编辑法:ROME

知识存储位置

知识存储机制

精准知识编辑

5.5 模型编辑应用

精准模型更新

保护被遗忘权

由于大语言模型在训练和处理过程中也会记忆和使用个人信息,所以同样受到被遗忘权的法律约束。

机器遗忘

提升模型安全

http://www.xdnf.cn/news/12784.html

相关文章:

  • leetcode刷题日记——二叉搜索树中第 K 小的元素
  • MIT 6.S081 Lab 11 networking
  • RD-Agent-Quant:一个以数据为中心的因素与模型联合优化的多智能体框架
  • CANoe trace里面显示的Time 具体是什么意思
  • Python抽象基类实战:构建广告轮播框架ADAM的核心逻辑
  • Python绘制三十六计
  • OGG 23ai for DAA 部署与补丁升级
  • 雪花ID问题诊断与解决方案
  • C++调试(肆):WinDBG分析Dump文件汇总
  • stm32内存踩踏一例
  • 高斯消元法及其扩展
  • 【2025年软考中级】第二章2.3 编译程序基本原理
  • 当数据包从上层移动到下层时,OSI 模型中会发生什么?
  • Go爬虫开发学习记录
  • 从内存角度透视现代C++关键特性
  • freeRTOS 互斥量优先级继承机制函数实现xQueueGenericReceive()
  • C++ 信息学奥赛总复习题答案解析(第一章)
  • 电脑商城--用户注册登录
  • 步进电机调试记录(先让我的步进电机转起来)
  • 【Java学习笔记】String类(重点)
  • 沉金电路板的黑盘缺陷挑战与解决方案——高密度互连设计的关键考量
  • Jina AI 开源 node-DeepResearch
  • [面试精选] 0094. 二叉树的中序遍历
  • 【单源最短路经】Dijkstra 算法(朴素版和堆优化版)、Bellman-Ford 算法、spfa 算法 及 负环判断
  • win10环境配置-openpose pytorch版本
  • 网络协议通俗易懂详解指南
  • MyBatis 获取插入数据后的自增 ID 值
  • GoC指令测试卷 A
  • 【AI学习】wirelessGPT多任务无线基础模型摘要
  • 安卓小说阅读软件推荐