当前位置: 首页 > news >正文

2024理想算法岗笔试笔记

要理解指令微调(Instruction Tuning),需要先将其置于大语言模型(LLM)的训练框架中 —— 它并非模型训练的起点,而是针对 “让模型更懂人类需求” 的关键优化步骤。简单来说,指令微调是通过让模型学习 “指令 - 响应” 配对数据,将原本擅长 “预测下一个词” 的基础模型,升级为能精准理解人类指令、输出符合预期结果的 “实用型模型” 的过程。

2025算法八股——大模型开发——指令微调-CSDN博客

2025算法八股——大模型开发——Agent相关-CSDN博客

  1. 非凸、非连续:0/1 损失在y⋅f(x)=0处突变(从 0 跳到 1),函数图像是 “阶跃状”,没有连续的梯度。这导致无法用梯度下降等主流优化算法求解(需要损失函数连续可导或至少存在次梯度)。

  2. 只关注 “是否正确”,不关注 “正确的程度”:例如,一个样本被模型预测为y⋅f(x)=100(非常确信的正确),与y⋅f(x)=0.1(勉强正确),在 0/1 损失下都算 “损失为 0”,但前者显然是更优的预测结果。0/1 损失无法区分这种 “置信度差异”,不利于模型学习 “更稳健的分类边界”。

2025算法八股——机器学习——SVM损失函数-CSDN博客

2025算法八股——深度学习——优化器小结-CSDN博客

Python 允许 bar(2)(3) 这种调用方式,这是因为 bar() 函数返回的是另一个函数(foo),所以可以直接在返回值后继续添加括号调用该函数。

这种模式称为 “函数闭包”(closure),即内部函数 foo 可以访问外部函数 bar 中定义的变量(multiple),即使在 bar 函数执行完毕后,这个变量依然会被保留。这使得我们可以创建具有 “记忆” 能力的函数,在实际开发中常用于实现装饰器、工厂函数等场景。

搞清楚c就都搞清楚了

官方解析:

考察:赋值、深拷贝、浅拷贝

1.对象的赋值 

都是进行对象引用(内存地址)传递,即‘’ b is a‘’ ,a 变 b 也变

2.浅拷贝

会创建一个新的对象,即 “c is not a” ,但是,对于对象中的元素,浅拷贝就只会使用原始元素的引用(内存地址),也就是说

”c[i] is a[i]”

当我们使用下面的操作的时候,会产生浅拷贝的效果:

  • 使用切片
    [:]操作
  • 使用工厂函数(如list/dir/set)
  • 使用copy模块中的copy()函数

3.深拷贝 

会创建一个新的对象,即”d is not a” ,并且对于对象中的元素,深拷贝都会重新生成一份(有特殊情况),而不是简单的使用原始元素的引用(内存地址)

拷贝的特殊情况

其实,对于拷贝有一些特殊情况:

  • 对于非容器类型(如数字、字符串、和其他’原子’类型的对象)没有拷贝这一说
  • 如果元祖变量只包含原子类型对象,则不能深拷贝

知识点:Python

在 Python 中,append 和 extend 都是列表(list)的常用方法,但它们的功能不同,并非严格意义上的 “相对” 关系,而是用于不同场景的列表扩展操作:

  • append(item):将 item 作为单个元素添加到列表末尾。
    例如:[1,2].append([3,4]) 结果为 [1,2,[3,4]](把列表 [3,4] 当作一个整体元素添加)。

  • extend(iterable):将 iterable(可迭代对象,如列表、元组等)中的每个元素逐个添加到列表末尾。
    例如:[1,2].extend([3,4]) 结果为 [1,2,3,4](把 [3,4] 中的元素拆分后添加)。

两者的核心区别在于:
append 是 “整体添加”,extend 是 “拆分添加”。

http://www.xdnf.cn/news/1488529.html

相关文章:

  • HTTP中Payload的含义解析
  • MySQL集群高可用架构——组复制 (MGR)
  • Set集合
  • matrix-breakout-2-morpheus靶机渗透
  • 【从零开始学习Redis】秒杀优化——阻塞队列、消息队列实现异步秒杀
  • 虚拟机之CentOS、网络设置的有趣问题
  • openpyxl和excel数据驱动
  • C++20格式化字符串:std::format的使用与实践
  • 大坝安全监测中的单北斗GNSS变形监测系统应用解析
  • 宋红康 JVM 笔记 Day14|垃圾回收概述
  • Android --- AOSP源码导入Android Studio
  • 使用 Doxygen 生成 C++ 与 Python 项目文档
  • 腾讯云TDSQL-C 与传统MySQL对比
  • tf_keras包
  • 【工具变量】地级市中小企业数字化转型月度DID数据集(2022.1-2025.7)
  • 设计模式:模板方法模式(Template Method Pattern)
  • 设计模式:状态模式(State Pattern)
  • 【数据分析】一种用于校正微生物组数据中批次效应的多变量框架
  • 人工智能学习:Transformer架构
  • 简单的说一说前端开发语言React
  • 学习字符串
  • NW506NW507美光固态闪存NW525NW539
  • AI时代的软件开发革命:吴恩达关于快速工程的深度思考
  • WebGL2初识
  • 开源 C++ QT Widget 开发(十三)IPC通讯--本地套接字 (Local Socket)
  • 【Flink】Flink Runtime 架构设计
  • LangChain实战(二十一):构建自动化AI客服系统
  • 蓓韵安禧DHA孕期友好配方:纯净营养安心孕育健康
  • 自然语言处理 基于神经网络的词向量转化模型word2vec
  • GitHub App 架构解析与最佳实践