当前位置: 首页 > java >正文

自己定义的模型如何用hf的from_pretrained

1.比如我要用某个框架去测评自己定义的模型,这里举例子lm-evaluation-harness,通过cli命令行处理,则只需在lm_eval目录下的init文件里的开头加上如下代码:注册自定义的config和model即可

from lm_eval.model_minimind_random_5_gqa_yes_pos import 

Config,

。。ForCausalLM

from lm_eval.model_。。import Config, 。。ForCausalLM

from transformers import CONFIG_MAPPING, MODEL_FOR_CAUSAL_LM_MAPPING

# 1. 注册 config

CONFIG_MAPPING.register("。。", Config)

# 2. 注册模型

MODEL_FOR_CAUSAL_LM_MAPPING.register(Config, ForCausalLM)

__version__ = "0.4.9"

然后需要吧自己的模型权重保存成hf格式:

model.save_pretrained(save_dir,safe_serialization=True)

tokenizer.save_pretrained(save_dir)

http://www.xdnf.cn/news/18995.html

相关文章:

  • Linux(一) | 初识Linux与目录管理基础命令掌握
  • 测试题ansible临时命令模块
  • CuTe C++ 简介01,从示例开始
  • imx6ull-驱动开发篇47——Linux SPI 驱动实验
  • Electron解压缩文件
  • hive on tez为什么写表时,要写临时文件到hdfs目录
  • docker 1分钟 快速搭建 redis 哨兵集群
  • 配置nginx.conf (增加21001端口实例操作)
  • 医疗AI时代的生物医学Go编程:高性能计算与精准医疗的案例分析(三)
  • [灵动微电子 MM32BIN560CN MM32SPIN0280]读懂电机MCU之比较器
  • jQuery 从入门到实践:基础语法、事件与元素操作全解析
  • mac电脑双屏显示时程序坞跑到副屏的解决方法
  • 机器视觉学习-day10-图像添加水印
  • Mybatis 与 Springboot 集成过程详解
  • Kubernetes一EFK日志架构
  • Ovis2.5技术解密:原生分辨率与“反思模式”如何铸就新一代MLLM王者
  • 嵌入式学习日志————实验:串口发送串口发送+接收
  • 2025年渗透测试面试题总结-37(题目+回答)
  • 2024年06月 Python(三级)真题解析#中国电子学会#全国青少年软件编程等级考试
  • 零基础-力扣100题从易到难详解(持续更新1-10题)
  • 【链表 - LeetCode】25. K 个一组翻转链表
  • DAY 58 经典时序预测模型2
  • Kubernetes 的20 个核心命令分类详解
  • Linex系统网络管理(二)
  • 数据结构第8章 排序(竟成)
  • SqlHelper类库的使用方法
  • .NET周刊【8月第3期 2025-08-17】
  • 鸿蒙ArkUI 基础篇-06-组件基础语法-Column/Row/Text
  • 车载诊断架构 --- 基于整车功能的正向诊断需求开发
  • Dubbo加标签方式