当前位置: 首页 > ds >正文

DPO算法微调实战

代码地址见文末

1. 环境配置

conda create --name florence python=3.11
conda activate florence
nvcc --version
pip3 install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/ torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
pip3 install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/ transformers
pip3 install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/ peft tqdm Levenshtein
pip3 install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/ pandas numpy
pip3 install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/ tqdm einops timm
pip3 install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/ Pillow supervision
pip3 install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web
http://www.xdnf.cn/news/12034.html

相关文章:

  • 微信小程序动态组件加载的应用场景与实现方式
  • 双电机差速控制的MATLAB Simulink仿真方案,使用PWM和PID调节实现360°转向与速度控制
  • 分类预测 | Matlab实现CNN-BiLSTM-Attention高光谱数据分类预测
  • PostgreSQL的扩展 pg_buffercache
  • TDengine 开发指南——高效写入
  • ​BEV和OCC学习-3:mmdet3d 坐标系
  • 知识拓展卡————————关于Access、Trunk、Hybrid端口
  • Duix.HeyGem:以“离线+开源”重构数字人创作生态
  • Rust 控制流
  • 共识机制全景图:PoW、PoS 与 DAG 的技术对比
  • 华为设备OSPF配置与实战指南
  • 一键更新依赖全指南:Flutter、Node.js、Kotlin、Java、Go、Python 等主流语言全覆盖
  • Elasticsearch索引(Index)介绍,它与数据库中的表有什么区别?
  • Monorepo架构: 项目管理工具介绍、需求分析与技术选型
  • 2025软件供应链安全最佳实践︱证券DevSecOps下供应链与开源治理实践
  • 2025年渗透测试面试题总结-腾讯[实习]科恩实验室-安全工程师(题目+回答)
  • 国芯思辰| 适用于小家电的触摸型8051核微控制器AiP8F3232
  • 链路状态路由协议-OSPF
  • 从Node.js到React/Vue3:流式输出技术的全栈实现指南
  • Win11系统输入时首字母丢失 - 解决方案
  • layer norm和 rms norm 对比
  • es地理信息索引的类型以及geo_point‌和geo_hash的关系
  • PyTorch——损失函数与反向传播(8)
  • QT链接其他项目的C++文件报链接错误
  • n8n:解锁自动化工作流的无限可能
  • vue3从入门到精通(基础+进阶+案例)
  • RK3568平台 USB框架与USB识别流程_rk3568 usb otg
  • 服务器上reportqueue文件夹,删除reportqueue文件夹的操作方法-电脑自学网
  • 【Cisco Packet Tracer| 一.交换机配置模式与基本参数配置】
  • 文件怎么加密?推荐五款文件加密软件,第一款太香!