当前位置: 首页 > backend >正文

nanoGPT 部署

NanoGPT 是由 Andrej Karpathy(前特斯拉 AI 总监)开源的一个 极简版 GPT(Generative Pre-trained Transformer)实现
它的目标不是直接用于大规模商业应用,而是 教育、研究和实验,帮助人们理解 GPT 模型的核心原理。

特点:

  • 代码简洁、结构清晰,便于阅读。

  • 模型规模小,适合在个人电脑上训练和测试。

  • 使用 PyTorch 实现,方便修改和扩展。

Github 地址:https://github.com/karpathy/nanoGPT#


1. 使用 Anaconda 创建 python 虚拟环境

conda create --prefix D:\conda_envs\nanoGPT python=3.9

--prefix:指定虚拟环境安装的位置

我的电脑是 RTX5060 CUDA12.8,下载如下版本的 pytorch

pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128
或 Anaconda Prompt 中运行:python -m pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128

安装代码的相关依赖

pip install  tiktoken 

2. 拉取代码

git clone https://github.com/karpathy/nanoGPT.git

3. 运行

python data/shakespeare_char/prepare.py

在 config/train_shakespeare_char.py 文件中加上 compile = False,再运行

python train.py config/train_shakespeare_char.py
python sample.py --out_dir=out-shakespeare-char
http://www.xdnf.cn/news/18436.html

相关文章:

  • JUC之Fork/Join
  • EP4CE40F23I7N Altera FPGA Cyclone IV E
  • LLM实践系列:利用LLM重构数据科学流程
  • shell脚本第二阶段-----选择结构
  • 企业设备系统选型:功能适配度分析
  • Vue 插槽(Slots)全解析1
  • B树,B+树,B*树
  • 文件包含的学习笔记
  • 嵌入式Linux学习 -- 网络1
  • 深度学习——神经网络
  • canvas绘制图片等比缩放
  • Vue2+Vue3前端开发_Day6
  • Linux笔记8——shell编程基础-2
  • 网络实践——Socket编程UDP
  • 视频拼接融合技术:打造全景视界的革命性产品
  • API模型与接口弃用指南:历史、替代方案及开发者应对策略
  • `git mv` 重命名 Git 仓库中的文件夹
  • 多人编程新方式:cpolar 让 OpenHands 远程开发更轻松
  • 20250822在Ubuntu24.04.2下指定以太网卡的IP地址
  • 数据分析专栏记录之 -基础数学与统计知识 2 概率论基础与python
  • 安全帽检测算法如何提升工地安全管理效率
  • 【C++组件】Elasticsearch 安装及使用
  • Seaborn数据可视化实战:Seaborn时间序列可视化入门
  • Logstash_Input插件
  • 偶现型Bug处理方法---用系统方法对抗随机性
  • (附源码)基于SSM的餐饮企业食材采购管理系统的设计与实现
  • 攻防世界—bug
  • 以下是基于图论的归一化切割(Normalized Cut)图像分割工具的完整实现,结合Tkinter界面设计及Python代码示
  • 基于SpringBoot的考研学习交流平台【2026最新】
  • 十年磨一剑!Apache Hive 性能优化演进全史(2013 - )