当前位置: 首页 > java >正文

0.08B参数以小博大:用小模型生成媲美GPT-4o的古典诗词

本篇文章,我们将用仅0.08B参数的轻量级模型**Xiaothink-T6-0.08B-Poem(清韵千言2)**生成效果接近GPT-4o的古诗。
根据官方介绍,这个模型从0全程在单颗Intel Core i7上完成预训练、指令微调和领域微调。

🎯 模型特点

  • 参数仅8000万:比主流模型小100倍
  • 150MB专项训练:仅用半本电子书的诗歌数据
  • 全CPU训练:在Intel Core i7上完成30小时微调
  • 超越ChatGLM-6B:在GPT-4o盲测中表现优异

🚀 三步开启诗词创作

步骤1:安装专用库
pip install xiaothink
步骤2:下载模型文件

从ModelSpace获取模型文件:

  1. 访问模型主页
  2. 下载checkpointvocab.txt文件
步骤3:创作你的第一首诗
import xiaothink as xt# 配置模型路径(替换为你的实际路径)
model = xt.llm.inference.test_formal.QianyanModel(ckpt_dir='path/to/checkpoint',MT='t6_beta_dense',vocab='path/to/vocab.txt'
)# 生成七言绝句(李白风格)
response = model.chat_SingleTurn("请你以王维的风格生成古诗,起始为空山新雨后",temp=0.56  # 控制创意度
)print(f"【AI诗人】:\n{response}")

🌸 创作示例(实际生成效果)

【用户指令】:请你以王维的风格生成古诗,起始为空山新雨后【AI生成】:
空山新雨后,野色暮寒青。
水落山光澹,烟深鸟语清。
风吹花木尽,人入酒杯倾。
欲寄仙家去,归来定不能。 

📝 推荐Prompt格式

为获得最佳诗歌生成效果,建议使用以下prompt格式:

风格仿写

请你以{风格}的风格生成一些古诗
仿照{风格}写古诗

指定开头/题目

请你以{风格}的风格生成古诗,起始为{起始句}
用{风格}的风格写古诗(开头:{起始句})

诗句续写

续写“{起始句}”生成一些古诗
写诗 用{起始句}为第一句

作者猜测

给出古诗 {诗句} 请你猜猜这是谁写的
根据这段古诗推测一下作者:{诗句}

🎚️ 温度参数调

优指南
通过temp参数控制创作风格:

  • 0.44:严谨工整(适合应试创作)
  • 0.56:平衡模式(推荐日常使用)
  • 0.64:奔放创意(可能突破格律)

🌟 为什么选择清韵千言2?

  1. 硬件零门槛:支持量化,在树莓派上也能流畅运行
  2. 创作可控性:精准控制诗歌风格和主题
  3. 文化传承:严格遵循古诗词格律规范
  4. 即开即用:无需联网,保护创作隐私

结语

清韵千言2证明了:诗意不在参数大小,而在算法匠心。这款能在普通笔记本电脑上运行的AI诗人,不仅打开了传统文化数字化的新可能,更为边缘计算设备上的AI创作树立了标杆。无论您是教育工作者、文学爱好者还是AI开发者,都可以立即体验这份"小而美"的诗意:

pip install xiaothink

模型主页:https://www.modelscope.cn/models/ericsjq/Xiaothink-T6-0.08B-Poem
致谢:特别鸣谢Qwen团队和Minimind项目的高质量预训练数据支持

http://www.xdnf.cn/news/17102.html

相关文章:

  • 嵌入式学习之51单片机——串口(UART)
  • Webpack 搭建 Vue3 脚手架详细步骤
  • Unix 命令行shell基础--学习系列003
  • 跳板机实现 SSHFS 挂载
  • Tomcat虚拟主机配置详解和多实例部署
  • C + +
  • 交叉验证:原理、作用与在机器学习流程中的位置
  • SpringBoot3.x入门到精通系列:3.2 整合 RabbitMQ 详解
  • Ubuntu系统VScode实现opencv(c++)图像一维直方图
  • Ubuntu系统VScode实现opencv(c++)图像二维直方图
  • 补:《每日AI-人工智能-编程日报》--2025年7月28日
  • 软件设计 VS 软件需求:了解成功软件开发外包的关键差异
  • git操作命令和golang编译脚本
  • 补:《每日AI-人工智能-编程日报》--2025年7月27日
  • 移动端 WebView 视频无法播放怎么办 媒体控件错误排查与修复指南
  • 高精度实战:YOLOv11交叉口目标行为全透视——轨迹追踪×热力图×滞留分析(附完整代码)
  • Linux-Day01.初识Linux和基础指令
  • 基于FAISS和Ollama的法律智能对话系统开发实录-【大模型应用班-第5课 RAG技术与应用学习笔记】
  • Ubuntu 下编译 SQLCipher 4.8.0
  • CMake进阶: 使用FetchContent方法基于gTest的C++单元测试
  • sqli-labs靶场less29~less35
  • Ethereum:拥抱开源,OpenZeppelin 未来的两大基石 Relayers 与 Monitor
  • 互联网医院整体项目套表整理过程文档全流程分析
  • Linux 文件与目录属性管理总结
  • IPIDEA:全球领先的企业级代理 IP 服务商
  • Go语言 逃 逸 分 析
  • JVM(Java虚拟机)运行时数据区
  • 【测试】⾃动化测试概念篇
  • 服务器突然之间特别卡,什么原因?
  • 晨控CK-GW08S与汇川AC系列PLC配置Ethernet/IP通讯连接手册