当前位置: 首页 > news >正文

MCP实战:在扣子空间用扣子工作流MCP,一句话生成儿童故事rap视频

扣子最近迎来重要更新,支持将扣子工作流一键发布成MCP,在扣子空间里使用。

图片

这个功能非常有用,因为我有很多业务工作流是在扣子平台上做的,两者打通之后,就可以在扣子空间里直接通过对话方式调用扣子工作流了,体验会更加丝滑。

这次我是想将一个儿童故事绘本的工作流发布成MCP,在扣子空间里使用,最终效果就是通过一句话就能生成一个有背景音乐,有人声朗读的儿童故事绘本视频。

在尝试过程中,发现扣子空间的能力和Manus相比还有进步空间,毕竟现在还是beta版本,进展并不如想象中顺利。

最终生成的是一个rap版本的故事绘本视频(至于为什么会做成rap版本,我这里先卖个关子,后面会有解释),这是其中一段:

武松打虎rap视频-b546a90b27

下面详细介绍我的制作过程,其中有不少技巧(坑),也算是摸索了一下当前扣子空间的能力边界。

测试视频生成能力

在正式进行之前,我先做了一个验证测试,确认扣子空间是否有生成视频的能力。

我上传了一张火车票的图片,让扣子空间生成一段音乐,和图片一起合成一段视频。

可以看到扣子空间自己安装了ffmpeg,这个是用来生成视频的软件

图片

Tips: 在我多次尝试过程中,发现并不是每次扣子空间都可以成功安装ffmpeg,如果没有安装成功,可以这样输入指令:

用这个命令安装ffmpeg:apt-get update && apt-get install -y ffmpeg

这样基本上就都能安装成功了。

接下来遇到另外一个坑,生成的视频大小为0,无法播放,经过反复试错,发现可能是因为视频时长过长。

于是修改指令指定生成一段15s长的音乐:

生成15s的舒缓音乐,和附件的图片一起生成一段mp4格式的视频,视频长宽都是720

果然,这样就可以生成有效的视频了,如下:

video3

Tips: 现在扣子空间到底能支持多长的视频生成,我还没有测试过边界,我现在生成过的最长视频是30s

好了,经过以上测试,算是验证了扣子空间生成视频的能力。

可以进行下一步了:将儿童故事绘本工作流引入扣子空间使用

这个过程分为两步:

  1. 将扣子工作流发布成扣子空间的MCP扩展

  2. 在扣子空间中使用这个MCP扩展进行视频创作

下面详细说明如何操作。

发布扣子工作流MCP扩展

说明一下,目前扣子平台只支持将扣子应用发布成MCP(据称后面马上会支持直接将工作流发布成MCP),所以这里我们要多走一步,先创建一个扣子应用。

创建扣子应用

图片

然后将工作流加入应用,界面部分不用管,添加了工作流就可以直接发布成MCP了。

图片

儿童故事绘本的工作流如下,因为这篇文章重点不是介绍扣子工作流,就不展开介绍了,有需要的朋友可以给我留言。

图片

发布成MCP服务

点击右上角的发布进入发布界面以后可以看到,在最右侧有一个MCP服务的选项,点击它就会跳到底部MCP服务那里

图片

这里需要先配置一下,点开配置,勾选全部即可

图片

发布完成

图片

发布完成后,就可以在扣子空间使用了。

扣子空间生成故事视频

按以下步骤操作:

添加扩展

在扣子空间的自定义扩展里可以看到我们刚在扣子平台里发布的这个MCP服务:儿童故事绘本,点击添加。

图片

然后再添加另外两个扣子空间自带的MCP扩展:语音合成(用于生成朗读音频)和音乐生成(用于生成背景音乐),一共3个扩展,如下:

图片

输入指令

这个是我尝试了很多次,才找到的可以成功生成视频的提示词。

图片

相比 Manus 扣子空间的大模型能力还不够强大,遇到问题不太会自己处理,有时候反而需要我给它指令来帮助它解决问题。

比如这里的坑主要是在图片处理上,需要告诉扣子空间将图片下载到本地,否则后面合成视频的时候,无法正确提取到图片。

我之前也测了不少Manus的案例,如果是Manus,这种问题它应该会自己搞定。

终于,视频成功生成了

图片

但是还有个问题,生成的背景音乐,无论我怎么修改提示词(试了差不多十遍),它始终会有人声,无法生成纯音乐,这个就很无语了,效果是这样滴:

武松打虎绘本视频-1bd6b01b1f

所以我最后只能选择不要朗读音频或者不要背景音乐。

然鹅,我突然灵机一动,如果把故事内容作为音乐的歌词呢?这不就完美解决了朗读和音乐结合的问题嘛,而且还颇有新意,于是开头的那个rap视频就是这么来的~~

当然还是期待将来会有支持生成纯音乐的扩展。

写在最后

这算是一次有趣的尝试,对扣子空间当前的能力做了一次探索。虽然说不算完美,但是整个流程是跑通的,这个非常重要。

扣子空间有自己的平台优势,因为它有扣子平台巨量的用户和工作流,这两者打通以后,会产生巨大的化学反应。

扣子空间现在还在beta版本,不能苛求它多完美,但是未来绝对可期。

比如,将来如果把图生视频的MCP接入进来,那么在现在这个demo基础上,我就可以通过一句话做出有动画效果的故事视频了,想想都非常期待~~

更多精彩内容推荐:

-> AI智能体学习&实战

-> 私域AI机器人

-> 自媒体AIP打造

-> AI应用

http://www.xdnf.cn/news/512371.html

相关文章:

  • java中的Servlet3.x详解
  • 07、基础入门-SpringBoot-自动配置特性
  • wsl2中Ubuntu22.04配置静态IP地址
  • 荔枝成熟度分割数据集labelme格式2263张3类别
  • 基于PageHelper的分页查询
  • MyBatis-Plus 的 updateById 方法不更新 null 值属性的问题
  • MySQL--day2--基本的select语句
  • 50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | Expanding Cards (展开式卡片)
  • AI预测3D新模型百十个定位预测+胆码预测+去和尾2025年5月18日第81弹
  • symfonos: 1靶场
  • 一个stm32工程从底层上都需要由哪些文件构成
  • 【ROS2】RViz2源码分析(九):RosClientAbstraction和RosNodeAbstraction的关系
  • Android 性能优化入门(二)—— 内存优化
  • MATLAB安装常见问题解决方案
  • C++23 放宽范围适配器以允许仅移动类型(P2494R2)
  • Java求职者面试:从Spring Boot到微服务的技术点解析
  • 什么是机器学习?
  • HiTool机顶盒刷机提示:网络下载TFTP超时,可能的原因如下
  • 原型链的详细解释及使用场景
  • ShenNiusModularity项目源码学习(26:ShenNius.Admin.Mvc项目分析-11)
  • JavaScript 中的 Window 对象详解
  • 气体放电管和TVS管之间加电感
  • 【Linux】利用多路转接epoll机制、ET模式,基于Reactor设计模式实现
  • AutoGPT-Agent简述版
  • java实现poi-ooxml导出Excel的功能
  • Graphics——基于.NET 的 CAD 图形预览技术研究与实现——CAD c#二次开发
  • 微软将于 8 月 11 日关闭 Bing Search API 服务
  • 服务器防文件上传手写waf
  • 系统性能不达标,如何提升用户体验?
  • IDEA - Windows IDEA 代码块展开与折叠(基础折叠操作、高级折叠操作)