当前位置: 首页 > web >正文

dify+Qwen2.5-vl+deepseek打造属于自己的作业帮

小伙伴们,今天我们来利用dify+Qwen2.5-vl多模态模型和DeepSeek大模型搭建 一个属于自己的[作业帮] 不仅可识别题目图片,还能给出详细解答和知识点讲解。 

Dify 往期推文

Dify+Deepseek强强联合!3步搭建企业级智能知识库,响应速度狂飙300%!

安装Dify:      

拉取源码

git clone https://github.com/langgenius/dify.git

Image

Docker安装

cd dify

cd docker

cp .env.example .env

docker compose up -d

Image

第一次运行进入网址进行设置:http://localhost/install

Image

Image

模型设置这边我们选择ollama 点击【安装】

Image

添加模型:

Image

Image

这里如果ollama加载不出来,调整.env 文件 最后添加如下:

 

Image

重启docker

docker compose down

Image

docker compose up -d

Ollama安装:

        

网站:https://ollama.com/download

Image

下载后直接双击安装即可

Image

大模型安装

Image

命令行输入:ollama run qwen2.5vl:7b 有条件的可直接上72b 效果会更好 

Image

搭建dify工作流:

        

新建工作流:点击选择创建空白应用 选择工作流

Image

开始节点选择【文件上传】

Image

添加条件分支 图片识别 上传文件通过 进行图片识别,未上传进行题目解析

Image

添加大模型qwen2.5vl:7b 识别图片

Image

添加大模型qwen3:8b  进行题目解析

Image

最终流程图如下:

Image

我们来发布测试下效果:

直接输入问题,智能体给出相应的答案:

Image

上传图片,智能体识别图片的题目并进行解析

Image

Image

我们来测试几道英语题目试试:

Image

Image

第六题的答案好像解析的有些问题,有懂的看看能不能指点指点,欢迎评论区留言!

重新解答后对了 应该是 hear sb do sth

Image

感谢大家的点赞和关注,我们下期见!

http://www.xdnf.cn/news/20478.html

相关文章:

  • 第27节:3D数据可视化与大规模地形渲染
  • 如何下载小红书视频
  • MySQL的组复制(MGR)高可用集群搭建
  • vue3图标终极方案【npm包推荐】vue3-icon-sui(含源码详解)
  • STM32F4芯片RS485使用记录
  • 小迪自用web笔记29
  • 少儿配音教育:广州声与色在线科技有限公司打造趣味课程,助力青少年语言能力提升
  • 电脑外接显示屏字体和图标过大
  • 实体商业创新观察:AI 驱动的本地生活服务新模式解析
  • 计算机网络:物理层---物理层的基本概念
  • OpenSSL 1.0.1e 下载解压和运行方法(小白适用 附安装包)​
  • Nginx性能调优:参数详解与压测对比
  • 小孔成像原理
  • 吴恩达机器学习(九)
  • 正态分布 - 正态分布的标准化
  • 音视频技术全景:从采集到低延迟播放的完整链路解析
  • 【鸿蒙 NEXT】V1迁移V2状态管理
  • VMWare和centOS的安装
  • 集成学习 —— 梯度提升树GBDT、XGBoost
  • Javaweb 14.4 Vue3 视图渲染技术
  • 【MySQL | 高级篇 分片规则与管理监控】
  • 从Java全栈到前端框架的全面实战:一次真实面试的深度解析
  • c++ sqlite3库
  • CentOS下Bind服务的安装与故障排查
  • pyAutoGUI 模块主要功能介绍-(1)鼠标功能
  • 从 Excel 趋势线到机器学习:拆解 AI 背后的核心框架​
  • 数位DP -
  • 【明道云】[工作表控件11] 地理位置控件与地图定位应用
  • 用内存顺序实现 三种内存顺序模型
  • 安装es和kibana