当前位置：首页 > web >正文

dify+Qwen2.5-vl+deepseek打造属于自己的作业帮

web 2025/9/7 8:10:16

小伙伴们，今天我们来利用dify+Qwen2.5-vl多模态模型和DeepSeek大模型搭建一个属于自己的[作业帮] 不仅可识别题目图片,还能给出详细解答和知识点讲解。

Dify 往期推文

Dify+Deepseek强强联合！3步搭建企业级智能知识库，响应速度狂飙300%！

安装Dify：

拉取源码

git clone https://github.com/langgenius/dify.git

Docker安装

cd dify

cd docker

cp .env.example .env

docker compose up -d

第一次运行进入网址进行设置：http://localhost/install

模型设置这边我们选择ollama 点击【安装】

添加模型：

这里如果ollama加载不出来，调整.env 文件最后添加如下：

重启docker

docker compose down

docker compose up -d

Ollama安装：

网站：https://ollama.com/download

下载后直接双击安装即可

大模型安装

命令行输入：ollama run qwen2.5vl:7b 有条件的可直接上72b 效果会更好

搭建dify工作流：

新建工作流：点击选择创建空白应用选择工作流

开始节点选择【文件上传】

添加条件分支图片识别上传文件通过进行图片识别，未上传进行题目解析

添加大模型qwen2.5vl:7b 识别图片

添加大模型qwen3:8b 进行题目解析

最终流程图如下：

我们来发布测试下效果：

直接输入问题，智能体给出相应的答案：

上传图片，智能体识别图片的题目并进行解析

我们来测试几道英语题目试试：

第六题的答案好像解析的有些问题，有懂的看看能不能指点指点，欢迎评论区留言！

重新解答后对了应该是 hear sb do sth

感谢大家的点赞和关注，我们下期见！

http://www.xdnf.cn/news/20478.html

相关文章：

第27节：3D数据可视化与大规模地形渲染

如何下载小红书视频

MySQL的组复制（MGR）高可用集群搭建

vue3图标终极方案【npm包推荐】vue3-icon-sui（含源码详解）

STM32F4芯片RS485使用记录

小迪自用web笔记29

少儿配音教育：广州声与色在线科技有限公司打造趣味课程，助力青少年语言能力提升

电脑外接显示屏字体和图标过大

实体商业创新观察：AI 驱动的本地生活服务新模式解析

计算机网络：物理层---物理层的基本概念

OpenSSL 1.0.1e 下载解压和运行方法（小白适用附安装包）

Nginx性能调优：参数详解与压测对比

小孔成像原理

吴恩达机器学习（九）

正态分布 - 正态分布的标准化

音视频技术全景：从采集到低延迟播放的完整链路解析

【鸿蒙 NEXT】V1迁移V2状态管理

VMWare和centOS的安装

集成学习 —— 梯度提升树GBDT、XGBoost

Javaweb 14.4 Vue3 视图渲染技术

【MySQL | 高级篇分片规则与管理监控】

从Java全栈到前端框架的全面实战：一次真实面试的深度解析

CentOS下Bind服务的安装与故障排查

pyAutoGUI 模块主要功能介绍-(1)鼠标功能

从 Excel 趋势线到机器学习：拆解 AI 背后的核心框架

【明道云】[工作表控件11] 地理位置控件与地图定位应用

用内存顺序实现三种内存顺序模型

安装es和kibana