当前位置: 首页 > news >正文

基于n8n指定网页自动抓取解析入库工作流实战

1. 效果预览

给定华尔街见闻指定链接,自动抓取文章存储至MongoDB


2. 部署n8n

n8n可用插件非常多,并且完全免费开源

下载n8n后,执行npx n8n运行即可,如果node版本低于14会报错,请升级至20版本

3. firecrawl节点安装

3.1 其他节点介绍

第一节点用于 接收聊天输入
第二个节点用于判断是否为链接:我们可以直接拖动chatInput到蓝色字体处,然后选择正则表达式匹配url
IF 判断是否为Url
第三个节点是社区节点FireCrawl,我们首先需要安装下:

3.2 安装FireCrawl Node节点

点击

在IF节点后,我们添加FireCrawl节点,配置如下,


其中FireCrawl API配置如下, 改为自己的key

4. 格式转换节点配置


我们搜索Set, 新增字段编辑节点,将抓取的内容转为MongoDB需要保存的字段格式

5. MongoDB存储

定义好字段后,可以直接执行,在页面非常方便的看到输入与输出

http://www.xdnf.cn/news/940321.html

相关文章:

  • 开源一个心流舱付费空间番茄风水钟
  • 车载诊断架构 --- 整车诊断数据管理策略
  • LR修图软件|Lightroom 2025网盘下载与安装教程指南
  • C++_核心编程_菱形继承
  • gem5-gpu教程 在gem5-gpu上运行多个应用程序
  • java复习 05
  • 聊聊集群间数据复制和持久化机制
  • Auto Think,快手开源的自动思考大模型
  • 从一次日期格式踩坑经历,谈谈接口设计中的“约定大于配置“
  • python打卡day48@浙大疏锦行
  • The Quantization Model of Neural Scaling
  • 【学习笔记】深入理解Java虚拟机学习笔记——第4章 虚拟机性能监控,故障处理工具
  • 一张图 介绍什么是字节流
  • 【证书】2025公益课,人工智能训练师-高级,知识点与题库(橙点同学)
  • java 乐观锁的实现和注意细节
  • 【GPT模型训练】第二课:张量与秩:从数学本质到深度学习的基础概念解析
  • 从认识AI开始-----变分自编码器:从AE到VAE
  • webgl
  • cpp自学 day2(—>运算符)
  • 常见 DOM 事件全解析
  • DAY 48 随机函数与广播机制
  • 模拟 - #介绍 #题解
  • 使用智能表格做需求管理
  • 【本地AI大模型部署+可视化界面图文教程】Ollama+Qwen3
  • 从C到C++语法过度1
  • Ajax入门
  • SAP顾问职位汇总(第23周)
  • ​**​CID字体​**​ 和 ​**​Simple字体​**​
  • Python实例题:Python计算数理统计
  • 大语言模型(LLM)面试问题集