当前位置: 首页 > news >正文

探秘 DeerFlow:字节跳动开源的科研创作魔法盒!

1.前言

字节跳动于2025年5月9日开源了名为DeerFlow的全新Deep Research项目,该项目基于LangStack框架,旨在通过人工智能技术简化科研和内容创作流程。DeerFlow整合了语言模型、网络搜索、爬虫和Python代码执行等多种工具,支持深度研究、MCP集成、AI增强报告编辑以及播客生成等功能。

DeerFlow采用多Agent系统架构,包括协调器、规划器、研究团队和报告生成器等模块,能够实现人机协作和动态任务迭代,显著提升研究效率。例如,其Arxiv搜索功能可快速识别高质量学术资源,而AI驱动的内容创作模块则能自动生成播客脚本、音频合成和演示文稿。

该项目还强调灵活的协作机制,支持团队成员实时共享数据和模型,打破地域限制,促进知识交流。DeerFlow的开源不仅展示了字节跳动在AI领域的技术积累,也为全球研究者和开发者提供了一个高效的研究工具平台。

一张图给大家看一下项目功能特点。

image-20250511164201449

那么如何运行这个项目和体验这个项目呢?今天就带大家体验一下这个项目。

2.DeerFlow 安装和使用

1.环境要求

确保您的系统满足以下最低要求:

  • Python: 版本 3.12+
  • Node.js: 版本 22+

image-20250511154555603

image-20250511154652429

2.安装

# 克隆仓库
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow# 安装依赖,uv将负责Python解释器和虚拟环境的创建,并安装所需的包
uv sync# 使用您的API密钥配置.env
# Tavily: https://app.tavily.com/home
# Brave_SEARCH: https://brave.com/search/api/
# 火山引擎TTS: 如果您有TTS凭证,请添加
cp .env.example .env# 查看下方的"支持的搜索引擎"和"文本转语音集成"部分了解所有可用选项# 为您的LLM模型和API密钥配置conf.yaml
# 请参阅'docs/configuration_guide.md'获取更多详情
cp conf.yaml.example conf.yaml# 安装marp用于PPT生成
# https://github.com/marp-team/marp-cli?tab=readme-ov-file#use-package-manager
brew install marp-cli

我们使用 git 把代码克隆

image-20250511154755031

安装依赖,uv将负责Python解释器和虚拟环境的创建,并安装所需的包

image-20250511154928017

修改配置文件

复制.env.example 变成 .env 同时修改.env相关配置

其中搜索引擎用到了tavily,我们把tavily 的api key填入配置文件,火山引擎TTS 我们目前用不到先不填写,修改后的配置文件内容如下:

# Application Settings
DEBUG=True
APP_ENV=development# Search Engine
SEARCH_API=tavily
TAVILY_API_KEY=tvly-xxx
# JINA_API_KEY=jina_xxx # Optional, default is None# Optional, volcengine TTS for generating podcast
VOLCENGINE_TTS_APPID=xxx
VOLCENGINE_TTS_ACCESS_TOKEN=xxx
# VOLCENGINE_TTS_CLUSTER=volcano_tts # Optional, default is volcano_tts
# VOLCENGINE_TTS_VOICE_TYPE=BV700_V2_streaming # Optional, default is BV700_V2_streaming# [!NOTE]
# For model settings and other configurations, please refer to `docs/configuration_guide.md`

同样我们需要修改 conf.yaml, 这里主要是用到的基础模型,我们换成google gemini2.5pro


BASIC_MODEL:base_url: https://geminicloudflare.duckcloud.fun/v1model: "gemini-2.5-flash-preview-04-17"api_key: xxxx

以上我们就完成 DeerFlowa环境安装和基础配置

可选,通过pnpm安装Web UI依赖:

cd deer-flow/web
pnpm install

image-20250511160236704

3.控制台UI

接下来我们使用控制台UI启动程序页面访问

uv run main.py

image-20250511160638323

这样我们就可以通过交互方式 提问题了。

我的问题

GitHub上最热门的仓库有哪些?

image-20250511160801685

最后搜索的结果

image-20250511161029508

控制台的确给我搜索,这里大家觉的这种交互方式不好看,我们可以使用Web UI方式

4.Web UI

在windows平台上,我们启动一个叫做bootstrap.bat 文件

image-20250511160948318

image-20250511161333910

image-20250511161345162

我们在浏览器中输入http://localhost:3000

image-20250511161435115

看到上面页面就可以实现访问了。

image-20250511161520565

我们先拿官方的例子

撰写关于南京传统美食的文章

image-20250511161711075

这个效果明显比控制台的输出效果强很多, 还有搜索的图片信息。

最终生成的来的报告(报告有点长我只截图一部分)

image-20250511161850274

还可以生成播客,由于我上面火山引擎没有配置TTS 所以声音出不来(大家可以自己去配置体验一下)

image-20250511162042036

image-20250511162104060

3.总结

DeerFlow的发布标志着字节跳动在AI技术与开源领域的进一步深耕。作为一款开源框架,DeerFlow不仅为用户提供了一个强大的研究工具,也为开源社区注入了新的活力。未来,随着更多开发者参与其中,DeerFlow有望成为深度研究和自动化分析领域的重要工具,并推动相关技术的持续进步。感兴趣的小伙伴可以按照上面步骤自己部署体验一下。今天的分享就到这里结束了,我们下一篇文章见。

http://www.xdnf.cn/news/388675.html

相关文章:

  • 温湿度传感器SHT4X
  • 【C++】AVL树实现
  • 害怕和别人发生冲突怎么办? --deepseek
  • [特殊字符] 免税商品优选购物商城系统 | Java + SpringBoot + Vue | 前后端分离实战项目分享
  • 线程的一些事(2)
  • 拍摄学习笔记【前期】(一)曝光
  • SQL 数据库监控:SQL语句监控工具与实践案例
  • 【Redis】Redis的主从复制
  • Linux常见指令解析(三)
  • jenkins built-in节点如何删除
  • TeledyneLeCroy在OFC2025 EA展台上展示了其400G/800G的全包围的测试解决方案,满足了UEC联盟和UALINK联盟的技术需求
  • 【25软考网工】第六章(3)数字签名和数字证书
  • opencv关键点检测
  • C语音学习---函数指针
  • Redis爆肝总结
  • 【嵌入式DIY实例-Arduino篇】-DIY遥控手柄
  • IC ATE集成电路测试学习——电流测试的原理和方法
  • 数据库与SQL核心技术解析:从基础到JDBC编程实战
  • 设计模式系列(1):总览与引导
  • NX989NY104美光科技芯片NY109NY113
  • LVGL(lv_btnmatrix矩阵按钮)
  • Babel 基础使用指南:从安装到编译的完整流程
  • MySQL主从复制
  • CacheBackEmbedding 组件的运行流程和使用注意事项
  • 使用 SHAP 进行特征交互检测:揭示变量之间的复杂依赖关系
  • 实战项目6(09)
  • 【计算机视觉】OpenCV实战项目:Text-Extraction-Table-Image:基于OpenCV与OCR的表格图像文本提取系统深度解析
  • Java泛型补充与理解
  • LangChain 使用指南与原理
  • ENSP-OSPF综合实验