当前位置: 首页 > java >正文

SurfSense开源程序是NotebookLM / Perplexity / Glean的开源替代品,连接到外部来源,如搜索引擎

​一、软件介绍

文末提供程序和源码下载

     虽然 NotebookLM 和 Perplexity 等工具令人印象深刻,并且对于对任何主题/查询进行研究都非常有效,但 SurfSense 通过与你的个人知识库集成来提升这种能力。它是一个高度可定制的 AI 研究代理,连接到外部资源,例如搜索引擎(Tavily、LinkUp)、Slack、Linear、Notion、YouTube、GitHub 等。

二、主要特点

1. Latest 1. 最新

💡 Idea: 💡 想法:

Have your own highly customizable private NotebookLM and Perplexity integrated with external sources.
拥有您自己的高度可定制的私有 NotebookLM 和 Perplexity 与外部源集成。

📁 Multiple File Format Uploading Support
📁 支持多种文件格式上传

Save content from your own personal files (Documents, images and supports 27 file extensions) to your own personal knowledge base .
将您自己的个人文件(文档、图像和支持 27 个文件扩展名)中的内容保存到您自己的个人知识库中。

🔍 Powerful Search 🔍 强大的搜索功能

Quickly research or find anything in your saved content .
快速研究或查找您保存的内容中的任何内容。

💬 Chat with your Saved Content
💬 与您保存的内容聊天

Interact in Natural Language and get cited answers.
在 Natural Language 中互动并获得引用的答案。

📄 Cited Answers 📄 引用的答案

Get Cited answers just like Perplexity.
获取 Perfasciity 的 Cited 答案。

🔔 Privacy & Local LLM Support
🔔 隐私和本地LLM支持

Works Flawlessly with Ollama local LLMs.
与 Ollama local LLMs完美配合。

🏠 Self Hostable 🏠 自托管

Open source and easy to deploy locally.
开源且易于本地部署。

📊 Advanced RAG Techniques
📊 高级 RAG 技术
  • Supports 150+ LLM's 支持 150+ LLM个
  • Supports 6000+ Embedding Models.
    支持 6000+ 嵌入模型。
  • Supports all major Rerankers (Pinecode, Cohere, Flashrank etc)
    支持所有主要的 Reranker(Pinecode、Cohere、Flashrank 等)
  • Uses Hierarchical Indices (2 tiered RAG setup).
    使用 Hierarchical Indices (2 层 RAG 设置)。
  • Utilizes Hybrid Search (Semantic + Full Text Search combined with Reciprocal Rank Fusion).
    利用混合搜索(语义 + 全文搜索与倒数秩融合相结合)。
  • RAG as a Service API Backend.
    RAG 即服务 API 后端。
ℹ️ External Sources i️ 外部源
  • Search Engines (Tavily, LinkUp)
    搜索引擎 (Tavily, LinkUp)
  • Slack 松弛
  • Linear 线性
  • Notion 概念
  • Youtube Videos Youtube 视频
  • GitHub GitHub的

Cross Browser Extension
🔖 跨浏览器扩展

  • The SurfSense extension can be used to save any webpage you like.
    SurfSense 扩展程序可用于保存您喜欢的任何网页。
  • Its main usecase is to save any webpages protected beyond authentication.
    它的主要用例是保存任何在身份验证之外受保护的网页。

Tech Stack 技术栈

BackEnd 后端

  • FastAPI: Modern, fast web framework for building APIs with Python
    FastAPI:用于使用 Python 构建 API 的现代、快速的 Web 框架

  • PostgreSQL with pgvector: Database with vector search capabilities for similarity searches
    带有 pgvector 的 PostgreSQL:具有用于相似性搜索的向量搜索功能的数据库

  • SQLAlchemy: SQL toolkit and ORM (Object-Relational Mapping) for database interactions
    SQLAlchemy:用于数据库交互的 SQL 工具包和 ORM(对象关系映射)

  • Alembic: A database migrations tool for SQLAlchemy.
    Alembic:用于 SQLAlchemy 的数据库迁移工具。

  • FastAPI Users: Authentication and user management with JWT and OAuth support
    FastAPI 用户:使用 JWT 和 OAuth 支持进行身份验证和用户管理

  • LangGraph: Framework for developing AI-agents.
    LangGraph:开发 AI 代理的框架。

  • LangChain: Framework for developing AI-powered applications.
    LangChain:用于开发 AI 驱动的应用程序的框架。

  • LLM Integration: Integration with LLM models through LiteLLM
    LLM集成:通过 LiteLLM 与LLM模型集成

  • Rerankers: Advanced result ranking for improved search relevance
    Rerankers:用于提高搜索相关性的高级结果排名

  • Hybrid Search: Combines vector similarity and full-text search for optimal results using Reciprocal Rank Fusion (RRF)
    混合搜索:使用倒数秩融合 (RRF) 将向量相似性和全文搜索相结合,以获得最佳结果

  • Vector Embeddings: Document and text embeddings for semantic search
    向量嵌入:用于语义搜索的文档和文本嵌入

  • pgvector: PostgreSQL extension for efficient vector similarity operations
    pgvector:用于高效向量相似性作的 PostgreSQL 扩展

  • Chonkie: Advanced document chunking and embedding library
    Chonkie:高级文档分块和嵌入库

  • Uses AutoEmbeddings for flexible embedding model selection
    用于 AutoEmbeddings 灵活的嵌入模型选择

  • LateChunker for optimized document chunking based on embedding model's max sequence length
    LateChunker 用于基于嵌入模型的最大序列长度优化文档分块


FrontEnd 前端

  • Next.js 15.2.3: React framework featuring App Router, server components, automatic code-splitting, and optimized rendering.
    Next.js 15.2.3:React 框架,具有 App Router、服务器组件、自动代码拆分和优化渲染。

  • React 19.0.0: JavaScript library for building user interfaces.
    React 19.0.0:用于构建用户界面的 JavaScript 库。

  • TypeScript: Static type-checking for JavaScript, enhancing code quality and developer experience.
    TypeScript:JavaScript 的静态类型检查,可增强代码质量和开发人员体验。

  • Vercel AI SDK Kit UI Stream Protocol: To create scalable chat UI.
    Vercel AI SDK 套件 UI 流协议:创建可扩展的聊天 UI。

  • Tailwind CSS 4.x: Utility-first CSS framework for building custom UI designs.
    Tailwind CSS 4.x:用于构建自定义 UI 设计的实用优先 CSS 框架。

  • Shadcn: Headless components library.
    Shadcn:Headless 组件库。

  • Lucide React: Icon set implemented as React components.
    Lucide React:作为 React 组件实现的图标集。

  • Framer Motion: Animation library for React.
    Framer Motion:React 的动画库。

  • Sonner: Toast notification library.
    Sonner:Toast 通知库。

  • Geist: Font family from Vercel.
    Geist:来自 Vercel 的字体系列。

  • React Hook Form: Form state management and validation.
    React Hook Form:表单状态管理和验证。

  • Zod: TypeScript-first schema validation with static type inference.
    Zod:使用静态类型推理进行 TypeScript 优先模式验证。

  • @hookform/resolvers: Resolvers for using validation libraries with React Hook Form.
    @hookform/resolvers: 用于将验证库与 React Hook Form 一起使用的解析器。

  • @tanstack/react-table: Headless UI for building powerful tables & datagrids.
    @tanstack/react-table:用于构建强大表格和数据网格的无头用户界面。

Extension 外延

Manifest v3 on Plasmo
Plasmo 上的 Manifest v3

三、软件下载

夸克网盘分享

本文信息来源于GitHub作者地址:GitHub - MODSetter/SurfSense: Open Source Alternative to NotebookLM / Perplexity / Glean, connected to external sources such as search engines (Tavily, Linkup), Slack, Linear, Notion, YouTube, GitHub and more.

http://www.xdnf.cn/news/3857.html

相关文章:

  • ArrayList的扩容机制(源码解析)
  • 深度学习的简单介绍
  • PISI:眼图1:眼图相关基本概念
  • 使用synchronized关键字同步Java线程
  • AndroidLogger常用命令和搜索功能介绍
  • STM32Cube-FreeRTOS任务调度与任务管理-笔记
  • ruoyi-flowable框架关于启动时提示锁住问题
  • LLM论文笔记 27: Looped Transformers for Length Generalization
  • n8n工作流自动化平台的实操:利用本地嵌入模型,完成文件内容的向量化及入库
  • 【Linux网络#3】:Socket编程应用层UDP
  • Scartch038(四季变换)
  • MCP智能体多Agent协作系统设计(Multi-Agent Cooperation)
  • 模型部署——cuda编程入门
  • C语言内存函数详解:从基础到实战
  • 2025年渗透测试面试题总结-拷打题库38(题目+回答)
  • profile软件开发中的性能剖析与内存分析
  • 数据库Mysql_联合查询
  • Python----机器学习(模型评估:准确率、损失函数值、精确度、召回率、F1分数、混淆矩阵、ROC曲线和AUC值、Top-k精度)
  • 双列集合——map集合和三种遍历方式
  • React实现B站评论Demo
  • 分布式系统中的 ActiveMQ:异步解耦与流量削峰(一)
  • Dify 完全指南(一):从零搭建开源大模型应用平台(Ollama/VLLM本地模型接入实战)》
  • Github2025-05-04php开源项目日报 Top10
  • 详解迁移学习,模型参数冻结,优化器参数定义
  • 传感器数据处理笔记
  • Linux中的粘滞位和开发工具和文本编辑器vim
  • 马小帅面试遇“灵魂拷问“
  • hot100:链表倒数k个节点- 力扣(LeetCode)
  • 研0大模型学习(第11天)
  • FFT实现(Cooley-Tukey算法)