当前位置: 首页 > news >正文

图数据库neo4j部分用法浅讲

图数据库neo4j部分用法浅讲

一、简单介绍

1、✅ 简要说明

Neo4j 是基于图结构的数据存储系统,与传统的关系型数据库(如 MySQL、PostgreSQL)不同,它使用节点(Node)、关系(Relationship)和属性(Property)来存储和查询数据。

2、📌 核心概念

概念说明
节点(Node)表示实体,例如:人、地点、产品等,相当于关系型数据库中的一行记录
关系(Relationship)表示节点之间的连接和关系,关系是图数据库的核心优势
属性(Property)存储在节点或关系上的键值对,例如:name, age, time 等
标签(Label)给节点分类的标识,例如:Person, Company
Cypher 查询语言Neo4j 使用的类 SQL 的图查询语言,用来创建、查询、更新图数据

3、🧠 为什么使用图数据库?

  • 更适合处理复杂关系(例如:社交网络、推荐系统、交通网络)
  • 查询关系路径(path)效率高,不需要 JOIN 多表
  • 更直观的数据建模

二、neo4j桌面版

在这里插入图片描述

1、🧭 左侧导航栏(Sidebar)

Data services
  • Local instances(本地实例):显示你在本机上运行的所有 Neo4j 实例,如 addressSearch。

  • Remote connections(远程连接):用于连接 Neo4j Aura 或其他远程服务器上的 Neo4j 实例。

  • Import(导入):用于导入 CSV、JSON、GraphML 等数据文件进入数据库。

Tools

  • Query(查询):进入 Cypher 查询编辑器,执行查询语句。
  • Explore(探索):图形化地浏览图数据库中的数据节点和关系。

About

  • Settings(设置):修改 Neo4j Desktop 的全局设置,比如 JDK 路径、插件管理等。

三、Neo4j 的 Cypher语言

1、 查询

MATCH (p:poi)
RETURN keys(p), p
LIMIT 100
1.1 详细解释
MATCH (p:poi)

查找图中所有标签为 poi 的节点,并将它们绑定到变量 p。

  • p:是一个变量名,代表匹配到的节点。
  • :poi:是标签(label),表示我们只关注拥有 poi 标签的节点。
  • MATCH:是 Cypher 查询中用于模式匹配的关键字,相当于 SQL 的 FROM + JOIN,用于从图中查找结构
RETURN keys§, p

返回每个 poi 节点的:

  • keys§:该节点的所有属性名称(即字段名、键名)
  • p:整个节点对象,包括其所有属性值

2、添加新的字段

MATCH (p:poi)
SET p.location = point({longitude: toFloat(p.lng), latitude: toFloat(p.lat)})
2.1 详细解释
🔹 MATCH (p:poi)
  • 匹配所有带有 poi 标签的节点。
  • 把每个匹配的节点赋值给变量 p。
SET p.location = …
  • 对每个匹配到的节点,**设置(或覆盖)**一个名为 location 的新属性。
  • 这个属性将被赋值为一个 point 类型(地理坐标点)。
🔹 point({longitude: …, latitude: …})

Neo4j 中支持 原生地理空间类型,point() 是一个函数,用来创建一个地理坐标点。

  • longitude: 经度,对应东-西方向。
  • latitude: 纬度,对应北-南方向。

这个点会是 WGS-84 坐标系中的一个 2D 点(默认 SRID 为 4326)

3、构建“就近关系”图谱

MATCH (a:POI), (b:POI)
WHERE id(a) < id(b) AND point.distance(a.location, b.location) < 500
MERGE (a)-[:NEARBY]->(b)
3.1 详细解释
🔹 MATCH (a:POI), (b:POI)
  • 匹配所有 POI 标签的节点对 (a, b)。
  • 这会产生 所有可能的两两组合(即笛卡尔积)。
  • ⚠️ 如果有 n 个 POI 节点,组合总数是 n²,因此加上 WHERE 限制很重要
🔹 WHERE id(a) < id(b)
  • 防止重复组合和自连接:

    • 例如 (a, b) 和 (b, a) 是一样的距离关系,只需要创建一条。
    • 同时 a != b,避免自己连自己。
  • id(a) 是 Neo4j 内部自动生成的唯一节点 ID

🔹 point.distance(a.location, b.location) < 500
  • 使用 point.distance 函数计算两个点之间的直线(欧几里得)距离(单位:米,基于 WGS84 坐标)。
  • 这里表示:a 和 b 节点之间的距离小于 500 米。
  • 前提是两个节点的 location 属性都必须是 point 类型(即之前你设置的那种):
SET p.location = point({latitude: ..., longitude: ...})
🔹 MERGE (a)-[:NEARBY]->(b)
  • 如果 a 到 b 之间还没有 NEARBY 关系,就创建一条有向边。
  • MERGE 语义类似 SQL 的 UPSERT,保证不会创建重复的关系

🧠 注意:

  • MERGE 是有向的,这里是 a → b,不是 b → a。
  • 如果你希望两个方向都存在(双向连接),可以写成:
MERGE (a)-[:NEARBY]->(b)
MERGE (b)-[:NEARBY]->(a)

双向连接⚠️ 性能提示

这种写法可能在节点数量多时非常慢,因为:

  • 它是 全图两两比较(复杂度 O(n²))。
  • 建议在实际场景中加 空间索引 + 分批处理
CREATE INDEX poi_location_index FOR (p:POI) ON (p.location)

或者使用 Neo4j 的 空间范围搜索方式更高效(基于 WITH 和 apoc.spatial.*)

3、查询某个关系信息

MATCH p = ()-[:NEARBY]->()
RETURN p
LIMIT 250;
🔹 MATCH p = ()-[:NEARBY]->()

✅ 含义:

  • 匹配图中所有带有 NEARBY 关系的节点对(即边)。
  • () 表示任意节点(不限制标签)。
  • [:NEARBY] 表示只匹配名为 NEARBY 的边(关系类型)。
  • -> 表示关系方向是从左节点指向右节点。

✅ p = … 的作用:

  • 把匹配到的整个路径(起点节点、关系、终点节点)赋值给变量 p。
  • 这样你可以在 RETURN 中一次性返回整个路径对象
http://www.xdnf.cn/news/1046413.html

相关文章:

  • 基于SpringBoot和Leaflet的电影票房时序展示-以《哪吒2》为例
  • 6,TCP客户端
  • 【系统设计【3】】系统设计面试框架:从理论到实践的完整指南
  • 2013-2023年 地级市-财政透明度数据-社科经管实证数据
  • 使用Netlify进行简单部署
  • UE5 仿 鸣潮人物渲染
  • 【项目实训】【项目博客#09】HarmonySmartCodingSystem系统后端智能API检索与代码助手实现(6.2-6.15)
  • Kafka代码模板
  • 论文略读:Can LLMs Solve Longer Math Word Problems Better?
  • React 实现九宫格抽奖游戏
  • 语言特性适用的场景:卫星、火箭控制系统用什么开发语言?
  • 【小沐杂货铺】基于Babylon.JS绘制三维数字地球Earth(GIS 、WebGL、vue、react,提供全部源代码)
  • [windows工具]OCR识文找图工具1.2版本使用教程及注意事项
  • 使用 MCP 驱动的分布式智能扩展 Space-O-RAN
  • 电磁场与电磁波篇---电磁场的边界条件
  • 使用 Canal 实现 MySQL 数据同步的完整指南
  • MIT线性代数第三讲笔记
  • [python] 堆
  • 共享内存实现进程通信
  • 1.MySQL三层结构
  • Faithful Logical Reasoning via Symbolic Chain-of-Thought
  • 组策略关闭 Windows 防火墙指南(企业版/专业版)
  • 关于springMVC 项目 println 输出中文乱码问题,解决方法
  • 人工智能 AGC方向
  • langChainv0.3学习笔记(中级篇)
  • MCP数据可视化服务器配置依赖
  • Vue3 axios 请求设置 signal 信号属性,以便 abort 取消请求
  • 408第一季 - 数据结构 - 散列表
  • arcpy数据分析自动化
  • RFC4291-IPv6地址架构