图数据库neo4j部分用法浅讲
图数据库neo4j部分用法浅讲
一、简单介绍
1、✅ 简要说明
Neo4j 是基于图结构的数据存储系统,与传统的关系型数据库(如 MySQL、PostgreSQL)不同,它使用节点(Node)、关系(Relationship)和属性(Property)来存储和查询数据。
2、📌 核心概念
概念 | 说明 |
---|---|
节点(Node) | 表示实体,例如:人、地点、产品等,相当于关系型数据库中的一行记录 |
关系(Relationship) | 表示节点之间的连接和关系,关系是图数据库的核心优势 |
属性(Property) | 存储在节点或关系上的键值对,例如:name, age, time 等 |
标签(Label) | 给节点分类的标识,例如:Person , Company 等 |
Cypher 查询语言 | Neo4j 使用的类 SQL 的图查询语言,用来创建、查询、更新图数据 |
3、🧠 为什么使用图数据库?
- 更适合处理复杂关系(例如:社交网络、推荐系统、交通网络)
- 查询关系路径(path)效率高,不需要 JOIN 多表
- 更直观的数据建模
二、neo4j桌面版
1、🧭 左侧导航栏(Sidebar)
Data services
-
Local instances(本地实例):显示你在本机上运行的所有 Neo4j 实例,如 addressSearch。
-
Remote connections(远程连接):用于连接 Neo4j Aura 或其他远程服务器上的 Neo4j 实例。
-
Import(导入):用于导入 CSV、JSON、GraphML 等数据文件进入数据库。
Tools
- Query(查询):进入 Cypher 查询编辑器,执行查询语句。
- Explore(探索):图形化地浏览图数据库中的数据节点和关系。
About
- Settings(设置):修改 Neo4j Desktop 的全局设置,比如 JDK 路径、插件管理等。
三、Neo4j 的 Cypher语言
1、 查询
MATCH (p:poi)
RETURN keys(p), p
LIMIT 100
1.1 详细解释
MATCH (p:poi)
查找图中所有标签为 poi 的节点,并将它们绑定到变量 p。
- p:是一个变量名,代表匹配到的节点。
- :poi:是标签(label),表示我们只关注拥有 poi 标签的节点。
- MATCH:是 Cypher 查询中用于模式匹配的关键字,相当于 SQL 的 FROM + JOIN,用于从图中查找结构
RETURN keys§, p
返回每个 poi 节点的:
- keys§:该节点的所有属性名称(即字段名、键名)
- p:整个节点对象,包括其所有属性值
2、添加新的字段
MATCH (p:poi)
SET p.location = point({longitude: toFloat(p.lng), latitude: toFloat(p.lat)})
2.1 详细解释
🔹 MATCH (p:poi)
- 匹配所有带有 poi 标签的节点。
- 把每个匹配的节点赋值给变量 p。
SET p.location = …
- 对每个匹配到的节点,**设置(或覆盖)**一个名为 location 的新属性。
- 这个属性将被赋值为一个 point 类型(地理坐标点)。
🔹 point({longitude: …, latitude: …})
Neo4j 中支持 原生地理空间类型,point() 是一个函数,用来创建一个地理坐标点。
- longitude: 经度,对应东-西方向。
- latitude: 纬度,对应北-南方向。
这个点会是 WGS-84 坐标系中的一个 2D 点(默认 SRID 为 4326)
3、构建“就近关系”图谱
MATCH (a:POI), (b:POI)
WHERE id(a) < id(b) AND point.distance(a.location, b.location) < 500
MERGE (a)-[:NEARBY]->(b)
3.1 详细解释
🔹 MATCH (a:POI), (b:POI)
- 匹配所有 POI 标签的节点对 (a, b)。
- 这会产生 所有可能的两两组合(即笛卡尔积)。
- ⚠️ 如果有 n 个 POI 节点,组合总数是 n²,因此加上 WHERE 限制很重要
🔹 WHERE id(a) < id(b)
-
防止重复组合和自连接:
- 例如 (a, b) 和 (b, a) 是一样的距离关系,只需要创建一条。
- 同时 a != b,避免自己连自己。
-
id(a) 是 Neo4j 内部自动生成的唯一节点 ID
🔹 point.distance(a.location, b.location) < 500
- 使用 point.distance 函数计算两个点之间的直线(欧几里得)距离(单位:米,基于 WGS84 坐标)。
- 这里表示:a 和 b 节点之间的距离小于 500 米。
- 前提是两个节点的 location 属性都必须是 point 类型(即之前你设置的那种):
SET p.location = point({latitude: ..., longitude: ...})
🔹 MERGE (a)-[:NEARBY]->(b)
- 如果 a 到 b 之间还没有 NEARBY 关系,就创建一条有向边。
- MERGE 语义类似 SQL 的 UPSERT,保证不会创建重复的关系
🧠 注意:
- MERGE 是有向的,这里是 a → b,不是 b → a。
- 如果你希望两个方向都存在(双向连接),可以写成:
MERGE (a)-[:NEARBY]->(b)
MERGE (b)-[:NEARBY]->(a)
双向连接⚠️ 性能提示
这种写法可能在节点数量多时非常慢,因为:
- 它是 全图两两比较(复杂度 O(n²))。
- 建议在实际场景中加 空间索引 + 分批处理
CREATE INDEX poi_location_index FOR (p:POI) ON (p.location)
或者使用 Neo4j 的 空间范围搜索方式更高效(基于 WITH 和 apoc.spatial.*)
3、查询某个关系信息
MATCH p = ()-[:NEARBY]->()
RETURN p
LIMIT 250;
🔹 MATCH p = ()-[:NEARBY]->()
✅ 含义:
- 匹配图中所有带有 NEARBY 关系的节点对(即边)。
- () 表示任意节点(不限制标签)。
- [:NEARBY] 表示只匹配名为 NEARBY 的边(关系类型)。
- -> 表示关系方向是从左节点指向右节点。
✅ p = … 的作用:
- 把匹配到的整个路径(起点节点、关系、终点节点)赋值给变量 p。
- 这样你可以在 RETURN 中一次性返回整个路径对象