Python使用Py2neo创建Neo4j的节点和关系

作者:流浪猫猫 时间:2023-07-20 02:51:45 

目录
  • 一、安装Py2neo

  • 二、连接Neo4j数据库

    • 1. 使用graph.run执行Cypher语句创建节点

    • 2. 使用Node数据结构创建节点

    • 3. 使用Node、Relationship和Subgraph数据结构创建节点和关系

  • 三、性能对比

    Python使用Py2neo创建Neo4j的节点和关系

    Neo4j是一款开源图数据库,使用Python语言访问Neo4j可以使用Py2neo。本文介绍了使用Py2neo访问Neo4j,批量创建节点和关系的方法。Py2neo提供了直接执行Cypher语句的方法,也提供了诸如Node、Relationship、Path一系列的数据结构,在不同的场景下可以灵活使用。

    本文使用的Py2neo是2021.1之后的版本,手册请戳这里:
    The Py2neo Handbook

    一、安装Py2neo

    使用pip安装Py2neo,执行:


    pip install py2neo

    查看已安装的Py2neo是什么版本的:


    pip show py2neo

    二、连接Neo4j数据库

    本文中会用到多种数据类型,在此一并引用

    import numpy as np
    import pandas as pd
    from py2neo import Node,Relationship,Graph,Path,Subgraph

    配置Neo4j数据库的访问地址、用户名和密码


    neo4j_url = '访问地址'
    user = '用户名'
    pwd = '密码'

    在此时间段之前访问数据库的方式为:


    graph = Graph(neo4j_url, username=user, password=pwd)

    在此时间段之后的版本访问数据库的方式为(就是这么不兼容):


    graph = Graph(neo4j_url,  auth=(user, pwd))

    1. 使用graph.run执行Cypher语句创建节点

    如果熟悉Cypher语句的话,可以通过使用graph.run执行Cypher语句来实现创建节点等操作,方法如下所示:


    cypher_ = "CREATE (:Person {name:'王王', age:35, work:'脚本之家}),\
    (:Person {name:'李李', age:20, work:'脚本之家})"
    graph.run(cypher_)

    这样就在Neo4j中创建了两个label为Person的节点,第一个节点的name属性为“王王”,age属性为35,work属性为“脚本之家”,第二个节点的name属性为“李李”,age属性为20,work属性为“宇脚本之家”。

    同样,可以通过调用graph.run执行Cypher语句创建关系。


    cypher_ = "MATCH (from:Person{name:'王王'}),\
    (to:Person{name:'李李'}) MERGE (from)-[r:同事]->(to)"
    graph.run(cypher_)

    这样在Neo4j中就有了具有同事关系的两个Person节点。

    Python使用Py2neo创建Neo4j的节点和关系

    2. 使用Node数据结构创建节点

    Py2neo也提供graph.create方法来创建节点和关系


    node = Node("Person", name="李李", age=20, work="脚本之家")
    graph.create(node)

    与执行Cypher语句的效果相同,在Neo4j中创建了一个Person节点。

    需要注意的是,这两种创建方法,如果反复执行的话,是会在Neo4j中创建出重复的节点的,即name、age、work属性完全一样,但在Neo4j中的id不一样的多个节点。

    3. 使用Node、Relationship和Subgraph数据结构创建节点和关系

    上面两种方法都是一次创建一个节点或者一个关系,Py2neo也提供了批量创建节点和关系的方法,而且性能更优。下面就以下图中的图谱为例,使用Py2neo提供Node、Relationship和Subgraph数据结构在Neo4j中创建节点和关系。

    Python使用Py2neo创建Neo4j的节点和关系

    首先创建一些label为Person的节点,即Node对象,第一个参数是label,属性按key=value依次作为参数传入。如果节点有多个label,可以用Node.add_label("label_text")来追加label。


    node1 = Node("Person", name="王王", age=35, work="脚本之家")
    node2 = Node("Person", name="李李", age=20, work="脚本之家")
    node3 = Node("Person", name="张张", age=30, work="脚本之家")
    node4 = Node("Person", name="赵赵", age=45, work="月亮中学")
    node4.add_label("Teacher")
    node5 = Node("Person", name="刘刘", age=20, work="地球电子商务公司")

    再创建一些label为Location的节点


    node6 = Node("Location", name="南京")
    node7 = Node("Location", name="江宁区")
    node8 = Node("Location", name="禄口机场")

    建立一些Person和Person节点之间的关系,Neo4j中的关系是有方向的,所以Relationship第一个参数为起始节点,第三个参数是结束节点,而第二个节点为关系的类型。这里创建的同事、邻居的关系为双向的,老师、学生的关系为单向。


    relation1 = Relationship(node1, "同事", node2)
    relation2 = Relationship(node2, "同事", node1)

    relation3 = Relationship(node2, "同事", node3)
    relation4 = Relationship(node3, "同事", node2)

    relation5 = Relationship(node3, "邻居", node4)
    relation6 = Relationship(node4, "邻居", node3)

    relation7 = Relationship(node4, "学生", node5)
    relation8 = Relationship(node5, "老师", node4)

    创建一些Location和Location节点之间的关系,地域之间的包含关系为单向。


    relation9 = Relationship(node6, "包含", node7)
    relation10 = Relationship(node7, "包含", node8)

    创建Person节点和Location节点之间的关系,这里“到访”的关系是有属性的,date表示到访的日期,stay_hours表示停留的时间。可以使用一个key:value的字典数据结构保存属性,再赋予关系


    properties1={'date':'2021-7-16','stay_hours':1}
    relation11 = Relationship(node2, "到访", node8, **properties1)

    properties2={'date':'2021-7-19','stay_hours':4}
    relation12 = Relationship(node5, "到访", node8, **properties2)

    然后将以上所有节点和关系组成Subgraph


    node_ls = [node1, node2, node3, node4,
              node5, node6, node7, node8]
    relation_ls = [relation1, relation2, relation3, relation4,
                  relation5, relation6, relation7, relation8,
                  relation9, relation10, relation11, relation12]
    subgraph = Subgraph(node_ls, relation_ls)

    最后通过事务类Transaction提交,批量创建这些节点和关系。这里tx.create并没有真正创建节点和关系,直到graph.commit才一次性提交到Neo4j进行创建。


    tx = graph.begin()
    tx.create(subgraph)
    graph.commit(tx)

    重复执行上面的命令,不会创造出重复的节点和关系。这一点手册中有说明:“subgraph中的已经和数据库绑定的实体将保持不变,那些没有绑定的将在数据库中新建并绑定上。”

    create(subgraph) Create remote nodes and relationships that correspond to those in a local subgraph. Any entities in subgraph that are already bound to remote entities will remain unchanged, those which are not will become bound to their newly-created counterparts.

    三、性能对比

    做一个简单的实验粗略地对比逐个创建和批量创建的时间开销。在Neo4j为空数据库的情况下,分别采用逐个创建和批量创建的方法创建10000个节点,每个节点有name和age两个属性,都是随机生成的,使用jupyter notebook的%%time命令计算时间开销。


    import random
    N = 10000

    逐个创建节点:


    %%time
    for i in range(N):
       random_name = "P"+str(round(random.random()*N*2))
       random_age = round(random.random()*15)
       node = Node("Person", name=random_name, age=random_age)
       graph.create(node)

    CPU times: user 50.3 s, sys: 4.19 s, total: 54.5 s
    Wall time: 5min 16s

    批量创建节点:


    %%time
    node_ls = []
    for i in range(N):
       random_name = "P"+str(round(random.random()*N*2))
       random_age = round(random.random()*15)
       node = Node("Person", name=random_name, age=random_age)
       node_ls.append(node)

    subgraph = Subgraph(node_ls, [])
    tx = graph.begin()
    tx.create(subgraph)
    graph.commit(tx)

    CPU times: user 448 ms, sys: 75.5 ms, total: 523 ms
    Wall time: 1.46 s

    实验中也发现,只是创建节点的话,批量创建方法的时间开销几乎是线性增长的,当一次性提交10万个节点的创建任务时,时间开销大约在4.5秒。
    在使用Py2neo构建图谱时,尽可能使用批量创建方法。先创建节点(Node)对象、关系(Relationship)对象,再构成子图(Subgraph),最后利用事务类一次提交创建。
    下一篇将介绍如何运用Py2neo查询节点、关系和路径。

    来源:https://segmentfault.com/a/1190000040519140

    标签:Py2neo,Neo4j
    0
    投稿

    猜你喜欢

  • mysql利用覆盖索引避免回表优化查询

    2024-01-12 21:34:11
  • 用 SA FileUp 上传多文件

    2008-07-04 13:44:00
  • Python中logging.NullHandler 的使用教程

    2023-04-18 14:03:03
  • Python NumPy教程之二元计算详解

    2023-12-16 18:25:04
  • 详谈python3 numpy-loadtxt的编码问题

    2021-08-28 06:42:09
  • Docker-Compose创建mysql容器详解

    2024-01-17 06:10:19
  • 2009年情人节网站logo欣赏

    2009-02-15 12:13:00
  • Golang中结构体映射mapstructure库深入详解

    2024-04-26 17:34:40
  • asp+XMLHTTP的国际域名查询系统(whois)源代码

    2008-02-16 09:23:00
  • 详解python3中的真值测试

    2022-03-10 13:56:59
  • CMD命令操作MSSQL2005数据库(命令整理)

    2024-01-21 11:14:49
  • debian6配置mysql允许远程连接的方法(图)

    2024-01-13 19:42:20
  • cv2.imread 和 cv2.imdecode 用法及区别

    2023-12-03 06:15:49
  • Python pywifi ERROR Open handle failed问题及解决

    2021-01-16 03:54:28
  • 浅谈vue中使用编辑器vue-quill-editor踩过的坑

    2024-04-10 13:46:00
  • 浅析Python四种数据类型

    2021-02-19 11:11:03
  • vue中自定义指令(directive)的基本使用方法

    2024-05-28 15:46:32
  • Layui表格监听行单双击事件讲解

    2024-04-19 10:45:00
  • Python中True(真)和False(假)判断详解

    2021-12-16 11:22:36
  • Python图像处理库PIL的ImageGrab模块介绍详解

    2023-11-16 18:22:11
  • asp之家 网络编程 m.aspxhome.com