メインコンテンツまでスキップ

ネオ4j

important

このドキュメントは廃止されており、更新されない可能性があります。 このコンテンツに記載されている製品、サービス、またはテクノロジは、Databricks によって公式に承認またはテストされたものではありません。

Neo4j は、データの関係をファーストクラスのエンティティとして活用するネイティブグラフデータベースです。 Databricksクラスターを Neo4j クラスターに接続するには、neo4j-spark-connector Apache SparkAPIsRDDを使用して、 、 、DataFrame のGraphFrames を提供します。neo4j-spark-connectorは、バイナリBoltプロトコルを使用して、Neo4jサーバーとの間でデータを転送します。

この記事では、Neo4j をデプロイして構成する方法と、Neo4j にアクセスするように Databricks を構成する方法について説明します。

Neo4jのデプロイと構成

Neo4jは、さまざまなクラウドプロバイダーにデプロイできます。

Neo4j のパスワードをデフォルトから変更し (Neo4j に初めてアクセスするときにプロンプトが表示されます)、リモート接続を受け入れるように conf/neo4j.conf を変更します。

ini
# conf/neo4j.conf

# Bolt connector
dbms.connector.bolt.enabled=true
#dbms.connector.bolt.tls_level=OPTIONAL
dbms.connector.bolt.listen_address=0.0.0.0:7687

# HTTP Connector. There must be exactly one HTTP connector.
dbms.connector.http.enabled=true
#dbms.connector.http.listen_address=0.0.0.0:7474

# HTTPS Connector. There can be zero or one HTTPS connectors.
dbms.connector.https.enabled=true
#dbms.connector.https.listen_address=0.0.0.0:7473

詳細については、「 Neo4j コネクタの構成」を参照してください。

Databricks の構成

  1. neo4j-spark-connectorGraphFrames as Spark Packages の 2 つのライブラリをインストールします。手順については、 ライブラリ ガイドを参照してください。

  2. これらの Spark 構成でクラスターを作成します。

    Bash
    spark.neo4j.bolt.url bolt://<ip-of-neo4j-instance>:7687
    spark.neo4j.bolt.user <username>
    spark.neo4j.bolt.password <password>
  3. ライブラリをインポートし、接続をテストします。

    Scala
    import org.neo4j.spark._
    import org.graphframes._

    val neo = Neo4j(sc)

    // Dummy Cypher query to check connection
    val testConnection = neo.cypher("MATCH (n) RETURN n;").loadRdd[Long]