ネオ4j
important
このドキュメントは廃止されており、更新されない可能性があります。 このコンテンツに記載されている製品、サービス、またはテクノロジは、Databricks によって公式に承認またはテストされたものではありません。
Neo4j は、データの関係をファーストクラスのエンティティとして活用するネイティブグラフデータベースです。 Databricksクラスターを Neo4j クラスターに接続するには、neo4j-spark-connector Apache SparkAPIsRDDを使用して、 、 、DataFrame のGraphFrames を提供します。neo4j-spark-connectorは、バイナリBoltプロトコルを使用して、Neo4jサーバーとの間でデータを転送します。
この記事では、Neo4j をデプロイして構成する方法と、Neo4j にアクセスするように Databricks を構成する方法について説明します。
Neo4jのデプロイと構成
Neo4jは、さまざまなクラウドプロバイダーにデプロイできます。
Neo4j のパスワードをデフォルトから変更し (Neo4j に初めてアクセスするときにプロンプトが表示されます)、リモート接続を受け入れるように conf/neo4j.conf
を変更します。
ini
# conf/neo4j.conf
# Bolt connector
dbms.connector.bolt.enabled=true
#dbms.connector.bolt.tls_level=OPTIONAL
dbms.connector.bolt.listen_address=0.0.0.0:7687
# HTTP Connector. There must be exactly one HTTP connector.
dbms.connector.http.enabled=true
#dbms.connector.http.listen_address=0.0.0.0:7474
# HTTPS Connector. There can be zero or one HTTPS connectors.
dbms.connector.https.enabled=true
#dbms.connector.https.listen_address=0.0.0.0:7473
詳細については、「 Neo4j コネクタの構成」を参照してください。
Databricks の構成
-
neo4j-spark-connector と GraphFrames as Spark Packages の 2 つのライブラリをインストールします。手順については、 ライブラリ ガイドを参照してください。
-
これらの Spark 構成でクラスターを作成します。
Bashspark.neo4j.bolt.url bolt://<ip-of-neo4j-instance>:7687
spark.neo4j.bolt.user <username>
spark.neo4j.bolt.password <password> -
ライブラリをインポートし、接続をテストします。
Scalaimport org.neo4j.spark._
import org.graphframes._
val neo = Neo4j(sc)
// Dummy Cypher query to check connection
val testConnection = neo.cypher("MATCH (n) RETURN n;").loadRdd[Long]