DatabricksでGraphFramesを使用する方法

この記事には、Databricks で GraphFrames の使用を開始するのに役立つノートブックの例が含まれています。 GraphFrames は、DataFrame ベースのグラフを提供する Apache Spark のパッケージです。 Java、Python、ScalaのハイレベルなAPIを提供します。これは、GraphX の機能と、Spark DataFrames を利用した拡張機能の両方を提供することを目的としています。 この拡張機能には、モチーフの検索、DataFrame ベースのシリアル化、表現力の高いグラフ クエリが含まれます。

この記事には、 Python と Scalaで使用できる入門用ノートブックと、 Python ユーザー ガイドの 3 つのノートブックの例が含まれています。 Scala での GraphFrames のその他の使用例については、GraphFrames ユーザーガイド - Scalaを参照してください。

GraphFramesにおけるDatabricks Runtime の推奨事項

Databricks では、GraphFrames の最適化されたインストールが含まれているため、 Databricks Runtime for Machine Learning を実行するクラスターを使用することをお勧めします。

Databricks Runtime ML を実行しているクラスターを使用していない場合は、 GraphFrames ライブラリから JAR ファイルをダウンロードし、ボリュームにロードして、クラスターにインストールします

GraphFramesを使ってみる

次のノートブックは、GraphFrames を使用してグラフ分析を実行する方法を示しています。

GraphFrames によるグラフ分析 (Python)

ノートブックを新しいタブで開く

GraphFrames によるグラフ分析 (Scala)

ノートブックを新しいタブで開く

GraphFrames ユーザーガイド (Python)

次のノートブックには、GraphFrames の使用方法を示す Python コード例が含まれています。

GraphFrames Python ノートブック

ノートブックを新しいタブで開く