GraphFrames

GraphFrames は、DataFrame ベースのグラフを提供する Apache Spark 用のパッケージです。 、 、 の高レベルAPIs JavaPythonScalaを提供します。GraphX の機能と、Spark DataFramesを活用した拡張機能の両方を提供することを目的としています。 この拡張機能には、モチーフ検索、DataFrame ベースのシリアル化、表現力の高いグラフ クエリが含まれます。

この記事には、 Python と Scalaで使用できるチュートリアル ノートブックと、 Python ユーザー ガイドの 3 つのノートブックの例が含まれています。 Scala での GraphFrames のその他の使用例については、「 GraphFrames ユーザーガイド - Scala」を参照してください。

Databricks では、GraphFrames の最適化されたインストールが含まれているため、 Databricks Runtime for Machine Learningを実行するクラスターの使用を推奨しています。

Databricks Runtime ML を実行しているクラスターを使用していない場合は、 GraphFrames ライブラリから JAR ファイルをダウンロードし、ボリュームにロードして、クラスターにインストールします

GraphFrames チュートリアル

次のノートブックは、GraphFrames を使用してグラフ分析を実行する方法を示しています。

GraphFrames によるグラフ分析 (Python)

ノートブックを新しいタブで開く

GraphFrames によるグラフ分析 (Scala)

ノートブックを新しいタブで開く

GraphFrames ユーザーガイド (Python)

次のノートブックには、GraphFrames の使用方法を示す Python コード例が含まれています。

GraphFrames Python ノートブック

ノートブックを新しいタブで開く