GraphFrames

GraphFrames は、DataFrame ベースのグラフを提供する Apache Spark 用のパッケージです。 、 、 の高レベルAPIs JavaPythonScalaを提供します。GraphX の機能と、Spark DataFramesを活用した拡張機能の両方を提供することを目的としています。 この拡張機能には、モチーフ検索、DataFrame ベースのシリアル化、表現力の高いグラフ クエリが含まれます。

この記事には、 Scalaチュートリアル とPythonユーザー ガイドの 2 つのサンプル チュートリアルが含まれています。 Scala で GraphFrames を使用する追加の例については、 「GraphFrames ユーザー ガイド - Scala」を参照してください。

Databricks では、GraphFrames の最適化されたインストールが含まれているため、 Databricks Runtime for Machine Learningを実行するクラスターの使用を推奨しています。

Databricks Runtime ML を実行しているクラスターを使用していない場合は、 GraphFrames ライブラリから JAR ファイルをダウンロードし、ボリュームにロードして、クラスターにインストールします

GraphFrames チュートリアル (Scala)

次のノートブックでは、GraphFrames を使用して Scala でグラフ分析を実行する方法を示します。

GraphFrames によるグラフ分析 (Scala)

ノートブックを新しいタブで開く

GraphFrames ユーザーガイド (Python)

次のノートブックには、GraphFrames の使用方法を示す Python コード例が含まれています。

GraphFrames Python ノートブック

ノートブックを新しいタブで開く