GraphFrames
GraphFrames は、DataFrame ベースのグラフを提供する Apache Spark 用のパッケージです。 、 、 の高レベルAPIs JavaPythonScalaを提供します。GraphX の機能と、Spark DataFramesを活用した拡張機能の両方を提供することを目的としています。 この拡張機能には、モチーフ検索、DataFrame ベースのシリアル化、表現力の高いグラフ クエリが含まれます。
この記事には、 Python と Scalaで使用できるチュートリアル ノートブックと、 Python ユーザー ガイドの 3 つのノートブックの例が含まれています。 Scala での GraphFrames のその他の使用例については、「 GraphFrames ユーザーガイド - Scala」を参照してください。
Databricks では、GraphFrames の最適化されたインストールが含まれているため、 Databricks Runtime for Machine Learningを実行するクラスターの使用を推奨しています。
Databricks Runtime ML を実行しているクラスターを使用していない場合は、 GraphFrames ライブラリから JAR ファイルをダウンロードし、ボリュームにロードして、クラスターにインストールします。