DatabricksでGraphFramesを使用する方法
この記事には、Databricks で GraphFrames の使用を開始するのに役立つノートブックの例が含まれています。 GraphFrames は、DataFrame ベースのグラフを提供する Apache Spark のパッケージです。 Java、Python、ScalaのハイレベルなAPIを提供します。これは、GraphX の機能と、Spark DataFrames を利用した拡張機能の両方を提供することを目的としています。 この拡張機能には、モチーフの検索、DataFrame ベースのシリアル化、表現力の高いグラフ クエリが含まれます。
この記事には、 Python と Scalaで使用できる入門用ノートブックと、 Python ユーザー ガイドの 3 つのノートブックの例が含まれています。 Scala での GraphFrames のその他の使用例については、GraphFrames ユーザーガイド - Scalaを参照してください。
GraphFramesにおけるDatabricks Runtime の推奨事項
Databricks では、GraphFrames の最適化されたインストールが含まれているため、 Databricks Runtime for Machine Learning を実行するクラスターを使用することをお勧めします。
Databricks Runtime ML を実行しているクラスターを使用していない場合は、 GraphFrames ライブラリから JAR ファイルをダウンロードし、ボリュームにロードして、クラスターにインストールします。