DatabricksでGraphFramesを使用する方法
この記事には、Databricks で GraphFrames の使用を開始するのに役立つノートブックの例が含まれています。 GraphFrames は、データフレーム ベースのグラフを提供する Apache Spark のパッケージです。 Java、Python、Scala のハイレベルなAPIを提供します。これは、GraphX の機能と、Spark データフレーム を利用した拡張機能の両方を提供することを目的としています。 この拡張機能には、モチーフの検索、データフレーム ベースのシリアル化、表現力の高いグラフ クエリが含まれます。
この記事には、 Python と Scalaで使用できる入門用ノートブックと、 Python ユーザー ガイドの 3 つのノートブックの例が含まれています。 Scala での GraphFrames のその他の使用例については、GraphFrames ユーザーガイド - Scalaを参照してください。
GraphFrames の Databricks Runtime の推奨事項
Databricks機械学習ランタイムには 、最適化されたGraphFramesがインストールされているため、機械学習ランタイムを実行するクラスターを使うことをお勧めします。
クラスター実行中のDatabricks RuntimeML JARを使用していない場合は、GraphFrames ライブラリ からファイルをダウンロードしてボリューム にロードし、クラスターにインストールし ます。
GraphFrames を使ってみる
次のノートブックは、GraphFrames を使用してグラフ分析を実行する方法を示しています。
GraphFrames によるグラフ分析 (Python)
GraphFrames によるグラフ分析 (Scala)
GraphFramesユーザーガイド(Python)
次のノートブックには、GraphFrames の使用方法の Python コード例が含まれています。