GraphFrames

GraphFrames é um pacote para Apache Spark que fornece gráficos baseados em DataFrame. Ele fornece APIs de alto nível em Java, Python e Scala. Seu objetivo é fornecer a funcionalidade do GraphX e a funcionalidade estendida que aproveita os DataFrames do Spark. Essa funcionalidade ampliada inclui localização de motivos, serialização baseada em DataFrame e consultas gráficas altamente expressivas.

Este artigo inclui dois exemplos de Notebook: um Scala tutorial Notebook e um Python guia do usuário. Para obter exemplos adicionais de uso do GraphFrames com Scala, consulte o guia do usuário do GraphFrames - Scala.

A Databricks recomenda o uso de um cluster que esteja executando o Databricks Runtime for Machine Learning, pois ele inclui uma instalação otimizada do GraphFrames.

Se o senhor não estiver usando um cluster executando o Databricks Runtime ML, download o arquivo JAR da bibliotecaGraphFrames , carregue-o em um volume e instale-o no seu cluster.

Tutorial do GraphFrames (Scala)

O seguinte Notebook mostra aos senhores como usar o GraphFrames para realizar uma análise gráfica usando o Scala.

análise gráfica com GraphFrames (Scala)

Abra o bloco de anotações em outra guia

GraphFrames Guia do usuário (Python)

O seguinte Notebook inclui exemplos de código Python de como usar o GraphFrames.

GraphFrames Python Notebook

Abra o bloco de anotações em outra guia