Pular para o conteúdo principal

Como usar o GraphFrames no Databricks

Este artigo inclui exemplos de Notebook para ajudá-lo a começar a usar o GraphFrames em Databricks. GraphFrames é um pacote para Apache Spark que fornece gráficos baseados em DataFrame. Ele fornece APIs de alto nível em Java, Python e Scala. Seu objetivo é fornecer a funcionalidade do GraphX e a funcionalidade estendida que aproveita os DataFrames do Spark. Essa funcionalidade ampliada inclui localização de motivos, serialização baseada em DataFrame e consultas gráficas altamente expressivas.

Este artigo inclui três exemplos de Notebook: um Notebook introdutório disponível em Python e em Scala e um guia do usuário em Python. Para obter exemplos adicionais de uso do GraphFrames com Scala, consulte o guia do usuário do GraphFrames - Scala.

Databricks Runtime recomendação para GraphFrames

Databricks Recomenda-se o uso de um clustering executando Databricks Runtime for Machine Learning, pois ele inclui uma instalação otimizada de GraphFrames.

Se o senhor não estiver usando um cluster que esteja executando Databricks Runtime ML, download o arquivo JAR da bibliotecaGraphFrames, carregue-o em um volume e instale-o no cluster.

Obter começar com GraphFrames

O Notebook a seguir mostra como usar o site GraphFrames para realizar análises gráficas.

análise gráfica com GraphFrames (Python)

Abrir notebook em uma nova aba

análise gráfica com GraphFrames (Scala)

Abrir notebook em uma nova aba

GraphFrames Guia do usuário ( )Python

O Notebook a seguir inclui exemplos de código Python de como usar o GraphFrames.

GraphFrames Python Caderno de anotações

Abrir notebook em uma nova aba