Pular para o conteúdo principal

Como usar o GraphFrames no Databricks

Este artigo inclui exemplos de Notebook para ajudá-lo a começar a usar o GraphFrames em Databricks. GraphFrames é um pacote para Apache Spark que fornece gráficos baseados em DataFrame. Ele fornece APIs de alto nível em Java, Python e Scala. Seu objetivo é fornecer a funcionalidade do GraphX e a funcionalidade estendida que aproveita os DataFrames do Spark. Essa funcionalidade ampliada inclui localização de motivos, serialização baseada em DataFrame e consultas gráficas altamente expressivas.

Este artigo inclui três exemplos de Notebook: um Notebook introdutório disponível em Python e em Scala e um guia do usuário em Python. Para obter exemplos adicionais de uso do GraphFrames com Scala, consulte o guia do usuário do GraphFrames - Scala.

Databricks Runtime recomendação para GraphFrames

Databricks Recomenda-se o uso de um clustering executando Databricks Runtime for Machine Learning, pois ele inclui uma instalação otimizada de GraphFrames.

Se o senhor não estiver usando um cluster que esteja executando Databricks Runtime ML, download o arquivo JAR da bibliotecaGraphFrames, carregue-o em um volume e instale-o no cluster.

Obter começar com GraphFrames

O Notebook a seguir mostra como usar o site GraphFrames para realizar análises gráficas.

análise gráfica com GraphFrames (Python)

Open notebook in new tab

análise gráfica com GraphFrames (Scala)

Open notebook in new tab

GraphFrames Guia do usuário ( )Python

O Notebook a seguir inclui exemplos de código Python de como usar o GraphFrames.

GraphFrames Python Caderno de anotações

Open notebook in new tab