Pular para o conteúdo principal

JDBC (DataFrameReader)

Constrói um DataFrame representando a tabela do banco de dados acessível via URL JDBC url. As partições da tabela são recuperadas em paralelo se column ou predicates for especificado. Se ambos column e predicates forem especificados, column terá precedência.

Sintaxe

jdbc(url, table, column=None, lowerBound=None, upperBound=None,
numPartitions=None, predicates=None, properties=None)

Parâmetros

Parâmetro

Tipo

Descrição

url

str

A URL JDBC no formato jdbc:subprotocol:subname.

table

str

O nome da tabela no banco de dados externo.

column

str, opcional

A coluna a ser usada para particionamento (alias para a opção partitionColumn ). Requer lowerBound, upperBound e numPartitions.

lowerBound

int ou str, opcional

O valor mínimo de column para particionamento. Obrigatório quando column for especificado.

upperBound

int ou str, opcional

O valor máximo de column para particionamento. Obrigatório quando column for especificado.

numPartitions

int, opcional

O número de partições. Obrigatório quando column for especificado.

predicates

lista, opcional

Uma lista de expressões da cláusula WHERE, cada uma definindo uma partição de DataFrame. Ignorado se column for especificado.

properties

dicionário, opcional

Argumentos de conexão JDBC, normalmente incluindo 'user' e 'password'. Por exemplo, {'user': 'SYSTEM', 'password': 'mypassword'}.

Devoluções

DataFrame

Notas

Evite criar muitas partições em paralelo em um cluster grande, pois isso pode causar falhas em sistemas de banco de dados externos.