Pular para o conteúdo principal

começar (DataStreamWriter)

transmite o conteúdo do DataFrame para uma fonte de dados e retorna um objeto StreamingQuery.

Sintaxe

start(path=None, format=None, outputMode=None, partitionBy=None, queryName=None, **options)

Parâmetros

Parâmetro

Tipo

Descrição

path

str, opcional

Caminho em um sistema de arquivos compatível com Hadoop.

format

str, opcional

O formato usado para salvar.

outputMode

str, opcional

Como os dados são gravados no coletor: append, complete ou update.

partitionBy

str ou lista, opcional

Nomes das colunas de particionamento.

queryName

str, opcional

Nome único para a consulta.

**options

-

Todas as outras opções de strings. Forneça checkpointLocation para a maioria das transmissões; não é necessário para uma transmissão memory .

Devoluções

StreamingQuery

Exemplos

Python
df = spark.readStream.format("rate").load()

Exemplo básico:

Python
q = df.writeStream.format('memory').queryName('this_query').start()
q.isActive
# True
q.name
# 'this_query'
q.stop()
q.isActive
# False

Com um gatilho e parâmetros adicionais:

Python
q = df.writeStream.trigger(processingTime='5 seconds').start(
queryName='that_query', outputMode="append", format='memory')
q.name
# 'that_query'
q.isActive
# True
q.stop()