começar (DataStreamWriter)
transmite o conteúdo do DataFrame para uma fonte de dados e retorna um objeto StreamingQuery.
Sintaxe
start(path=None, format=None, outputMode=None, partitionBy=None, queryName=None, **options)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
| str, opcional | Caminho em um sistema de arquivos compatível com Hadoop. |
| str, opcional | O formato usado para salvar. |
| str, opcional | Como os dados são gravados no coletor: |
| str ou lista, opcional | Nomes das colunas de particionamento. |
| str, opcional | Nome único para a consulta. |
| - | Todas as outras opções de strings. Forneça |
Devoluções
StreamingQuery
Exemplos
Python
df = spark.readStream.format("rate").load()
Exemplo básico:
Python
q = df.writeStream.format('memory').queryName('this_query').start()
q.isActive
# True
q.name
# 'this_query'
q.stop()
q.isActive
# False
Com um gatilho e parâmetros adicionais:
Python
q = df.writeStream.trigger(processingTime='5 seconds').start(
queryName='that_query', outputMode="append", format='memory')
q.name
# 'that_query'
q.isActive
# True
q.stop()