fs grupo de comando

Observação

Esta informação se aplica às versões 0.205 e acima do Databricks CLI, que estão em Public Preview. Para encontrar sua versão da CLI do Databricks, execute databricks -v.

O grupo de comando fs na CLI da Databricks permite que o senhor automatize volumes no Unity Catalog e automatize objetos do Databricks File System (DBFS).

Você executa fs comandos anexando-os a databricks fs. Para exibir ajuda para o comando fs , execução databricks fs -h.

fs O comando exige que os caminhos de volume comecem com dbfs:/Volumes e exige que os caminhos de diretório e arquivo no DBFS comecem com dbfs:/.

Importante

Antes de usar a CLI do Databricks, certifique-se de configurar a CLI do Databricks e configurar a autenticação para a CLI do Databricks.

Listar o conteúdo de um diretório

Para listar o conteúdo de um diretório em um volume ou no DBFS, use o comando ls. Especifique o caminho para o diretório. Os exemplos a seguir listam os nomes dos objetos encontrados na raiz do volume especificado ou no site DBFS root:

databricks fs ls dbfs:/Volumes/main/default/my-volume
databricks fs ls dbfs:/

Para exibir informações completas, incluindo tipos de objetos, tamanhos, tempos de modificação desde a época em milissegundos, bem como os nomes dos objetos, use a opção --long ou -l. Os exemplos a seguir listam as informações completas dos objetos encontrados na raiz do volume especificado ou em um diretório tmp no site DBFS root:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l
databricks fs ls dbfs:/tmp -l

Para exibir caminhos completos de objetos, use a opção --absolute. Os exemplos a seguir listam as informações completas dos objetos e os caminhos completos dos objetos, encontrados na raiz do volume especificado ou em um diretório tmp dentro do site DBFS root:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l --absolute
databricks fs ls dbfs:/tmp -l --absolute

Saída do conteúdo de um arquivo

Para gerar o conteúdo de um arquivo, use o comando cat. Especifique o caminho para o arquivo no DBFS. Os exemplos a seguir mostram o conteúdo do arquivo chamado babynames.csv encontrado na raiz do volume especificado ou em um diretório tmp no site DBFS root:

databricks fs cat dbfs:/Volumes/main/default/my-volume/babynames.csv
databricks fs cat dbfs:/tmp/babynames.csv

Os exemplos a seguir retornam erros, pois tentam gerar o conteúdo de um diretório em vez de um arquivo:

databricks fs cat dbfs:/Volumes/main/default/my-volume
databricks fs cat dbfs:/tmp

Criar um diretório

Para criar um diretório, use o comando mkdir. Especifique o caminho para o diretório a ser criado em um volume ou no DBFS. Se o diretório já existir, nada acontecerá. Os exemplos a seguir criam um diretório chamado squirrel-data na raiz do volume especificado ou em um diretório chamado tmp no site DBFS root:

databricks fs mkdir dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs mkdir dbfs:/tmp/squirrel-data

Copie um diretório ou um arquivo

Para copiar um diretório ou arquivo, use o comando cp . Especifique os caminhos para o diretório de origem ou arquivo a ser copiado e seu destino. Você pode copiar diretórios e arquivos entre o sistema de arquivos local e o DBFS e pode copiar diretórios e arquivos entre caminhos DBFS. Para substituir os arquivos existentes, use a opção --overwrite . Para copiar arquivos recursivamente em um diretório, use a opção --recursive ou -r .

O comando cp assume file:/, se file:/ for omitido.

Os exemplos a seguir copiam um diretório chamado squirrel-data e seu conteúdo, de um caminho do sistema de arquivos local para um diretório squirrels na raiz do volume especificado ou no site DBFS root.

databricks fs cp /Users/<username>/squirrel-data dbfs:/Volumes/main/default/my-volume/squirrels -r
databricks fs cp /Users/<username>/squirrel-data dbfs:/squirrels -r

O exemplo a seguir copia um arquivo chamado squirrels.csv de um caminho do sistema de arquivos local para um diretório chamado squirrel-data na raiz do volume especificado ou no site DBFS root. Se o arquivo já existir no destino, ele será substituído.

databricks fs cp /Users/<username>/squirrels.csv dbfs:/Volumes/main/default/my-volume/squirrel-data --overwrite
databricks fs cp /Users/<username>/squirrels.csv dbfs:/squirrel-data --overwrite

Remover um diretório

Para remover um diretório, use o comando rm. Especifique o caminho para o diretório existente no DBFS. Os exemplos a seguir removem um diretório chamado squirrel-data da raiz do volume especificado ou de um diretório tmp no site DBFS root:

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs rm dbfs:/tmp/squirrel-data

Se o diretório não existir, nada acontecerá e nenhum erro será retornado.

Se o diretório existir, mas não estiver vazio, será retornado um erro. Para remover um diretório não vazio e todo o seu conteúdo, use a opção --recursive ou -r. Os exemplos a seguir removem um diretório não vazio chamado squirrel-data da raiz do volume especificado ou de um diretório tmp no site DBFS root:

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data -r
databricks fs rm dbfs:/tmp/squirrel-data -r