Pular para o conteúdo principal

fs grupo de comando

nota

Esta informação se aplica a Databricks CLI versões 0.205 e acima. A CLI do Databricks está em pré-visualização pública.

Databricks CLI O uso está sujeito à LicençaDatabricks e à Política de PrivacidadeDatabricks, incluindo qualquer disposição sobre Dados de Uso.

O grupo de comandos fs dentro do Databricks CLI permite realizar operações do sistema de arquivos em volumes no Unity Catalog e no Sistema de ArquivosDatabricks (DBFS).

fs O comando requer que os caminhos de volume comecem com “ dbfs:/Volumes ” e que os caminhos de diretório e arquivo em “ DBFS ” comecem com “ dbfs:/”.

Para realizar operações em arquivos workspace no diretório /Workspace, utilize o comando databricks workspace. Consulte o grupo de comandos “workspace”.

databricks vs cat

Produza o conteúdo de um arquivo. Especifique o caminho para o arquivo no DBFS.

databricks fs cat FILE_PATH [flags]

Argumentos

FILE_PATH

O arquivo a ser gerado

Opções

Bandeiras globais

Exemplos

Os exemplos a seguir exibem o conteúdo do arquivo chamado “ babynames.csv ” encontrado na raiz do volume especificado ou em um diretório “ tmp ” dentro do “ DBFS root”:

Bash
databricks fs cat dbfs:/Volumes/main/default/my-volume/babynames.csv
databricks fs cat dbfs:/tmp/babynames.csv

Os exemplos a seguir retornam erros, pois eles tentam gerar o conteúdo de um diretório em vez de um arquivo:

Bash
databricks fs cat dbfs:/Volumes/main/default/my-volume
databricks fs cat dbfs:/tmp

databricks fs cp

Copie um diretório ou arquivo. Especifique os caminhos para o diretório ou arquivo de origem a ser copiado e seu destino. É possível copiar diretórios e arquivos entre o sistema de arquivos local e o DBFS, bem como copiar diretórios e arquivos entre caminhos DBFS.

O comando “ cp ” assume “ file:/”, caso “ file:/ ” seja omitido.

databricks fs cp SOURCE_PATH TARGET_PATH [flags]

Argumentos

SOURCE_PATH

O diretório de origem ou o caminho do arquivo

TARGET_PATH

O diretório de destino ou o caminho do arquivo

Opções

--overwrite

Substituir arquivos existentes

-r, --recursive

Copiar recursivamente arquivos em um diretório

Bandeiras globais

Exemplos

Os exemplos a seguir copiam um diretório chamado “ squirrel-data ” e seu conteúdo, de um caminho do sistema de arquivos local para um diretório “ squirrels ” dentro da raiz do volume especificado ou em “ DBFS root”.

Bash
databricks fs cp /Users/<username>/squirrel-data dbfs:/Volumes/main/default/my-volume/squirrels -r
databricks fs cp /Users/<username>/squirrel-data dbfs:/squirrels -r

O exemplo a seguir copia um arquivo chamado squirrels.csv de um caminho do sistema de arquivos local para um diretório chamado squirrel-data dentro da raiz do volume especificado ou do DBFS root. Se o arquivo já existir no destino, ele será sobrescrito.

Bash
databricks fs cp /Users/<username>/squirrels.csv dbfs:/Volumes/main/default/my-volume/squirrel-data --overwrite
databricks fs cp /Users/<username>/squirrels.csv dbfs:/squirrel-data --overwrite

databricks fs ls

Listar o conteúdo de um diretório especificado em um volume ou no DBFS.

databricks fs ls DIR_PATH [flags]

Argumentos

DIR_PATH

O caminho do diretório

Opções

--absolute

Exibir caminhos absolutos.

--long, -l

Exibe informações completas, incluindo tamanho, tipo de arquivo e tempo de modificação desde o Epoch em milissegundos.

Bandeiras globais

Exemplos

Os exemplos a seguir listam os nomes dos objetos encontrados na raiz do volume especificado ou no diretório raiz do sistema ( DBFS root):

Bash
databricks fs ls dbfs:/Volumes/main/default/my-volume
databricks fs ls dbfs:/

Os exemplos a seguir listam as informações completas (longas) dos objetos encontrados na raiz do volume especificado ou em um diretório tmp dentro do DBFS root:

Bash
databricks fs ls dbfs:/Volumes/main/default/my-volume -l
databricks fs ls dbfs:/tmp -l

Os exemplos a seguir listam as informações completas dos objetos e os caminhos completos dos objetos encontrados na raiz do volume especificado ou em um diretório tmp dentro do diretório DBFS root:

Bash
databricks fs ls dbfs:/Volumes/main/default/my-volume -l --absolute
databricks fs ls dbfs:/tmp -l --absolute

databricks vs mkdir

Cria um diretório. Especifique o caminho para o diretório a ser criado em um volume ou no DBFS. Se o diretório já existir, nada acontece.

databricks fs mkdir DIR_PATH [flags]

Argumentos

DIR_PATH

O caminho do diretório a ser criado

Opções

Bandeiras globais

Exemplos

Os exemplos a seguir criam um diretório chamado “ squirrel-data ” na raiz do volume especificado ou em um diretório chamado “ tmp ” dentro de “ DBFS root”:

Bash
databricks fs mkdir dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs mkdir dbfs:/tmp/squirrel-data

databricks vs rm

Remove um diretório. Especifique o caminho para o diretório existente no DBFS.

Se o diretório existir, mas não estiver vazio, um erro será retornado. Se o diretório não existir, nada acontece.

databricks fs rm PATH [flags]

Argumentos

PATH

O caminho para o diretório existente no DBFS

Opções

-r, --recursive

Remova todo o conteúdo

Bandeiras globais

Exemplos

Os exemplos a seguir removem um diretório chamado “ squirrel-data ” da raiz do volume especificado ou de um diretório “ tmp ” em “ DBFS root”:

Bash
databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs rm dbfs:/tmp/squirrel-data

Os exemplos a seguir removem um diretório não vazio chamado “ squirrel-data ” da raiz do volume especificado ou de um diretório “ tmp ” em “ DBFS root”:

Bash
databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data -r
databricks fs rm dbfs:/tmp/squirrel-data -r

Bandeiras globais

--debug

Se deve habilitar o registro de depuração.

-h ou --help

Exibir ajuda para o comando Databricks CLI ou para o grupo de comandos relacionado ou para o comando relacionado.

--log-file string

Uma string que representa o arquivo no qual a saída logs deve ser gravada. Se este sinalizador não for especificado, o default deverá gravar a saída logs no stderr.

--log-format Formato

O tipo de formato do log, text ou json. O valor de default é text.

--log-level string

Uma string que representa o nível de formato do log. Se não for especificado, o nível de formato do log será desativado.

-o, --output Tipo

O tipo de saída do comando, text ou json. O valor de default é text.

-p, --profile string

O nome do perfil no arquivo ~/.databrickscfg a ser utilizado para executar o comando. Se esse sinalizador não for especificado, se existir, o perfil chamado DEFAULT será usado.

--progress-format Formato

O formato para exibir o progresso logs: default, append, inplace ou json

-t, --target string

Se aplicável, o destino do pacote a ser usado