Databricks Runtime 5.5 com (EoS) Conda
O suporte para essa versão do Databricks Runtime foi encerrado. Para saber a data do fim do suporte, consulte Histórico do fim do suporte. Para conhecer todas as versões compatíveis do site Databricks Runtime, consulte Databricks Runtime notas sobre as versões e a compatibilidade.
Essa versão não está mais disponível. Se o senhor quiser usar o Conda para gerenciar Python biblioteca e ambientes, use uma versão compatível do Databricks Runtime for Machine Learning.
Temos o prazer de apresentar o Databricks Runtime 5.5 com Conda (Beta), que permite que o senhor aproveite as vantagens do Conda para gerenciar Python biblioteca e ambientes. Esse tempo de execução oferece duas opções de ambiente Conda raiz na criação do cluster:
- Databricks O ambiente padrão inclui versões atualizadas de muitos pacotes populares do Python. Esse ambiente foi concebido para substituir o Notebook existente que é executado em Databricks Runtime. Este é o ambiente de tempo de execução baseado no Conda default Databricks .
- Databricks O ambiente mínimo contém um número mínimo de pacotes que são necessários para a funcionalidade do notebook PySpark e Databricks Python . Esse ambiente é ideal se o senhor quiser personalizar o tempo de execução com vários pacotes Python.
Ambos incluem suporte para Databricks biblioteca utilidades (dbutils.biblioteca) (legado).
Os sites Scala, Java e a biblioteca R em Databricks Runtime 5.5 com Conda são idênticos aos de Databricks Runtime 5.5. Para obter detalhes, consulte o site Databricks Runtime 5.5 LTS (EoS) notas sobre a versão. Para obter informações sobre como usar Databricks Runtime com Conda, consulte Conda.
Novo recurso
Uma nova biblioteca API com escopo de Notebook é fornecida para dar suporte à atualização do ambiente Conda do Notebook com uma especificação YAML (consulte a documentaçãoConda).
dbutils.library.updateCondaEnv('''envYmlContent''')
Por exemplo, para atualizar a biblioteca numpy para a versão 1.16.4, ligue para o seguinte:
dbutils.library.updateCondaEnv(
"""channels:
- default
dependencies:
- numpy=1.16.4""")
O senhor pode obter informações detalhadas sobre updateCondaEnv
usando dbutils.library.help("updateCondaEnv")
.
Melhorias
-
O pacote nos ambientes padrão e mínimo é atualizado para versões mais recentes. Consulte a biblioteca para obter a lista completa de versões do pacote. Aqui estão algumas atualizações do pacote key:
- Python atualizado para a versão 3.7.3, a partir de 3.7.0
- IPython atualizado para 7.4.0, a partir de 6.5.0
- pip atualizado para 19.0.3, de 10.0.1
-
Para melhorar o isolamento do ambiente entre o Notebook, o isolamento do processo e o ADLS passthrough estão ativados.
-
Para permitir que o senhor instale o pacote usando
conda install
sem precisar passar o sinalizador-y
, facilmente esquecido, a opção de configuraçãoalways_yes
Conda agora é definida comoTrue
no.condarc
.
Ambiente do sistema
O ambiente do sistema no Databricks Runtime 5.5 com Conda difere do Databricks Runtime 5.5 da seguinte forma:
- Python : 3.7.x. Somente o Python 3 é compatível.
biblioteca
A seguir, o arquivo environment.yml
exportado para os ambientes raiz default em Databricks Runtime 5.5 com Conda.
Padrão Databricks
name: databricks-standard
channels:
- defaults
dependencies:
- asn1crypto=0.24.0=py37_0
- backcall=0.1.0=py37_0
- blas=1.0=openblas
- boto=2.49.0=py37_0
- boto3=1.9.162=py_0
- botocore=1.12.163=py_0
- ca-certificates=2019.1.23=0
- certifi=2019.3.9=py37_0
- cffi=1.12.2=py37h2e261b9_1
- chardet=3.0.4=py37_1
- cryptography=2.6.1=py37h1ba5d50_0
- cython=0.29.6=py37he6710b0_0
- decorator=4.4.0=py37_1
- docutils=0.14=py37_0
- idna=2.8=py37_0
- ipython=7.4.0=py37h39e3cac_0
- ipython_genutils=0.2.0=py37_0
- jedi=0.13.3=py37_0
- jmespath=0.9.4=py_0
- krb5=1.16.1=h173b8e3_7
- libedit=3.1.20181209=hc058e9b_0
- libffi=3.2.1=hd88cf55_4
- libgcc-ng=8.2.0=hdf63c60_1
- libgfortran-ng=7.3.0=hdf63c60_0
- libopenblas=0.3.6=h5a2b251_0
- libpq=11.2=h20c2e04_0
- libstdcxx-ng=8.2.0=hdf63c60_1
- ncurses=6.1=he6710b0_1
- nomkl=3.0=0
- numpy=1.16.2=py37h99e49ec_0
- numpy-base=1.16.2=py37h2f8d375_0
- openssl=1.1.1b=h7b6447c_1
- pandas=0.24.2=py37he6710b0_0
- parso=0.3.4=py37_0
- patsy=0.5.1=py37_0
- pexpect=4.6.0=py37_0
- pickleshare=0.7.5=py37_0
- pip=19.0.3=py37_0
- prompt_toolkit=2.0.9=py37_0
- psycopg2=2.7.6.1=py37h1ba5d50_0
- ptyprocess=0.6.0=py37_0
- pycparser=2.19=py37_0
- pygments=2.3.1=py37_0
- pyopenssl=19.0.0=py37_0
- pysocks=1.6.8=py37_0
- python=3.7.3=h0371630_0
- python-dateutil=2.8.0=py37_0
- pytz=2018.9=py37_0
- readline=7.0=h7b6447c_5
- requests=2.21.0=py37_0
- s3transfer=0.2.0=py37_0
- scikit-learn=0.20.3=py37h22eb022_0
- scipy=1.2.1=py37he2b7bc3_0
- setuptools=40.8.0=py37_0
- six=1.12.0=py37_0
- sqlite=3.27.2=h7b6447c_0
- statsmodels=0.9.0=py37h035aef0_0
- tk=8.6.8=hbc83047_0
- traitlets=4.3.2=py37_0
- urllib3=1.24.1=py37_0
- wcwidth=0.1.7=py37_0
- wheel=0.33.1=py37_0
- xz=5.2.4=h14c3975_4
- zlib=1.2.11=h7b6447c_3
- pip:
- cycler==0.10.0
- kiwisolver==1.1.0
- matplotlib==3.0.3
- pyarrow==0.12.0
- pyparsing==2.4.0
- seaborn==0.9.0
prefix: /databricks/conda/envs/databricks-standard
Databricks Minimal
name: databricks-minimal
channels:
- defaults
dependencies:
- backcall=0.1.0=py37_0
- blas=1.0=openblas
- ca-certificates=2019.1.23=0
- certifi=2019.3.9=py37_0
- decorator=4.4.0=py37_1
- ipython=7.4.0=py37h39e3cac_0
- ipython_genutils=0.2.0=py37_0
- jedi=0.13.3=py37_0
- libedit=3.1.20181209=hc058e9b_0
- libffi=3.2.1=hd88cf55_4
- libgcc-ng=8.2.0=hdf63c60_1
- libgfortran-ng=7.3.0=hdf63c60_0
- libopenblas=0.3.6=h5a2b251_0
- libstdcxx-ng=8.2.0=hdf63c60_1
- ncurses=6.1=he6710b0_1
- nomkl=3.0=0
- numpy=1.16.2=py37h99e49ec_0
- numpy-base=1.16.2=py37h2f8d375_0
- openssl=1.1.1b=h7b6447c_1
- pandas=0.24.2=py37he6710b0_0
- parso=0.3.4=py37_0
- pexpect=4.6.0=py37_0
- pickleshare=0.7.5=py37_0
- pip=19.0.3=py37_0
- prompt_toolkit=2.0.9=py37_0
- ptyprocess=0.6.0=py37_0
- pygments=2.3.1=py37_0
- python=3.7.3=h0371630_0
- python-dateutil=2.8.0=py37_0
- pytz=2018.9=py37_0
- readline=7.0=h7b6447c_5
- setuptools=40.8.0=py37_0
- six=1.12.0=py37_0
- sqlite=3.27.2=h7b6447c_0
- tk=8.6.8=hbc83047_0
- traitlets=4.3.2=py37_0
- wcwidth=0.1.7=py37_0
- wheel=0.33.1=py37_0
- xz=5.2.4=h14c3975_4
- zlib=1.2.11=h7b6447c_3
- pip:
- pyarrow==0.12.0
prefix: /databricks/conda/envs/databricks-minimal