Azure Cosmos DB
Essa documentação foi descontinuada e pode não estar atualizada. Consulte o repositório oficial do Github do conector Cosmos DB Spark.
O Azure Cosmos DB é o banco de dados multimodelo e distribuído globalmente da Microsoft. Azure Cosmos DB permite que o senhor escale de forma elástica e independente a Taxa de transferência e o armazenamento em qualquer número de regiões geográficas do Azure. Ele oferece garantias de taxa de transferência, latência, disponibilidade e consistência com acordos de nível de serviço (SLAs) abrangentes. O Azure Cosmos DB fornece APIs para os seguintes modelos de dados, com SDKs disponíveis em vários idiomas:
- API SQL
- API do MongoDB
- API do Cassandra
- gráfico (Gremlin) API
- Tabela API
Este artigo explica como ler e gravar dados em Azure Cosmos DB usando Databricks. Para obter os detalhes mais atualizados sobre Azure Cosmos DB, consulte Acelerar a análise big data usando o conector Apache Spark para Azure Cosmos DB.
recurso:
Esse conector é compatível com a API principal (SQL) do Azure Cosmos DB. Para a API do Cosmos DB para MongoDB, use o conector MongoDB Spark. Para a API do Cosmos DB Cassandra, use o conector Cassandra Spark.
Criar e anexar a biblioteca necessária
- Faça o download da última azureversão do -cosmosdb-spark biblioteca para a versão do que o senhor Apache Spark está executando.
- Faça o upload dos arquivos de download JAR para Databricks. Ver biblioteca.
- Instale a biblioteca de upload em seu clustering Databricks.