ワークスペースを作成する
この記事は、ワークスペースの作成と管理を行うためのオプションの概要です。
ワークスペースとは?
ワークスペースは、クラウドサービスアカウント内のDatabricksのデプロイメントです。これは、指定されたユーザーがDatabricks アセットを操作するための統合環境を提供します。
Databricks ワークスペースには、次の 2 種類があります。
- サーバレス ワークスペース (パブリック プレビュー): サーバレス コンピュートとデフォルト ストレージが事前に設定された、完全なサーバレス エクスペリエンスを提供するために、 Databricks アカウントのワークスペース展開。 クラウドストレージに接続できます。
- 従来のワークスペース : A ワークスペース デプロイ あなたの Databricks アカウント その プロビジョニング ストレージ と コンピュート リソース 既存のクラウド アカウント。 サーバレス コンピュートは、従来のワークスペースでも引き続き使用できます。
注記
サーバレス ワークスペースは パブリックプレビュー段階です。
ワークスペースの種類の選択
次のセクションでは、一般的なユースケースに最適なワークスペースタイプについて説明します。これらの推奨事項を使用して、サーバレスと従来のワークスペースのどちらを展開するかを決定します。
サーバレス ワークスペースを選択する場合
サーバレス ワークスペースは、次のユースケースに最適です。
- ビジネス ユーザーが Databricks One にアクセスできるようにする
- AI/BI ダッシュボードの作成
- Databricks アプリを作成する
- ノートブックまたは SQLウェアハウスを使用して探索的なアナリティクスを実行する
- レイクハウスフェデレーション経由で SaaS プロバイダーに接続する(ただし、 LakeFlow Connectはできません)
- Genie Spacesをビジネスユースケースに使用する
- 本番運用に移行する前に、新しい Mosaic AI 機能をテストする
- サーバレス LakeFlow Declarative パイプラインの作成
従来のワークスペースを選択する場合
従来のワークスペースは、次のユースケースに最適です。
- GPUを必要とするAIまたはML開発作業を行う
- Databricks Runtime for Machine Learning または Apache Spark MLib を使用する
- Spark RDD を使用する既存のレガシ Spark コードを移植する
- Scala または R を主要なコーディング言語として使用する
- デフォルトまたは時間ベースのトリガー間隔を必要とするストリームデータ
- PrivateLink 接続経由で Databricks APIs に接続する
- LakeFlow Connectを介してオンプレミスシステムまたはプライベートデータベースに直接接続します
ワークスペースの作成オプション
ワークスペースは、 Databricks アカウントコンソール、アカウント API、または Terraformからデプロイできます。 次のページを使用して、ワークスペースをデプロイします。