ワークスペースを作成する
この記事は、ワークスペースの作成と管理を行うためのオプションの概要です。
ワークスペースとは?
ワークスペースは、クラウドサービスアカウント内のDatabricksのデプロイメントです。これは、指定されたユーザーがDatabricks アセットを操作するための統合環境を提供します。
Databricks ワークスペースには、次の 2 種類があります。
-
サーバーレス ワークスペース : Databricksアカウント内のワークスペース展開。完全なサーバーレス エクスペリエンスを提供するために、サーバーレス コンピュートと確実なストレージが事前構成されています。 引き続きサーバレス ワークスペースからクラウド ストレージに接続できます。
-
クラシック ワークスペース : 既存のDatabricksストレージとコンピュート リソースをプロビジョニングする、Databricks アカウント内のワークスペース展開。 サーバレス コンピュートは従来のワークスペースでも引き続き利用できます。
ワークスペースの種類を選択する
次のセクションでは、一般的なユースケースに最適なワークスペース タイプについて説明します。これらの推奨事項は、サーバレスとクラシック ワークスペースのどちらを導入するかを決定する際に役立ちます。
サーバレス ワークスペースを選択する場合
サーバーレス ワークスペースは、ほとんどのユース ケースに最適な選択肢であり、Lakebase、 Genie 、 Databricks Appsなどの運用ユース ケースやコンシューマ ユース ケースを開始する最も簡単な方法です。
サーバレス ワークスペースは、次のユースケースに最適です。
- ビジネスユーザーがDatabricks Oneにアクセスできるようにする
- AI/BIダッシュボードの作成
- Databricks Apps作成
- ノートブックまたはSQLウェアハウスを使用した探索的アナリティクスの実行
- レイクハウスフェデレーションを介したSaaSプロバイダーへの接続 (ただし、 LakeFlow Connectではありません)
- Genie Spaces をビジネスユースケースに活用する
- ベクトル検索、モデルサービング、AI関数、エージェントブリックなどのAI機能を使用する
- サーバレスLakeFlow Spark宣言型パイプラインの作成
クラシックワークスペースを選択する場合
クラシック ワークスペースは、次のユース ケースに最適です。
- Spark RDD を使用する既存のレガシー Spark コードの移植
- ScalaまたはRを主なコーディング言語として使用する
- 時間ベースのトリガー間隔を必要とするストリーミングデータ
- LakeFlow Connectを介してオンプレミス システムまたはプライベート データベースに直接接続する
ワークスペースの作成オプション
ワークスペースを作成する方法はいくつかあります。