ワークスペースを手動で作成する (既存の Databricks アカウント)
これらの手順は、2023 年 11 月 8 日より前に作成されたアカウントに適用されます。Databricks アカウントが 2023 年 11 月 8 日より後に作成された場合は、「 カスタム AWS 構成でワークスペースを作成する」を参照してください。
この記事では、アカウントコンソールとカスタムAWS構成を使用してワークスペースを作成する方法について説明します。独自のAWSリソースを作成する場合、または独自のVPCにワークスペースをデプロイする必要がある場合は、このプロセスを使用できます。
AWS クイック スタート テンプレート、アカウント API、または Terraformを使用してワークスペースを作成することもできます。
始める前に
カスタムAWS構成を使用してワークスペースをデプロイする前に、次のことを行う必要があります。
- クロスアカウント IAMロールを作成し、資格情報の設定を Databricksに追加します。
- ルートストレージ用の S3 バケットを作成します。
- まだお持ちでない場合は、ワークスペースを作成するリージョンに Unity Catalog メタストアを作成します 。
- (オプション)独自の AWS VPC (仮想プライベートクラウド) にワークスペースをデプロイする予定の場合は 、ネットワーク設定を追加します 。 VPCの設定手順については、顧客管理VPCを参照してください。
カスタム AWS 設定を使用してワークスペースを作成する
-
アカウントコンソールに移動し、[ ワークスペース ]アイコンをクリックします。
-
「 ワークスペースを作成 」をクリックし、次に「 カスタムAWS構成 」をクリックします。
-
[ ワークスペース名 ]フィールドに、人間にとってわかりやすい名称で、このワークスペースの名前を入力します。ここには、スペースを含めることもできます。
-
[ワークスペース URL ] フィールドに、デプロイ名を入力します (オプション)。このフィールドは、一部の顧客に対して非表示になっている場合があります。 デプロイメント名に関する考慮事項を参照してください。
-
「 サブスクリプションプラン 」フィールドで、このワークスペースに関連付けるプランを選択します。アカウントによっては、選択肢が1つしかない場合もあります。
-
「 リージョン 」フィールドで、ワークスペースのネットワークとクラスターのAWSリージョンを選択します。
-
[資格情報の構成 ] フィールドで、このワークスペースに構成した資格情報の構成を選択します。
-
[ストレージ構成 ] フィールドで、このワークスペースのルート ストレージに構成したストレージ構成を選択します。
-
Databricks では、ワークスペースの Unity Catalog を有効にすることをお勧めします。 [ Unity Catalogを有効にする ] トグルをオンにした後、割り当てられたメタストアを受け入れるか、 [メタストア ] ドロップダウンから 1 つを選択します。
Unity Catalogメタストアがワークスペース リージョンに既に存在し、メタストアが新しいワークスペースに自動的に割り当てられるように構成されている場合は、そのメタストアが選択されます。リージョンに複数のメタストアが定義されている場合 (早期導入者ワークスペースのみ)、いずれか 1 つを選択できます。
-
(オプション)独自の VPC にワークスペースを作成するには、 ネットワーク設定 を選択または追加します。 独自のVPCを設定する手順については、顧客管理VPCを参照してください。
顧客管理VPCを使用している場合は、 IAMロールが 顧客管理VPC をサポートする access ポリシーを使用していることを確認してください。
-
(オプション)PrivateLink を有効にするには、 Private Link でプライベート アクセス設定 を選択または追加します。
PrivateLink を有効にするには、正しいリージョン VPC エンドポイントを作成し、登録し、ネットワーク設定から参照している必要もあります。 詳細については、「 AWS PrivateLink を使用してプライベート接続を有効にする」を参照してください。
-
作成 をクリックします。
ワークスペースの状態を表示する
ワークスペースを作成した後、 「ワークスペース」 ページでそのステータスを確認できます。
- プロビジョニング :進行中です。数分待ってからページを更新してください。
- 実行中 :ワークスペースの展開が成功しました。
- 失敗 :デプロイに失敗しました。
- 禁止: Databricks アカウント チームにお問い合わせください。
- キャンセル中 :キャンセル中です。
新しいワークスペースのステータスが [失敗] の場合は、ワークスペースをクリックして詳細なエラー メッセージを表示します。 構成を更新して、ワークスペースのデプロイを再試行できます。 ワークスペースの作成に関するトラブルシューティングを参照してください。
ワークスペースにログインします
- アカウントコンソールに移動し、[ ワークスペース ]アイコンをクリックします。
- ワークスペースのある行で、「 開く 」をクリックします。
- ワークスペース管理者としてログインするには、アカウントオーナーまたはアカウント管理者のEメールアドレスでログインしてください。
シングルサインオン(SSO)を設定した場合は、[ シングルサインオン ]ボタンをクリックします。
デプロイの命名に関する考慮事項
デプロイメント名は、ワークスペースのサブドメインの一部を定義します。Databricks WebアプリケーションおよびREST APIにアクセスするためのワークスペース URLは<workspace-deployment-name>.cloud.databricks.com
です。
たとえば、デプロイメント名がabcsales
の場合、ワークスペースURLはhttps://abcsales.cloud.databricks.com
になります。ハイフンは許可されます。このプロパティは、サブドメインで許可されている文字セットのみをサポートします。値は、削除されたワークスペースを除くすべてのAWSリージョンのワークスペースで一意である必要があります。
このフィールドを空白のままにすると、サーバーはdbc-xxxxxxxx-xxxx
パターンを使用して固有のデプロイメント名を生成します。
一部の Databricks アカウントには、この機能と対話するデプロイ名のプレフィックスがあります。 Databricks アカウント チームに連絡して、アカウントのデプロイ名のプレフィックスを設定します。 アカウントにデプロイメント名のプレフィックスがある場合、最終的なワークスペースのデプロイメント名には、アカウントのプレフィックスとそれに続くハイフンが含まれます。 たとえば、アカウントのデプロイメントプレフィックスが acme
で、デプロイメント名を workspace-1
と入力すると、新しいワークスペースのデプロイメント名は acme-workspace-1
になります。 最終的なワークスペース URL は acme-workspace-1.cloud.databricks.com
です。
デプロイ名は、Databricksの利用規約に準拠している必要があります。
次のステップ
ワークスペースをデプロイしたので、データ戦略の構築を開始できます。 Databricks では、次の記事をお勧めします。
- ユーザー、グループ、サービスプリンシパルをワークスペースに追加します。 ユーザー、サービスプリンシパル、およびグループを管理します。
- Databricksのデータガバナンスと権限についてご確認ください。「Unity Catalog とは」を参照してください。
- Databricksワークスペースを外部データソースに接続します。「データソースへの接続」を参照してください。
- ワークスペースにデータを取り込みます。 「Databricks レイクハウスへのデータの取り込み」を参照してください。
- ノートブック、コンピュート、ダッシュボード、クエリなどのワークスペース オブジェクトへのアクセスの管理について学習します。 アクセス制御リストを参照してください。