ワークスペースを手動で作成する (既存の Databricks アカウント)
注:
これらの手順は、2023 年 11 月 8 日より前に作成されたアカウントに適用されます。 Databricksが 2023 年 11 月 8 日以降に作成された場合は、 「ワークスペース (新しいDatabricks ) を手動で作成する」を参照してください。
この記事では、アカウントコンソールとカスタムAWS構成を使用してワークスペースを作成する方法について説明します。独自のAWSリソースを作成する場合、または独自のVPCにワークスペースをデプロイする必要がある場合は、このプロセスを使用できます。
AWS Quick Startテンプレート、アカウントAPI、Terraformを使用してワークスペースを作成することもできます。
始める前に
カスタムAWS構成を使用してワークスペースをデプロイする前に、次のことを行う必要があります。
まだない場合は、ワークスペースを作成するリージョンにUnity Catalog メタストアを作成します。
(オプション)独自のAWS VPC(仮想プライベートクラウド)にワークスペースをデプロイする場合は、ネットワーク設定を追加します。VPCの設定手順については、「顧客管理VPC」を参照してください。
カスタムAWS構成を使用してワークスペースを作成する
アカウント コンソールに移動し、ワークスペースアイコンをクリックします。
「ワークスペースを作成」をクリックし、次に「 カスタムAWS構成」をクリックします。
[ワークスペース名]フィールドに、人間にとってわかりやすい名称で、このワークスペースの名前を入力します。ここには、スペースを含めることもできます。
[ワークスペース URL]フィールドに、デプロイメント名を入力します (オプション)。 このフィールドは一部の顧客に対して非表示になっている場合があります。 「デプロイ名に関する考慮事項」を参照してください。
「サブスクリプションプラン」フィールドで、このワークスペースに関連付けるプランを選択します。アカウントによっては、選択肢が1つしかない場合もあります。
「リージョン」フィールドで、ワークスペースのネットワークとクラスターのAWSリージョンを選択します。
「資格情報の設定」フィールドで、このワークスペース用に設定した資格情報の設定を選択します。
[ストレージ設定]フィールドで、このワークスペースのルートストレージ用に設定したストレージ設定を選択します。
Databricks では、ワークスペースの Unity Catalog を有効にすることをお勧めします。 [Unity Catalogを有効にする] トグルをオンにした後、割り当てられたメタストアを受け入れるか、 [メタストア] ドロップダウンから 1 つを選択します。
Unity Catalogメタストアがワークスペース リージョンに既に存在し、メタストアが新しいワークスペースに自動的に割り当てられるように構成されている場合は、そのメタストアが選択されます。リージョンに複数のメタストアが定義されている場合 (早期導入者ワークスペースのみ)、いずれか 1 つを選択できます。
(オプション)独自のVPCにワークスペースを作成するには、ネットワーク設定を選択または追加します。独自のVPCを設定する手順については、 「顧客管理VPC」を参照してください。
重要
顧客管理 VPC を使用している場合は、IAM ロールが顧客管理 VPC をサポートするアクセス ポリシーを使用していることを確認してください。
(オプション)PrivateLink を有効にするには、 [ Private Link ] で プライベート アクセス設定 を選択または追加します。
PrivateLink を有効にするには、正しいリージョン VPC エンドポイントを作成し、登録して、ネットワーク構成から参照する必要があります。 詳細なガイダンスについては、 「AWS PrivateLink を使用してプライベート接続を有効にする」を参照してください。
[作成]をクリックします。
ワークスペースのステータスを表示する
ワークスペースを作成した後、「ワークスペース」ページでそのステータスを確認できます。
プロビジョニング:進行中です。数分待ってからページを更新してください。
実行中:ワークスペースの展開が成功しました。
失敗:デプロイに失敗しました。
禁止: Databricks アカウント チームにお問い合わせください。
キャンセル中:キャンセル中です。
新しいワークスペースのステータスが「失敗」の場合は、ワークスペースをクリックして詳細なエラーメッセージを表示します。設定を更新して、ワークスペースのデプロイを再度試みることができます。「ワークスペース作成のトラブルシューティング」を参照してください。
ワークスペースにログインする
アカウント コンソールに移動し、ワークスペースアイコンをクリックします。
ワークスペースのある行で、「開く」をクリックします。
ワークスペース管理者としてログインするには、アカウント所有者またはアカウント管理者の E メール アドレスでログインします。
シングル サインオン ( SSO ) を構成した場合は、[シングル サインオン]ボタンをクリックします。
デプロイメントの名前付けに関する考慮事項
デプロイメント名は、ワークスペースのサブドメインの一部を定義します。Databricks WebアプリケーションおよびREST APIにアクセスするためのワークスペース URLは<workspace-deployment-name>.cloud.databricks.com
です。
たとえば、デプロイメント名がabcsales
の場合、ワークスペースURLはhttps://abcsales.cloud.databricks.com
になります。ハイフンは許可されます。このプロパティは、サブドメインで許可されている文字セットのみをサポートします。値は、削除されたワークスペースを除くすべてのAWSリージョンのワークスペースで一意である必要があります。
このフィールドを空白のままにすると、サーバーはdbc-xxxxxxxx-xxxx
パターンを使用して固有のデプロイメント名を生成します。
一部の Databricks アカウントには、この機能と連携するデプロイメント名プレフィックスがあります。 アカウントのデプロイメント名プレフィックスを設定するには、Databricks アカウント チームにお問い合わせください。 アカウントにデプロイメント名プレフィックスがある場合、最終的なワークスペース デプロイメント名には、アカウント プレフィックスとそれに続くハイフンが含まれます。 たとえば、アカウントのデプロイメント プレフィックスがacme
で、デプロイメント名をworkspace-1
と入力した場合、新しいワークスペースのデプロイメント名はacme-workspace-1
になります。 最終的なワークスペース URL はacme-workspace-1.cloud.databricks.com
です。
デプロイ名は、Databricksの利用規約に準拠している必要があります。
次のステップ
ワークスペースをデプロイしたので、データ戦略の構築を開始できます。 Databricks では以下の記事を推奨しています。
ユーザー、グループ、サービス プリンシパルをワークスペースに追加します。 ユーザー、サービス、グループを管理します。
Databricksのデータガバナンスと権限について学びます。 「Unity Catalog とは何ですか?」を参照してください。
Databricksワークスペースを外部データソースに接続します。 「情報ソースへの接続」を参照してください。
データをワークスペースに取り込みます。 「Databricks レイクハウスへのデータの取り込み」を参照してください。
ワークスペース オブジェクト (データベース、コンピュート、ダッシュボード、クエリなど) へのアクセスの管理について学習します。 アクセス制御リストを参照してください。