ワークスペースを手動で作成する (既存の Databricks アカウント)

注:

これらの手順は、2023 年 11 月 8 日より前に作成されたアカウントに適用されます。 Databricksが 2023 年 11 月 8 日以降に作成された場合は、 「ワークスペース (新しいDatabricks ) を手動で作成する」を参照してください。

この記事では、アカウントコンソールとカスタムAWS構成を使用してワークスペースを作成する方法について説明します。独自のAWSリソースを作成する場合、または独自のVPCにワークスペースをデプロイする必要がある場合は、このプロセスを使用できます。

AWS Quick StartテンプレートアカウントAPITerraformを使用してワークスペースを作成することもできます。

始める前に

カスタムAWS構成を使用してワークスペースをデプロイする前に、次のことを行う必要があります。

カスタムAWS構成を使用してワークスペースを作成する

  1. アカウント コンソールに移動し、ワークスペースアイコンをクリックします。

  2. ワークスペースを作成」をクリックし、次に「 カスタムAWS構成」をクリックします。

  3. ワークスペース名]フィールドに、人間にとってわかりやすい名称で、このワークスペースの名前を入力します。ここには、スペースを含めることもできます。

  4. [ワークスペース URL]フィールドに、デプロイメント名を入力します (オプション)。 このフィールドは一部の顧客に対して非表示になっている場合があります。 「デプロイ名に関する考慮事項」を参照してください。

  5. サブスクリプションプラン」フィールドで、このワークスペースに関連付けるプランを選択します。アカウントによっては、選択肢が1つしかない場合もあります。

  6. リージョン」フィールドで、ワークスペースのネットワークとクラスターのAWSリージョンを選択します。

  7. 資格情報の設定」フィールドで、このワークスペース用に設定した資格情報の設定を選択します。

  8. ストレージ設定]フィールドで、このワークスペースのルートストレージ用に設定したストレージ設定を選択します。

  9. Databricksでは、ワークスペース用にUnity Catalogを有効化することを推奨しています。[Unity Catalogを有効化]をオンにしたら、[メタストア]ドロップダウンからメタストアを選択します。

  10. (オプション)独自のVPCにワークスペースを作成するには、ネットワーク設定を選択または追加します。独自のVPCを設定する手順については、 「顧客管理VPC」を参照してください。

    重要

    顧客管理 VPC を使用している場合は、IAM ロールが顧客管理 VPC をサポートするアクセス ポリシーを使用していることを確認してください。

  11. (オプション)PrivateLink を有効にするには、 [ Private Link ] で プライベート アクセス設定 を選択または追加します。

    PrivateLinkを有効にするには、正しいリージョンVPCエンドポイントを作成し、登録し、ネットワーク構成から参照する必要があります。詳細については、「AWS PrivateLinkを有効にする」を参照してください。

  12. [作成]をクリックします。

ワークスペースのステータスを表示する

ワークスペースを作成した後、「ワークスペース」ページでそのステータスを確認できます。

  • プロビジョニング:進行中です。数分待ってからページを更新してください。

  • 実行中:ワークスペースの展開が成功しました。

  • 失敗:デプロイに失敗しました。

  • 禁止: Databricks アカウント チームにお問い合わせください。

  • キャンセル中:キャンセル中です。

新しいワークスペースのステータスが「失敗」の場合は、ワークスペースをクリックして詳細なエラーメッセージを表示します。設定を更新して、ワークスペースのデプロイを再度試みることができます。「ワークスペース作成のトラブルシューティング」を参照してください。

ワークスペースにログインする

  1. アカウント コンソールに移動し、ワークスペースアイコンをクリックします。

  2. ワークスペースのある行で、「開く」をクリックします。

  3. ワークスペース管理者としてログインするには、アカウント所有者またはアカウント管理者の電子メール アドレスとパスワードを使用してログインします。

シングル サインオン ( SSO )を構成した場合は、[シングル サインオン]ボタンをクリックします。

デプロイメントの名前付けに関する考慮事項

デプロイメント名は、ワークスペースのサブドメインの一部を定義します。Databricks WebアプリケーションおよびREST APIにアクセスするためのワークスペース URLは<workspace-deployment-name>.cloud.databricks.comです。

たとえば、デプロイメント名がabcsalesの場合、ワークスペースURLはhttps://abcsales.cloud.databricks.comになります。ハイフンは許可されます。このプロパティは、サブドメインで許可されている文字セットのみをサポートします。値は、削除されたワークスペースを除くすべてのAWSリージョンのワークスペースで一意である必要があります。

このフィールドを空白のままにすると、サーバーはdbc-xxxxxxxx-xxxxパターンを使用して固有のデプロイメント名を生成します。

一部の Databricks アカウントには、この機能と連携するデプロイメント名プレフィックスがあります。 アカウントのデプロイメント名プレフィックスを設定するには、Databricks アカウント チームにお問い合わせください。 アカウントにデプロイメント名プレフィックスがある場合、最終的なワークスペース デプロイメント名には、アカウント プレフィックスとそれに続くハイフンが含まれます。 たとえば、アカウントのデプロイメント プレフィックスがacmeで、デプロイメント名をworkspace-1と入力した場合、新しいワークスペースのデプロイメント名はacme-workspace-1になります。 最終的なワークスペース URL はacme-workspace-1.cloud.databricks.comです。

デプロイ名は、Databricksの利用規約に準拠している必要があります。

次のステップ

ワークスペースをデプロイしたので、データ戦略の構築を開始できます。 Databricks では以下の記事を推奨しています。