クラシックワークスペースを作成する
この記事では、アカウント コンソールで自動構成を使用してクラシック ワークスペースを作成する方法について説明します。Databricks 、一般的な構成エラーを防ぎ、 AWS管理者権限が必要なユーザー向けに承認ワークフローが組み込まれているため、ほとんどのワークスペース展開で自動構成を使用することをお勧めします。
自動設定を使用すると、お客様またはAWS管理者は、必要なIAMロール、 S3バケット、およびAWSアカウントのポリシーへのプロビジョニングへの一時的なアクセスをDatabricksに付与します。 この自動化により、ワークスペースをデプロイするための顧客管理VPCも作成され、サブネット、セキュリティ グループ、およびルーティング テーブルが含まれます。
代わりにこれらのリソースを手動でプロビジョニングおよび構成する場合は、 「手動の AWS 構成でワークスペースを作成する」を参照してください。
要件
自動構成を使用してクラシック ワークスペースを作成するには:
- Databricks アカウントのアカウント管理者である必要があります。
- AWS アカウントには、利用可能な VPC や NAT ゲートウェイなど、ワークスペースリージョン内に利用可能なリソースが必要です。AWSサービス クォータ コンソールを使用して、利用可能なクォータを表示し、増加をリクエストできます。
- AWS アカウントで
us-west-2STS エンドポイントが有効化されている必要があります。詳細については、 AWS ドキュメントを参照してください。 - AWS 管理者は、AWS アカウントで必要なリソースをプロビジョニングするために、Databricks に一時的なアクセス権を付与する必要があります。
自動構成のワークスペースを作成する
自動構成では、AWS IAM の一時委任を使用して、ワークスペースに必要なすべてのリソースを自動的にプロビジョニングします。これは、一般的な設定エラーを防ぎ、AWS 管理者の承認を必要とするユーザー向けに組み込みの承認ワークフローを提供するため、ほとんどのデプロイメントで推奨される方法です。すべての自動化されたアクションは AWS CloudTrail に記録されます。
自動構成でワークスペースを作成するには:
- アカウントコンソールに移動し、[ ワークスペース ]アイコンをクリックします。
- 「ワークスペースの作成」 をクリックします。
- [ ワークスペース名 ]フィールドに、人間にとってわかりやすい名称で、このワークスペースの名前を入力します。ここには、スペースを含めることもできます。
- [リージョン] フィールドで、ワークスペースのネットワークとコンピュートのAWSリージョンを選択します。
- 既存のクラウド アカウントを使用するを 選択します。
- [クラウド資格情報] ドロップダウンで [クラウド資格情報の追加] を選択し、 [OK] をクリックします。
- [クラウド ストレージ] ドロップダウンで [クラウド ストレージの追加] を選択し、 [OK] をクリックします。
- AWS にログインしてワークスペースを作成します を クリックします。
- 作成されるリソースを確認し、 「ワークスペースの作成を開始」 をクリックします。
- ポップアップが表示され、AWS アカウントにログインして、Databricks に一時的なアクセス権を付与し、代わりにリソースをプロビジョニングできるようになります。十分な権限がない場合は、組織内の AWS 管理者がリクエストを承認できます。
Databricks に一時アクセスが許可されると、ワークスペースのプロビジョニングが開始されます。委任されたすべての権限には時間制限があり、展開後に自動的に期限切れになります。ワークスペースの作成状況は、アカウントコンソールの 「ワークスペース」 ページで確認できます。
プロビジョニングされたリソース
自動構成を使用すると、Databricks は AWS アカウントにクラウドリソースをプロビジョニングし、それらを表す構成オブジェクトを Databricks アカウントにプロビジョニングします。
AWS アカウントでは、次のリソースがプロビジョニングされます。
- アクセスポリシーを備えたクロスアカウントIAMロール
- 安全なサブネット、セキュリティ グループ、ルーティング テーブルを備えた顧客管理VPC
- ワークスペースアセットとワークスペースのデフォルトカタログを保存するための S3 バケット
- S3バケットにアクセスするためのアクセスポリシーを持つIAMロール
Databricks アカウントでは、次の構成オブジェクトが作成されます。
- 資格情報の構成 : コンピュート リソースの展開に使用されるクロスアカウントIAMロールを表します。
- ストレージ構成 : S3バケットとバケットへのアクセスに使用されるIAMロールを表します
- クラシック ネットワーク構成 : ワークスペースのデプロイに使用されるカスタマー管理VPCを表します。
これらの構成オブジェクトは、Databricks アカウント コンソールの クラウド リソース ページで表示および管理できます。
ワークスペースの状態を表示する
ワークスペースを作成した後、 「ワークスペース」 ページでそのステータスを確認できます。
-
プロビジョニング : Databricks ワークスペースを作成しています。AWS アカウントへの一時アクセスを求める Databricks のリクエストが承認待ちの場合は、「AWS アカウントへの一時アクセスを Databricks に付与するリクエストは、AWS 管理者からの承認待ちです。」と表示されます。承認されると、Databricks はワークスペースの作成を再開します。
-
実行中 : Databricks ワークスペースのデプロイが成功し、使用できる状態になりました。
-
失敗 : Databricks ワークスペースの展開で問題が発生しました。一般的なシナリオは次のとおりです:
- 7 日以内にアクションが実行されなかったため、AWS アカウントへの一時アクセスのリクエストは期限切れになりました。新しい委任リクエストを使用してワークスペースの作成を再試行できます。
- AWS 管理者が委任リクエストを拒否しました。管理者とともに権限要件を確認し、ワークスペースの作成を再試行してください。
- その他の失敗については、ワークスペースをクリックして詳細なエラー メッセージが表示されます。構成を更新して、ワークスペースを再度デプロイしてみてください。ワークスペース作成のトラブルシューティングを参照してください。
-
禁止 :Databricks の担当者にお問い合わせください。
-
キャンセル中 :キャンセル処理中です。
セキュリティとコンプライアンス機能を追加する
ワークスペースを作成したら、それを更新して、顧客管理キーやコンプライアンス標準などのセキュリティとコンプライアンスの機能を追加できます。詳細については、 「実行中または失敗したワークスペースの更新」を参照してください。
ワークスペースにログインする
- アカウントコンソールに移動し、[ ワークスペース ]アイコンをクリックします。
- ワークスペースのある行で、「 開く 」をクリックします。
次のステップ
ワークスペースをデプロイしたので、データ戦略の構築を開始できます。 Databricks では、次の記事をお勧めします。
- ユーザー、グループ、サービスプリンシパルをワークスペースに追加します。 ユーザー、サービスプリンシパル、およびグループを管理します。
- Databricksのデータガバナンスと権限についてご確認ください。「Unity Catalog とは」を参照してください。
- Databricksワークスペースを外部データソースに接続します。データソースと外部サービスへの接続を参照してください。
- ワークスペースにデータを取り込みます。Lakeflowコネクトの標準コネクタを参照してください。
- ノートブック、コンピュート、ダッシュボード、クエリなどのワークスペース オブジェクトへのアクセスの管理について学習します。 アクセス制御リストを参照してください。