AWS S3 外部ロケーションへの接続

このページでは、AWS S3 の外部ロケーションに接続する方法について説明します。この接続を完了すると、Unity Catalog を使用してこれらの S3 オブジェクトへのアクセスを管理できるようになります。

AWS S3 に接続するために利用可能な方法

S3 バケットパスに正常に接続するには、2 つの Unity Catalog セキュリティ保護可能なオブジェクトが必要です。1 つ目はストレージ資格情報で、S3場所へのアクセスを許可するAWS IAMロールを指定します。このストレージ認証情報は、2 番目の必須オブジェクトである外部ロケーション (S3 ストレージロケーションへのパスと、そのロケーションへのアクセスに必要な認証情報を定義する) に必要です。

これらのオブジェクトを作成するには、次のいずれかの方法を使用します。

手法	説明	使用する場合
AWS CloudFormation クイックスタートテンプレート	Databricks 、提供されている CloudFormation テンプレートを使用して、外部ロケーション S3 を設定することをお勧めします。この方法を使用すると、Databricks によって前提条件のストレージ資格情報オブジェクトが自動的に作成されるため、ストレージ資格情報を手動で作成する必要はありません。	既存のストレージ認証情報なしで S3 バケットへの新しい接続をすばやくセットアップするには、この方法を選択します。
カタログエクスプローラー	このオプションは、グラフィカル UI を提供します。最初にストレージ資格情報を手動で作成し、次に S3 バケットを参照する外部ロケーションを手動で作成する必要があります。	カタログエクスプローラUIを使用して必要なオブジェクトを作成する場合は、この方法を選択します。この手動の方法は、多数の外部ロケーションを作成する必要がある場合は推奨されません。
ノートブックまたは Databricks SQL クエリの SQL コマンド	このメソッドは、 SQL エディターまたはノートブックを使用して、プログラムでオブジェクトを作成します。最初にストレージ資格情報を作成し、次に S3 バケットを参照する外部ロケーションを作成する必要があります。	必要なオブジェクトをプログラムで作成する場合、または複数の外部ロケーションをすばやく作成する必要がある場合は、この方法を選択します。

このセクションでは、これらの各方法の詳細な手順について説明します。Databricks CLI または Terraform を使用することもできます。

AWS S3 に接続するために利用可能な方法​

AWS S3 に接続するために利用可能な方法