インジェスト用のデータアクセスを構成する

この記事では、Databricks ユーザーが S3 から Databricks のテーブルにデータをロードできるように、管理者ユーザーが Amazon S3 (S3) のバケット内のデータへのアクセスを構成する方法について説明します。

この記事では、ソースデータへの安全なアクセスを構成する次の方法について説明します。

始める前に

S3 でデータへのアクセスを設定する前に、次のものがあることを確認してください。

AWS アカウントの S3 バケット内のデータ。バケットを作成するには、AWS ドキュメントの「バケットの作成」を参照してください。
Unity Catalog ボリューム (推奨) を使用してデータにアクセスするには、ボリュームに対する READ VOLUME 特権が必要です。詳細については、Unity Catalog ボリュームとはおよびUnity Catalog特権とセキュリティ保護可能なオブジェクトを参照してください。
外部ロケーション Unity Catalog を使用してデータにアクセスするには、外部ロケーションに対する READ FILES 権限。詳細については情報「外部ロケーションに対する権限の付与」を参照してください。
AWS インスタンスプロファイルを持つコンピュートリソースを使用してデータにアクセスするには、ワークスペース管理者のアクセス許可Databricks。
Databricks SQL ウェアハウス。 SQLウェアハウスを作成するには、「SQLウェアハウスの作成」を参照してください。
Databricks SQL ユーザーインターフェイスに精通している。

次のいずれかの方法を使用して、S3 へのアクセスを設定します。

(推奨)Unity Catalog ボリュームを作成します。詳細については、「Unity Catalog ボリュームとは」を参照してください。
ストレージ資格情報を使用して Unity Catalog 外部ロケーションを構成します。外部ロケーションの詳細については、「外部ロケーションの概要」を参照してください。
AWSインスタンスを使用するようにコンピュートリソースを設定します。詳細については、「インスタンスを使用するようにSQLウェアハウスとサーバレスコンピュートを構成する」を参照してください。
一時的な認証情報 (AWS アクセスキー ID、シークレットキー、セッショントークン) を生成して、他の Databricks ユーザーと共有します。詳細については、「インジェスト用の一時的な資格情報の生成」を参照してください。

クラウドアカウントとDatabricksの関連リソースを保持しなくなった場合は、それらをクリーンアップできます。

Unix、Linux、macOS の場合は ~/.aws/credentials ファイル、Windows の場合は %USERPROFILE%\.aws\credentials ファイルで、ファイルの次の部分を削除してから、ファイルを保存します。

[<named-profile>]
aws_access_key_id = <access-key-id>
aws_secret_access_key = <secret-access-key>

AWS アカウントで IAM コンソールを開きます (まだ開いていない場合 (通常は https://console.aws.amazon.com/iam) )。
サイドバーで、 ポリシー をクリックします。
ポリシーの横にあるオプションを選択し、 アクション > 削除 をクリックします。
ポリシーの名前を入力し、[ 削除 ] をクリックします。

SQLウェアハウスを他のタスクに使用していない場合は、追加コストを避けるために SQLウェアハウスを停止する必要があります。

この記事の手順を完了すると、ユーザーは COPY INTO コマンドを実行して、S3 バケットから Databricks ワークスペースにデータを読み込むことができます。

Unity Catalogボリュームまたは外部ロケーションを使用してデータをロードするには、Unity Catalogボリュームまたは外部ロケーションを使用した COPY INTO を使用したデータのロードを参照してください。
インスタンスプロファイルを持つ SQLウェアハウスを使用してデータをロードするには、AWSインスタンスプロファイルを持つCOPY INTOを使用したデータのロードを参照してください。
一時的な認証情報 (AWS アクセスキー ID、シークレットキー、セッショントークン) を使用してデータをロードするには、「一時的な認証情報を使用した COPY INTO を使用したデータのロード」を参照してください。