Cloudflare R2に接続するためのストレージ認証情報を作成する

プレビュー

この機能は パブリックプレビュー版です。

この記事では、Unity Catalog でストレージ認証情報を作成して Cloudflare R2 に接続する方法について説明します。 Cloudflare R2オブジェクトストレージでは、エグレス料金はかかりません。 共有するデータを R2 に複製または移行すると、下り料金を発生させることなく、クラウドやリージョン間でデータを共有できるようになります。

注:

Unity Catalog は、 Databricks on AWSの 2 つのクラウド ストレージ オプション、AWS S3 バケットと Cloudflare R2 バケットをサポートしています。 Cloudflare R2は主に、クラウドプロバイダーのデータ下り料金を回避したいDelta Sharingユースケースを対象としています。 S3 は、他のほとんどのユースケースに適しています。 Delta Sharing下りコストの監視と管理 (プロバイダー向け)」および「AWS S3 に接続するためのストレージ認証情報の作成」を参照してください。

Unity Catalog によって管理されるデータのストレージ場所として R2 バケットを使用するには、R2 バケットへのアクセスを許可するストレージ認証情報を作成し、ストレージ認証情報とバケット パスを参照する外部ロケーションを作成する必要があります。

  • ストレージ資格情報は、クラウドストレージにアクセスするための長期的なクラウド資格情報をカプセル化します。

  • 外部ロケーションには、ストレージ資格情報とクラウドストレージパスへの参照が格納されています。

この記事では、ストレージ資格情報の作成に焦点を当てます。

詳細については、 Unity Catalogを使用してクラウド オブジェクト ストレージに接続する」を参照してください。

要件

  • Databricks ワークスペースがUnity Catalogに対して有効になっています。

  • Databricks Runtime 14.3 以降、または SQLwarehouse 2024.15 以降。

    エラー メッセージNo FileSystem for scheme "r2”が表示された場合は、コンピュートのバージョンがサポートされていない可能性があります。

  • クラウドフレアアカウント。 https://dash.cloudflare.com/sign-up を参照してください。

  • Cloudflare R2管理者ロール。 Cloudflareの役割に関するドキュメントを参照してください。

  • CREATE STORAGE CREDENTIAL ワークスペースにアタッチされているUnity Catalogメタストアに対する権限。 アカウント管理者とメタストア管理者には、デフォルトでこの権限が与えられます。

R2バケットの構成

  1. Cloudflare R2バケットを作成します。

    CloudflareダッシュボードまたはCloudflare Wranglerツールを使用できます。

    Cloudflare R2の「はじめに」のドキュメントまたはWranglerのドキュメントを参照してください。

  2. R2 API トークンを作成し、バケットに適用します。

    Cloudflare R2 API 認証ドキュメントを参照してください。

    次のトークンのプロパティを設定します。

    • 権限: オブジェクトの読み取りと書き込み。

      この権限は、 Cloudflare R2レプリカの使用またはR2へのストレージの移行で説明されているように、R2ストレージをレプリケーションターゲットとして使用する場合に必要な読み取りおよび書き込みアクセス権を付与します。

      Databricks から R2 バケットへの読み取り専用アクセスを強制する場合は、代わりに読み取りアクセスのみを許可するトークンを作成できます。 ただし、ストレージ資格情報を読み取り専用としてマークすることができ、このアクセス許可によって付与された書き込みアクセスは無視されるため、これは不要な場合があります。

    • (オプション) TTL: バケットデータをデータ受信者と共有する時間の長さ。

    • (オプション) クライアント IP アドレス フィルタリング: ネットワーク アクセスを指定した受信者 IP アドレスに制限する場合に選択します。 このオプションが有効な場合は、受信者の IP アドレスを指定し、ワークスペース領域の Databricks コントロール プレーン NAT IP アドレスをホワイトリストに登録する必要があります。

    「Databricks コントロール プレーンからのアウトバウンド」を参照してください。

  3. R2 API トークンの値をコピーします。

    • アクセスキーID

    • シークレットアクセスキー

    重要

    トークン値は 1 回だけ表示されます。

  4. R2 ホームページで、 「アカウントの詳細」に移動し、R2 アカウント ID をコピーします。

ストレージ資格情報を作成する

  1. Databricks で、ワークスペースにログインします。

  2. カタログ アイコン カタログ」 をクリックします

  3. [ + 追加 ] ボタンをクリックし、メニューから [ ストレージ資格情報の追加 ] を選択します。

    このオプションは、 CREATE STORAGE CREDENTIAL 権限がない場合には表示されません。

  4. Cloudflare API トークン認証情報の種類を選択します。

  5. 認証情報の名前と、R2バケットの設定時にコピーした次の値を入力します。

    • アカウントID

    • アクセスキーID

    • シークレットアクセスキー

  6. (オプション)このストレージ資格情報を使用する外部ロケーションへの読み取り専用アクセス権をユーザーに付与する場合は、[ 詳細オプション ] で [読み取り専用] を選択します。

    Cloudflare R2レプリカの使用またはR2へのストレージの移行」の説明に従って、レプリケーションターゲットとして使用しているR2ストレージにストレージ認証情報を使用してアクセスする場合は、このオプションを選択しないでください。

    詳細については、「 ストレージ資格情報を読み取り専用としてマークする」を参照してください。

  7. 作成」をクリックします。

  8. [ ストレージ資格情報が作成されました ] ダイアログで、 [外部 ID] をコピーします。

次のステップ: 外部位置情報を作成する

「外部ロケーションを作成してクラウド ストレージを Databricks に接続する」を参照してください。