Databricks Marketplace のデータ製品にアクセスする (Unity Catalog 対応ワークスペース)

この記事では、Unity Catalog が有効になっている Databricks ワークスペースがある場合に、Databricks Marketplace のデータ製品にアクセスする方法について説明します。

Unity Catalog が有効になっている Databricks ワークスペースがない場合は、Delta Sharing オープン共有コネクタを使用して共有 Marketplace データ製品にアクセスできます。 「外部プラットフォームを使用して Databricks Marketplace のデータ製品にアクセスする」を参照してください。

概要

Databricks Marketplace は、データ コンシューマーとして、組織が成功するために必要なデータ製品を検索するための安全なプラットフォームを提供します。 Databricks Marketplace では、Delta Sharing を使用して、共有データに対するセキュリティと制御を提供します。 コンシューマーは、公開データ、無料サンプルデータ、および商用データオファリングにアクセスできます。 Unity Catalog 対応の Databricks ワークスペースを使用するコンシューマーは、表形式データへのアクセスに限定されず、ボリューム (表形式以外のデータ)、AI モデル、Databricks ノートブック、Databricks ソリューション アクセラレータにもアクセスできます。

Unity Catalog が有効になっている Databricks ワークスペースを使用して Marketplace データ製品を使用する場合は、Delta Sharing と Unity Catalog のインテグレーションと、Unity Catalog のガバナンス、監査、便利なインターフェイスを利用できます。

始める前に

Databricks Marketplaceでデータ製品リストを参照するには、次のいずれかを使用できます。

Unity Catalogが有効化されているDatabricks ワークスペースを使用してデータ製品を使用するには、次のものが必要です。

Databricks Marketplaceのリスティングを見る

目的のデータ製品を見つけるには、Databricks Marketplaceのデータ製品のリスティングを参照または検索します。

次の手順の代わりに、Databricks ワークスペースの上部にあるグローバル検索バーを使用して Marketplace の一覧を検索できます。 「ワークスペース オブジェクトの検索」を参照してください。[ データの追加 ] ページで無料サンプル データを表示およびリクエストすることもできます。 ワークスペースのサイドバーで、 [ データ取り込み ] をクリックし、 [ Databricks Marketplace からの無料サンプル データ] まで下にスクロールします。

  1. Marketplace .databricks.comに移動するか、Databricks ワークスペースにログインして Marketplaceアイコン [ Marketplace ] をクリックします 。

  2. 目的のデータ製品を確認または検索します。

    製品の種類 (データセット、 ソリューション アクセラレータ、または機械学習モデル)、プロバイダー名、カテゴリ、コスト (無料または有料)、またはキーワード検索でリストをフィルタリングできます。

    Databricks ワークスペースにログインしている場合は、プライベート エクスチェンジの一部として使用できるプライベート リストのみを表示するように選択することもできます。 「プライベートエクスチェンジに参加する」を参照してください。

Marketplaceにあるデータ製品のアクセスをリクエストする

データ製品へのアクセスをリクエストするには、Databricksワークスペースにログインする必要があります。データ製品の中には、すぐに利用できるものもありますが、プロバイダーの承認とプロバイダーインターフェイスを使用したトランザクションの完了が必要なデータ製品もあります。

要件

始める前にを参照してください。Marketplace内のデータ製品にアクセスするには、使用しているワークスペースにアタッチされている Unity Catalog ・メタストアに対する USE MARKETPLACE ASSETS 特権以上が必要です。

すぐに利用できるデータ製品にアクセスする

データ製品の中には、リクエストして規約に同意するだけで、すぐに利用できるものもあります。これらは、Marketplaceのランディングページの[ 無料ですぐに利用可能]という見出しの下に表示されています。リスティングタイルには[ 無料]と表示されており、リスティング詳細ページには[ すぐに利用可能]と記載されています。

  1. Marketplaceのランディングページで興味のあるリスティングを見つけたら、それをクリックして詳細ページを開きます。

  2. 即時アクセス権を取得]ボタンをクリックし、Databricksの利用規約に同意します。

    Databricks ソリューション アクセラレータへのアクセスの動作は少し異なります。 「 Databricks ソリューション アクセラレータにアクセスする」を参照してください。

  3. (オプション)[ その他のオプション] で、提案されたカタログ名を変更します。

    カタログ名は、Databricks ワークスペースのカタログ エクスプローラーに表示され、クエリーの 3 部構成の名前空間 (catalog.schema.table|volume|view) で使用されます。 デフォルトの名前は変更できます。

  4. [ Get instant access ] ボタンをクリックします。

  5. [ 開く ]ボタンをクリックすると、カタログ エクスプローラに読み取り専用のカタログとして表示されるデータ製品が表示されます。

    Databricks でのカタログへのアクセスの管理については、「 Unity Catalog を使用して共有データにアクセスする」を参照してください。

サンプル ノートブックが利用可能な場合は、リストの[サンプル ノートブック]見出しの下に表示されます。

ノートブックを表示するには、 「ノートブックのプレビュー」ボタンをクリックします。 ノートブックを Databricks ワークスペースにインポートして実行できるようにするには、 [ノートブックのプレビュー]をクリックし、 [ノートブックのインポート]をクリックします。 「Databricks ノートブックの概要」を参照してください。

プロバイダーの承認が必要なデータ製品をリクエストする

一部のデータ製品にはプロバイダーの承認が必要です。一般的には、トランザクションを伴う場合、またはユーザーに合わせてデータ製品をカスタマイズすることをプロバイダーが好む場合に、承認が必要になります。こうしたリスティングは、リスティング詳細ページに[リクエストによる]と記載されており、[アクセス権をリクエスト]ボタンがあります。

  1. Marketplaceのランディングページで興味のあるリスティングを見つけたら、それをクリックして詳細ページを開きます。

  2. アクセス権をリクエスト]ボタンをクリックします。

  3. 氏名、会社名、データ製品の使用目的の簡単な説明文を入力します。

  4. Databricksの利用規約に同意し、[アクセス権をリクエスト]をクリックします。

  5. プロバイダーがリクエストの審査を完了すると、電子メールで通知されます。

    Marketplaceの「マイリクエスト」ページでリクエストの進行状況を監視することもできます。 「共有 Databricks Marketplace データ製品の管理」を参照してください。 ただし、その後の取引では、プロバイダーの通信および支払いプラットフォームが使用されます。 Databricks Marketplace では直接商取引は行われません。

  6. トランザクションが完了すると、データプロバイダーがそのデータ製品をワークスペース上の読み取り専用カタログにして、利用できるようにします。

    Databricks でのカタログへのアクセスの管理については、「 Unity Catalog を使用して共有データにアクセスする」を参照してください。

Databricks ソリューション アクセラレータにアクセスする

他のデータ資産とは異なり、Databricksソリューション アクセラレーターは、 Git リポジトリのクローンを作成し、 Databricks Git フォルダーで利用できるようにすることで共有されます。 ソリューション アクセラレータにアクセスするには:

  1. Marketplace で、ソリューション アクセラレータの一覧をクリックして、一覧の詳細ページを開きます。

  2. [ Get instant access ] ボタンをクリックします。

  3. [Git フォルダーの追加]ダイアログで、リポジトリの名前を入力します。 この名前は、Databricks Git フォルダーの UI に表示されます。

  4. Databricks の利用規約に同意し、 [Git フォルダーの作成] をクリックします。

  5. [開く]ボタンをクリックし、 Git フォルダーを選択して、ワークスペース ファイル ブラウザーでリポジトリを表示します。

Unity Catalog を使用して共有データにアクセスする

Databricks ワークスペース内のデータへのアクセスは、データ製品の種類によって異なります。

  • Marketplace のデータセットとモデルは、Databricks の読み取り専用カタログで共有されます。 カタログは、Unity Catalog によって管理されるデータ資産の最上位のコンテナーです。 Unity Catalog のデータ オブジェクト階層の詳細については、「 Unity Catalog オブジェクト モデル」を参照してください。

    プロバイダーがデータを共有すると、カタログにアクセスする方法はいくつかあります。 以下のセクションでは、これらのアクセス オプションの一部について説明します。

  • ノートブックは Marketplace の一覧で直接共有され、一覧からワークスペースにインポートできます。

  • ソリューション アクセラレータは、Databricks Git フォルダーとして共有されます。 「Databricks ソリューション アクセラレータへのアクセスを取得する」を参照してください。

Marketplace の共有データセットにアクセスする

Marketplaceから共有データにアクセスするには:

  1. サイドバーで、「 Marketplaceアイコン Marketplace 」をクリックします

  2. Marketplaceのランディングページで、右上にある[リクエスト]をクリックします。

  3. [ インストールされたデータ製品] タブで、データ製品を見つけ、データ製品行の末尾にあるケバブ メニュー (3 ドット メニューとも呼ばれます) をクリックして ケバブメニュー 、[ データの表示] を選択します。

    データ製品名をクリックしてデータ製品の詳細ページを開き、[開く]ボタンをクリックしてデータを表示させることもできます。

    「カタログエクスプローラ」(Catalog Explorer) でデータセットを含むカタログが開き、データにアクセスしたり、ほかのチームメンバーのアクセスを管理したりできます。 「他のチーム メンバーにアクセス権を付与する」を参照してください。

    Databricks で共有データにアクセスする方法の詳細については、「 Databricks 間 Delta Sharing (受信者用) を使用して共有されたデータの読み取り」を参照してください。

「カタログエクスプローラ」(Catalog Explorer) での共有データセットへのアクセス

カタログ エクスプローラから直接共有データにアクセスするには:

  1. サイドバーで、[カタログ アイコン カタログ] をクリックします 。

  2. 共有データのあるカタログの名前がわかっている場合は、それを検索して選択します。

カタログ名がわからないが、プロバイダー名がわかっている場合は、次の手順を実行してカタログ エクスプローラーでカタログを見つけることができます。

  1. サイドバーで、[カタログ アイコン カタログ] をクリックします 。

  2. カタログ エクスプローラの左側のペインで、[ Delta Sharing ]、[ 自分と共有] の順にクリックします。

  3. プロバイダー]タブで、プロバイダー名をクリックします。

  4. 共有]タブでカタログ名を見つけ、クリックして開きます。

Databricks CLI または SQL ステートメントを使用して共有データセットにアクセスする

また、Databricks CLI を使用するか、Databricks ノートブックまたは Databricks SQL エディター クエリの SQL ステートメントを使用して、共有データを含むカタログを検索してアクセスすることもできます。 詳細については、「 共有テーブルまたは共有ボリューム内のデータにアクセスする」を参照してください。 カタログの作成方法を説明するセクションは、Databricks Marketplace によって自動的に行われるため、省略できます。

他のチームメンバーにアクセスを許可する

共有データをリクエストしたユーザーは、自身のワークスペースで、そのデータを持つカタログの所有者になります。そのため、Unity Catalogのデータと同様、チームメンバーにそのカタログへのアクセスを許可したり、スキーマやテーブル、ビュー、行、列レベルでアクセス権を調整したりすることができます。詳細は「Unity カタログでの権限の管理」を参照してください。ただし、共有カタログ内のテーブルとビューのデータは読み取り専用です。つまり、チームに許可できるのは、 DESCRIBESHOWSELECTなどの読み取り操作のみになりです。

カタログやカタログ内のオブジェクトの所有権を移すこともできます。

サンプルノートブックを見る

一部のリストには、リストの詳細ページにサンプル ノートブックが含まれています。 これらのノートブックにアクセスして、共有されているリストをすぐに利用できるようにするには:

  1. サイドバーで、「 Marketplaceアイコン Marketplace 」をクリックします

  2. Marketplaceのランディングページで、右上にある[リクエスト]をクリックします。

  3. [インストールされているデータ製品]タブでデータ製品を見つけ、データ製品名をクリックしてリストの詳細ページを開きます。 サンプル ノートブックがある場合は、リストの[サンプル ノートブック]見出しの下に表示されます。

  4. [ノートブックのプレビュー]をクリックしてノートブックを表示し、 [ノートブックのインポート]をクリックして Databricks ワークスペースにインポートします。

Chromeのシークレットモードでは、リスティングのUIでサンプルノートブックの表示やプレビューを行うことはできません。

プライベート取引所に参加する

データプロバイダーによっては、特定のデータに関し、プライベート取引所に招待されている一部のコンシューマーにしかそのデータを共有しない場合があります。プライベート取引所のリスティングは、Marketplaceのホームページで[プライベート取引所]チェックボックスを選択すると、確認できます。公開リスティングの場合と同様、無料のリスティングにすぐにアクセスすることも、[ リクエストにより]とマークされたリスティングへのアクセスをリクエストすることもできます。

プライベートエクスチェンジに参加するには、データプロバイダーが組織を招待する必要があります。 その場合、 Unity Catalog メタストアの共有識別子をリクエストします。 メタストアの共有識別子を取得する方法については、「 Databricks 間モデルでアクセスを取得する」の手順 1 を参照してください。

プライベート取引所の詳細については、「Databricks Marketplaceでプライベート取引所を作成および管理する」を参照してください。

Marketplaceへのアクセスを無効にする

デフォルトでは、Unity Catalogが有効なワークスペース内のすべてのユーザーがDatabricks Marketplaceのデータ製品をリクエストできます。つまり、メタストア管理者がその権限を取り消さない限り、account usersグループにはすべてのUnity Catalogのメタストアに対するUSE MARKETPLACE ASSETS権限があります。

この権限は、データプロバイダーとの決済を伴う取引を可能にするものではありません。すべての金融取引はDatabricksの外部で行われます。この権限で可能になるのは、[無料ですぐに利用可能]というラベルの付いたデータ製品、およびすでに購入済みデータ製品へのアクセスです。こうしたデータ製品にアクセスすると、そのアクセスをリクエストしたユーザーを所有者とする読み取り専用カタログがDatabricksに作成されます。この所有者は他のユーザーに読み取り専用のアクセス権を付与できます。

メタストア管理者は、どのユーザーに対しても、Unity Catalogメタストアのaccount usersグループからUSE MARKETPLACE ASSETS権限を取り消すことで、そのユーザーがDatabricks Marketplaceでデータ製品をリクエストできないようにすることができます。この権限が取り消されても、ユーザーは引き続き自身のワークスペースでDatabricks Marketplaceを参照できますが、データ製品のリクエストはできなくなります。

必要な権限:メタストア管理者

ワークスペースで Unity Catalog が自動的に有効になっている場合は、メタストア管理者がいない可能性があります。 詳細については、「 Unity Catalog の自動有効化」を参照してください。

account usersグループのUSE MARKETPLACE ASSETS権限を取り消すには:

  1. Databricks ワークスペースで、[カタログ アイコン カタログ] をクリックします 。

  2. 画面左上のメタストア名の横にあるリンクアイコンをクリックします。

  3. account usersUSE MARKETPLACE ASSETS権限を付与する行を見つけます。

  4. その行の横にあるチェックボックスを選択し、[取り消し]ボタンをクリックします。

  5. 取り消しを確定させます。

  6. [ 許可]ボタンをクリックして、好きな特定のユーザーやグループに権限を付与します。

account usersグループのUSE MARKETPLACE ASSETS権限を取り消すには、ノートブックまたはDatabricks SQLクエリーエディターで次のコマンドを実行します。

REVOKE USE MARKETPLACE ASSETS ON METASTORE FROM `account users`;

特定のユーザーまたはグループにUSE MARKETPLACE ASSETS権限を付与するには、ノートブックまたは Databricks SQLクエリーエディターで次のコマンドを実行します。

GRANT USE MARKETPLACE ASSETS ON METASTORE TO `<user-or-group>`;

ユーザーが Marketplace ホーム ページを表示できないようにする場合は、Databricks アカウント チームにお問い合わせください。

既知の問題点

アクセスのリクエストがデータ プロバイダーによって拒否された場合、同じデータ製品を再度リクエストすることはできません。 この問題が発生した場合は、プロバイダーまたは Databricks アカウント チームにお問い合わせください。

フィードバックをお願いいたします

Databricks Marketplaceについて、どうぞご意見をお寄せください。

  • フィードバックがある場合は、Marketplaceのホームページで[詳細]>[フィードバックを提供]の順に移動します。

  • Marketplaceで見られるデータセットを増やしてほしい場合は、Marketplaceのホームページバナーで[製品を提案]をクリックします。