Databricks Marketplace にデータ製品を掲載する
この記事では、Databricks Marketplace プロバイダーになる方法と、データ製品の Databricks Marketplace リストを作成する方法について説明します。
始める前に
Databricks Marketplaceに製品を出品するには、プロバイダーポリシーに同意する必要があります。また、アカウントとワークスペースが特定の要件を満たしている必要もあります。
ポリシー:
Marketplace 取引所にデータ製品を出品するには、 Marketplace プロバイダー ポリシーに同意する必要があります。
アカウントとワークスペースの要件:
Databricks Marketplace では、 Delta Sharing を使用して、データ製品の安全な共有を管理します。 一方、Delta Sharing では、Databricks ワークスペースが Unity Catalog に対して有効になっている必要があります。 したがって、Databricks アカウントとワークスペースは、次の要件を満たしている必要があります。
- プレミアムプラン以上のDatabricksアカウント。
- Unity Catalog に対して有効になっている Databricks ワークスペース。 「Unity Catalog のワークスペースを有効にする」を参照してください。Unity Catalog のすべてのワークスペースを有効にする必要はありません。 Marketplaceリスティングを管理するためだけに作成できます。
これらの条件を満たすワークスペースがある場合、ユーザーは Marketplace のホーム ページを表示できます。 リストを作成および管理するには、追加の権限が必要です。 これらについては、次のセクションで説明します。 ユーザーが Marketplace のホーム ページをまったく表示できないようにする場合は、Databricks アカウント チームにお問い合わせください。
権限要件:
プライベートエクスチェンジ専用プロバイダーとしてサインアップするには、Databricks アカウント管理者である必要があります。 「Databricks Marketplace プロバイダーにサインアップする」を参照してください。
Databricks Marketplace プロバイダーにサインアップする
Databricks Marketplaceプロバイダーとしてサインアップする方法は、公開マーケットプレイスでリストを作成するつもりか、プライベートエクスチェンジを通じてのみリストを作成するかによって異なります。プライベートエクスチェンジでは、エクスチェンジのメンバーであるコンシューマのみが、リストを閲覧、表示、およびアクセスをリクエストできます。 「Databricks Marketplace でのプライベート交換の作成と管理」を参照してください。
プライベートエクスチェンジのみのプロバイダーになるには、プロバイダーコンソールを使用してサインアップできます。 公開リスティングを作成するには、 Databricks データパートナー プログラムを通じて申請します。
公開リストを作成できるプロバイダーになることを申請してください
所属組織がすでにDatabricksのパートナープログラムに参加しており、そのうえでMarketplaceのプロバイダーになる場合は、以下の手順をスキップしてpartnerops@databricks.com
にお問い合わせください。
-
Databricksデータパートナープログラムのページで、[ 今すぐ応募する ]をクリックします。
-
次のページで、[ 今すぐ応募する ]をクリックします。
-
メールアドレスを入力し、[ 今すぐ応募する ]をクリックします。
-
申請フォームに必要事項を入力します。
申請書の最後には、参加したいDatabricksのパートナープログラムを尋ねる項目があるので、Marketplaceを選択します。
Databricksのパートナーチームから、申請プロセスを完了するための連絡が入ります。承認されると、Unity Catalog対応のDatabricksワークスペースでプロバイダーコンソールを利用できるようになります。なお、プロバイダーコンソールを利用するには、Marketplaceの管理者ロールが必要です。
プライベートエクスチェンジプロバイダーとして登録する
プライベートエクスチェンジ専用プロバイダーとしてサインアップするには、プロバイダーコンソールの「 プロバイダーとして開始する 」ページを使用します。
プライベートエクスチェンジプロバイダーとしてサインアップするには:
-
Databricks アカウント管理者として、Databricks ワークスペースにサインインします。
-
サイドバーで、
Marketplace をクリックします。
-
Marketplace ページの右上隅にある [プロバイダー コンソール] をクリックします。
-
アカウントがプロバイダーとしてオンボーディングされていない場合、プロバイダーコンソールには [ プロバイダーとして開始する ] ページが表示され、アカウントをプライベートエクスチェンジプロバイダーとして有効にするプロセスを順を追って説明します。
-
[Marketplace の使用条件に同意する] で、 [Databricks Marketplace プライベート プロバイダーの使用条件 ] リンクをクリックして使用条件を確認します。
-
条件に同意するには、[ Private Provider の条件に同意する ] ボタンをクリックします。
これにより、新しいブラウザー タブの Databricks アカウント コンソールに移動し、[ 設定] > [機能の有効化 ] タブが開きます。 まだログインしていない場合は、アカウントコンソールにログインする必要がある場合があります。
複数の Databricks アカウントがある場合は、プロバイダーコンソールにアクセスしているワークスペースが含まれているアカウントにログインしていることを確認する必要があります。
-
[機能の有効化 ] タブで、[ Marketplace Private Exchange Provider ] オプションを有効にします。
-
ワークスペースの プロバイダーコンソール に戻り、「 ページの更新 」をクリックします。 ブラウザのページ更新機能を使用しないでください。
-
数分後、[ Marketplace 管理者の割り当て ] ボタンが表示されます。 それをクリックして、アカウントコンソールでユーザーページを開きます。 [ロール] タブで、 [Marketplace 管理者 ] を有効にします。
Marketplace 管理者ロールを別のユーザーに割り当てることを選択できます。 そうすると、この時点からプロセスを続行できます。 ロールを自分に割り当てた場合は、プロセスを続行できます。
-
ワークスペースの プロバイダーコンソール に戻り、「 ページの更新 」をクリックします。 ブラウザのページ更新機能を使用しないでください。
-
数分後、[ プロバイダー プロファイルの作成 ] ボタンが表示されます。 それをクリックして、[ プロファイルの作成 ] ページを開きます。
システムが Marketplace 管理者ロールの割り当てを完了するまでに数分かかる場合があります。 プロバイダー プロファイルの作成を続行し、Marketplace 管理者ロールがないことを示すエラーが表示された場合は、さらに数分待ってからページを更新し、再試行してください。
-
プロバイダー プロファイルを作成するには、「 Marketplace プロバイダー プロファイルを作成する」の手順 5 以降の手順に従います。
-
初めてのプライベートエクスチェンジを作成します。 「Databricks Marketplace でのプライベート交換の作成と管理」を参照してください。
Marketplace 管理者ロールを割り当てる
プライベートエクスチェンジプロバイダーとしてサインアップした場合は、サインアッププロセスの一部としてこのタスクを実行しました。 このセクションの手順は、Databricks アカウントの他のユーザーを Marketplace 管理者として有効にする場合を除き、スキップできます。
Marketplaceのプロバイダーとして承認されたら、少なくとも1名のユーザーにMarketplaceの管理者ロールを付与する必要があります。このロールは、Marketplaceのプロバイダーコンソールにアクセスし、Marketplaceプロバイダーのプロファイルやリスティングを作成および管理するために必要です。ロールの付与は、Databricksのアカウント管理者が実施できます。
- アカウント管理者として、アカウントコンソールにログインします。
[ ユーザー管理] をクリックします。
- ユーザー名を見つけてクリックします。
- [ ロール ]タブで、[ Marketplace管理者 ]をオンにします。
Marketplace プロバイダー プロファイルを作成する
プロバイダープロファイルは、見込み客にあなたが誰であるかを伝え、データ製品を単一のブランドまたはIDにグループ化する機会を提供します。 通常、データ プロバイダーには 1 つのプロファイルがありますが、複数のデータ製品を一覧表示できます。 複数のプロファイルが必要な場合は、Databricks アカウント チームにお問い合わせください。
パブリックプロバイダーの場合は、プロバイダー申請が承認された後にプロファイルを作成できます。 プライベートエクスチェンジのみのプロバイダーの場合は、 サインアッププロセスの最終ステップとして、ここに記載されている手順のステップ5からプロファイルを作成します。
必要な権限 :Marketplaceの管理者ロール
プロファイルを作成するには:
-
共有とリストの作成に使用する Databricks ワークスペースにログインします。
-
サイドバーで、
Marketplace をクリックします。
-
Marketplace ページの右上隅にある [プロバイダー コンソール] をクリックします。
-
[ プロバイダーコンソール ]ページの[ プロファイル ]タブで、[ プロファイルを作成 ]をクリックします。
-
次の情報を入力します。(すべて必須項目です)
- プロバイダー名 :コンシューマーが認識できる名前を使用します。コンシューマーは、プロバイダー名でリスティングをフィルタリングできます。
- ロゴ :リスティングで使用するロゴの画像ファイルにドラッグアンドドロップまたは参照します。
- 説明文 :貴社を明確かつ正確に説明します。貴社が主にサービスを提供する業界や、主にリストするデータ資産のタイプなどを説明します。コンシューマーがプロファイルページにアクセスすると、この説明文が表示されます。また、すべてのリスティングにも表示されます。
- 貴社のウェブサイト :貴社のウェブサイトへのリンクを入力します。コンシューマーはこのリンクをクリックして、貴社の詳細を確認することになります。このリンクは、すべてのリスティングに表示されます。
- 業務用メールアドレス :Databricksからの通知を受信するメールアドレスを入力します。この情報はコンシューマーには表示されません。
- サポート用メールアドレス :コンシューマーがサポートをリクエストする際に使用できるメールアドレスを入力します。このリンクは、すべてのリスティングに表示されます。
- 利用規約へのリンク :このリンクは、すべてのリスティングに表示されます。ただし、リスティングごとにこのリンクを上書きすることも可能です。
- プライバシーポリシー :このリンクは、すべてのリスティングに表示されます。ただし、リスティングごとにこのリンクを上書きすることも可能です。
-
プロファイルを保存します。
Marketplaceのプロバイダーである間にこれらの情報に変更があった場合は、プロファイルも変更してください。プロファイルは正確かつ最新の情報である必要があります。
共有を作成する
Delta Sharingに対してDatabricksアカウントを有効にし、Unity Catalogに対してDatabricksワークスペースを有効にしたら、Marketplaceでデータを共有するために使用する「 共有 」を作成できます。
共有は Delta Sharing オブジェクトです。 これは、テーブル、ビュー、ボリューム、AI モデルのコレクションであり、ユニットとして共有およびセキュリティ保護できます。 テーブルは、任意のコンシューマと共有できます。 ボリューム、AI モデル、ノートブックは、Unity Catalog が有効になっている Databricks ワークスペースにアクセスできるコンシューマーとのみ共有できます。
消費者が無料ですぐに利用できるデータ製品をリストするには、リストを作成するときに共有を含める必要があります。 一方、消費者リクエストの承認が必要なリストでは、リストにシェアを含める必要はありません。 共有は、ビジネス契約が完了し、消費者の要求を承認した後で作成できます。 その場合は、 出品情報の作成に進んでください。
-
データ テーブル、ビュー、またはボリュームを Unity Catalog メタストアに追加します。
Unity Catalog でこれらのデータ資産を作成する方法については、以下を参照してください。
-
共有を作成し、これらのデータ資産を共有に追加します。
共有を作成および更新する方法については、「 Delta Sharing の共有を作成および管理する」を参照してください。
必要な権限:
- 共有を作成するには、メタストア管理者、または共有したいデータが登録されているUnity Catalogメタストアに対する
CREATE SHARE
権限を持つユーザーである必要があります。 - テーブル、ボリューム、またはビューを共有に追加するには、共有の所有者であり、データアセットを含むスキーマに対する
USE SCHEMA
権限と、データアセットに対するSELECT
権限を持っている必要があります。 アセットを引き続き共有するには、SELECT
権限を保持する必要があります。 あなたがそれを失った場合、受取人は共有を通じて資産にアクセスできなくなります。 そのため、Databricks では、共有所有者としてグループを使用することをお勧めします。
テーブル、ボリューム、ビューの共有要件 (コンピュートやデータ型の要件など) の詳細については、「Delta Sharingの共有の作成と管理」を参照してください。
- 共有を作成するには、メタストア管理者、または共有したいデータが登録されているUnity Catalogメタストアに対する
共有を作成したら、その共有を参照するMarketplaceのリスティングを作成したり、更新したりできるようになります。
ノートブック example: Sample ノートブック
テーブル、ボリューム、ビューに加えて、 Databricks ノートブックも共有する Databricks 強くお勧めします。 ノートブックは、ユースケースの例を示し、テーブルのプロパティを視覚化するのに最適な方法です。 リストには、コンシューマーがワークスペースにインポートできるサンプルノートブックプレビューを含めることができます。
ノートブックの作成の詳細については、「Databricks ノートブックの概要」を参照してください。効果的なサンプル ノートブックの作成についてサポートが必要な場合は、 dataproviders@databricks.com
にお問い合わせください。
Chromeのシークレットモードでは、リスティングのUIで サンプルノートブック の表示やプレビューを行うことはできません。
以下は、効果的なサンプルノートブックを作成する方法の例になります。ここには、リスティング用の効果的なサンプルノートブックを作成するためのガイダンスも含まれています。
データ プロバイダー向けの Marketplace スターター ノートブック
リスティングを作成する
Marketplace のリストを使用すると、コンシューマーはデータ製品を参照、選択、およびアクセスできます。 すべてのデータセットリストは、 Databricks ワークスペースの消費者と、 Power BI、 Pandas、 Apache Sparkなどのサードパーティプラットフォームの消費者の両方と自動的に共有できます。
Databricks ボリュームなどの一部のデータ資産は、Unity Catalog 対応の Databricks ワークスペースにアクセスできるコンシューマーとのみ共有できます。 ただし、テーブルはすべてのコンシューマーと共有可能です。 テーブルとボリュームの両方を共有に含めると、Unity Catalog 対応のワークスペースにアクセスできないコンシューマーは、表形式のデータにのみアクセスできます。
必要な権限: Marketplace 管理者ロール。 パーソナライズされたリスティング(履行前にプロバイダーの承認が必要なリスティング)を作成および管理している場合は、 CREATE RECIPIENT
権限と USE RECIPIENT
権限も必要です。 「Unity Catalog の特権とセキュリティ保護可能なオブジェクト」を参照してください。
リスティングを作成するには:
-
Databricksワークスペースにログインします。
-
サイドバーで、
Marketplace をクリックします。
-
Marketplace ページの右上隅にある [プロバイダー コンソール] をクリックします。
-
[ プロバイダーコンソール ]ページの[ リスティング ]タブで、[ リスティングを作成する ]をクリックします。
-
[ 新しいリスティング ]ページで、リスティングの情報を入力します。
手順については、「 フィールドとオプションのリスト」を参照してください。
下書きを保存し、プレビューで確認してから公開します。[ 公開 ]をクリックすると、すぐにMarketplaceにそのリスティングが表示されます。
フィールドとオプションのリスト
このセクションでは、[ 新しいリスティング ]ページの各フィールドとオプションについて説明します。また、効果的なリスティングを作成するための推奨事項も掲載しています。
-
リスティング名 :リスティングには、そのリスティングに何があるかをコンシューマーが把握できるような、固有の名前を付ける必要があります。
推奨事項:
-
100文字未満に収める。
-
タイトルケース(主要な単語を大文字にします)。
-
例
US Census 2022
-
簡単な説明 :リスティング名から広げた、データセットの短くわかりやすい説明文。このフィールドは、リスティングタイルおよびコンシューマーの検索結果に表示されます。
推奨事項:
-
100文字未満に収める。160文字を超えることはできません。
-
センテンスケース(最初の単語と固有名詞や頭字語のみを大文字にします)。
-
例
General information about US population count and demography in 2020
-
プロバイダー プロファイル : 組織または会社名。ドロップダウンメニューから選択します。 プロファイルは、パートナー組織の承認プロセスの一環として Databricks によって作成されます。
-
利用規約 :共有データ資産を適切に使用するための貴社の利用規約に遷移するURL。
利用規約は公開され、ログインを必要としないものでなければなりません。
-
パブリックMarketplace :パブリックの Databricks Marketplaceのリスティングは、すべてのコンシューマーが参照および閲覧できます。
-
プライベートエクスチェンジ : あなたまたは別の Marketplace 管理者が作成したプライベートエクスチェンジのメンバーであるコンシューマーのみが、リストを閲覧、表示、リクエストできます。 「Databricks Marketplace でのプライベート交換の作成と管理」を参照してください。
ドロップダウンリストから少なくとも1つプライベート取引所を選択する必要があります。
-
データはすぐに利用可能 :このオプションを選択すると、コンシューマーはプロバイダーによる承認を必要とせずに、Marketplaceの共有データに直接アクセスできます(ただし利用規約への同意は必要)。ドロップダウンメニューから[共有]を選択します。このオプションは通常、サンプルやパブリックのデータセットに使用されます。
共有をまだ作成していない場合は、ドロップダウンメニューの一番下にある[ +新規共有を作成 ]をクリックして、「 新規共有を作成 ]ダイアログボックスを開きます。
ここで選択または作成した共有にデータまたはアセットが含まれていない場合は、[ データの追加 ] ボタンを含むメッセージが表示されます。 これをクリックすると、カタログエクスプローラーに移動し、共有にテーブルを追加できます。
共有の作成と共有へのテーブルの追加に関する詳細な情報 (必要なアクセス許可など) については、「Delta Sharingの共有の作成と管理」を参照してください。
-
コンシューマーリクエストの承認が必要 :コンシューマーが共有データにアクセスする前に承認を必要とする場合は、このオプションを選択します。コンシューマーがデータ製品を利用できるようにする前に契約を必要とする場合は、このオプションを使用してください。契約は、Databricks Marketplaceの関与外でコンシューマーと締結する必要があります。コンシューマーとの連絡は、そのコンシューマーのメールアドレスを使用して開始してください。
コンシューマ要求は、 プロバイダコンソールの>コンシューマ要求 タブで表示および処理できます。 「Databricks Marketplace でデータ製品の要求を管理する」を参照してください。
-
カテゴリー :コンシューマーがリスティングのフィルタリングに使用できるカテゴリーを5つまで選択します。このカテゴリーは、リスティングタイルと詳細ページにもタグとして表示されます。
-
属性を追加 :属性は任意です。これには、地理的範囲、更新頻度、日付範囲、データソース、データセットサイズなどのフィールドがあります。属性を追加すると、コンシューマーはデータ製品を詳しく理解できるようになります。また属性はいくつでも選択できます。
-
説明 :データの詳細な説明には、リスティングで提供するデータとアセットの概要を入れる必要があります。
Markdown構文を使用した基本的なリッチテキスト(太字、斜体、箇条書き、番号付きリストなど)にも対応しています。内容をプレビューするには、説明フィールドツールバーの右端にあるボタンを使用します。
推奨事項:
-
利点とユースケースを含める。
-
データとサンプルユースケースの使用方法について簡単に説明する。
-
サンプルのデータセットとフィールド名を入れる。
-
スキーマ、テーブル、列を指定する。
-
句読点と書き方に一貫性を持たせる。
-
段落間に改行を入れる。
-
誤字脱字と文法を確認する。
-
[ 属性を追加 ]で定義した属性を繰り返さない。
-
例
概要
人口と住居に関する米国国勢調査は、米国の人口と住居の公式数で、この時点の米国の社会および経済を映し出します。23回目となる2020年の国勢調査は、2021年3月6日に実施されました。
ユースケース
-
年齢や性別などの人口統計上の属性に基づいて消費者をグループ化します。
-
特定のコンシューマーグループに合わせて製品をカスタマイズします。
このデータセットに含まれる情報:
-
人口の推計値
-
人口統計学的要素(出生、死亡、移住)
-
このデータは、年齢、性別、人種などの特徴に加えて、国、州、郡を基準に分類することができます。
-
サンプルノートブック :データの最適な使用方法を示すため、サンプルノートブックを提供することを強く推奨します。ノートブックは10個まで追加できます。サンプルノートブックをアップロードするには、リスティングを一度保存してから、またリスティングに戻る必要があります。
ノートブックの作成の詳細については、「ノートブックの例: サンプル ノートブック」および「Databricks ノートブックの概要」を参照してください。
-
ドキュメント :コンシューマーがデータセットを使用または理解するのに役立つドキュメント(データセット辞書など)にリンクするURL。
-
プライバシーポリシー :貴社のプライバシーポリシーにリンクする URL。
プライバシーポリシーは公開され、ログインを必要としないものでなければなりません。
システムテーブル (パブリックプレビュー) とダッシュボードを使用した消費者のアクティビティの分析
アカウントで システムテーブル を有効にしている場合は、 Marketplace システムテーブルを使用して、リスティングの消費者活動を分析できます。 詳細については、Marketplace システムテーブル リファレンスを参照してください。
また、Provider アナリティクスダッシュボードを使用して、リスティングの閲覧数、リクエスト数、インストール数を監視することもできます。 ダッシュボードは、システムテーブルからデータを取得します。 「 ダッシュボードを使用したリストの使用状況メトリクスのモニタリング」を参照してください。
リソースクォータ
Unity Catalog は、メタストアごとの Marketplace リストやアカウントごとのプロバイダーなど、セキュリティ保護可能なすべてのオブジェクトにリソース クォータを適用します。 これらのクォータは、「 リソース制限」に記載されています。 これらのリソース制限を超えることが予想される場合は、Databricks アカウント チームにお問い合わせください。
クォータの使用状況は、 Unity Catalog リソース クォータ APIsを使用して監視できます。 「Unity Catalog のリソース クォータの使用状況を監視する」を参照してください。