メインコンテンツまでスキップ

メトリクス ビューの作成

このページでは、 SQLまたは UI を使用してメトリクス ビューを作成する方法を示す例で使用されるデータ モデルと考慮事項について説明します。

サンプルデータセットの概要

SQL使用してメトリクス ビューを作成および管理する およびカタログ エクスプローラー UI を使用してメトリクスUnity Catalog ビューを作成する で提供される例では、 セットで確実に利用できる TPC-H データセットを使用します。

TPC-H データセットは、意思決定支援システムとクエリ パフォーマンスを評価するために使用される標準ベンチマーク データセットです。これは卸売サプライ チェーン ビジネスをモデル化し、注文、顧客、仕入先、部品などの一般的なビジネス オペレーションを中心に構成されています。これは、さまざまな国や地域のさまざまなサプライヤーから供給される部品を顧客が注文する販売および流通環境を表しています。

スキーマには 8 つのテーブルがあります。

  • REGION およびNATION : これらのテーブルは場所を定義します。

  • CUSTOMER およびSUPPLIER : これらのテーブルはビジネス エンティティについて説明します。

  • PART およびPARTSUPP : これらのテーブルには、製品情報とサプライヤーの可用性が記録されます。

  • ORDERS およびLINEITEM : これらのテーブルはトランザクションを表し、行項目には注文内の製品の詳細が記載されます。

TPC-H データセット ERD

次の図は、テーブル間の関係を説明しています。

TPC-H エンティティ リレーションシップ ダイアグラムは、テーブル間のリレーションシップを示します。

伝説:

  • 各テーブル名の後の括弧には、そのテーブルの列名のプレフィックスが含まれます。
  • 矢印はテーブル間の 1 対多の関係の方向を指します。
  • 各テーブル名の下の数字/数式は、テーブルのカーディナリティ (行数) を表します。一部は SF (スケール係数) によって因数分解され、選択されたデータベース サイズを取得します。LINEITEM テーブルのカーディナリティは近似値です (4.2.5 項を参照)。

(出典: TPC Benchmark H 標準仕様)

メトリクス ビューを定義する

SQL DDL またはカタログ エクスプローラー UI を使用してメトリクス ビューを定義できます。 あるいは、 Databricks Assistant使用して、メトリクス ビューの作成を開始することもできます。 次に、提供されたSQL DDL を編集するか、UI のメトリクス ビュー エディターを使用して、提案された定義を調整できます。

このセクションの例で定義されているメトリクス ビューは、販売アナリストまたは財務アナリストが会社の注文に関連する主要業績評価指標 (KPI) を監視できるように設計されています。 次のような質問に答えるのに役立ちます。

  • 総収益は時間の経過とともにどのように推移してきましたか?
  • 注文の現在の内訳はステータス(オープン、処理中、履行済み)ごとにどうなっていますか?
  • どの注文優先度が最も収益を生み出しますか?
  • 現在、リスクにさらされている、または未処理の収益(オープン注文によるものなど)はどのくらいありますか?
  • ユニーク顧客あたりに生み出される平均収益はいくらですか?

必要なコンポーネントは次の表に記載されています。

コンポーネント

YAMLフィールド/式

ビジネス上の意味

ソーステーブル

samples.tpch.orders

顧客の注文記録を含む生データ。

フィルタ

o_orderdate > '1990-01-01'

1990 年 1 月 1 日 以降に 行われた注文のみに分析を集中し、履歴データやアーカイブ データは除外される可能性があります。

ディメンション: 注文月

(DATE_TRUNC('MONTH', o_orderdate))

傾向分析 (前月比/前年比) を有効にして、時間の経過に伴うパフォーマンスの変化を追跡します。

ディメンション: 注文状況

CASE ステータスをOpenProcessing 、または Fulfilled

ライフサイクル ステージ別にセグメント化できるため、フルフィルメントとバックログの管理に役立ちます。

ディメンション: 注文優先順位

SPLIT 注文の優先順位を数値としてフォーマットするステートメント

注文の戦略的重要性または緊急性によってパフォーマンスをグループ化するために使用されます。

測定: 注文数

COUNT(1)

販売活動の量を測定する

測定基準: 総収益

SUM(o_totalprice)

すべての注文の総売上高

測定基準: 顧客あたりの総収益

SUM(o_totalprice) / COUNT(DISTINCT o_custkey)

顧客トランザクションの品質を評価するのに役立つ顧客価値メトリクス。

測定基準: 未決済注文の総収益

SUM(o_totalprice) FILTER (WHERE o_orderstatus='O')

未収収益または現在の販売バックログの値。予測とリスク評価に使用されます。

Databricks Assistantに質問する

Databricks Assistant 、メトリクス ビューの定義を開始するのに役立ちます。

  1. クリックスパークル塗りつぶしアイコン。Databricks ワークスペースの右上隅にあるアシスタント アイコンをクリックして、アシスタントを開きます。
  2. 作成するメトリクス ビューの説明を入力します。 アシスタントは、リクエストに一致する SQL DDL を返します。
  3. 提供された SQL をコピーして、 SQL エディターに貼り付けます。次に、 「実行」 をクリックします。
  4. SQL編集するか、メトリクス ビュー エディタを開いて調整を行います。

新しいメトリクス ビューを作成する

次のいずれかの例を使用して、新しいメトリクス ビューを作成します。