課金利用ログスキーマ (レガシー)

この記事には、すべての製品の使用状況が記録されるわけではない、従来の使用状況ログに関する詳細が含まれています。 Databricks では、完全な使用状況データにアクセスしてクエリを実行するには、課金利用システム テーブルを使用することをお勧めします。

この記事では、アカウントコンソールからダウンロードした利用ログデータの見方と分析方法について説明します。

課金利用は、アカウント コンソールで直接、または アカウントAPIを使用して表示およびダウンロードできます。

CSVファイルのスキーマ

タイプ

説明

workspaceId

string

ワークスペースのID。

1234567890123456

timestamp

datetime

提供された利用時間の終了時刻。

2019-02-22T09:59:59.999Z

ClusterID

string

クラスター(クラスターの場合)またはウェアハウス(SQL ウェアハウスの場合)のID

クラスターの例: 0406-020048-brawl507

SQLウェアハウスの例: 8e00f0c8b392983e

clusterName

string

クラスター/ウェアハウスのユーザー指定の名前。

Shared Autoscaling

clusterNodeType

string

クラスター/ウェアハウスのインスタンスタイプ。

クラスターの例: m4.16xlarge

SQLウェアハウスの例: db.xlarge

clusterOwnerUserId

string

クラスター/ウェアハウスを作成したユーザーのID。

12345678901234

clusterCustomTags

string(「"」がエスケープされたJSON)

この時間にクラスター/ウェアハウスに関連付けられたカスタムタグ。

"{""dept"":""mktg"",""op_phase"":""dev""}"

sku

string

課金 SKU。 値の一覧については、 課金 SKU の表 を参照してください。

STANDARD_ALL_PURPOSE_COMPUTE

dbus

double

この時間にユーザーが使用したDBU数。

1.2345

machineHours

double

クラスター/ウェアハウス内のすべてのコンテナで使用されたマシン時間の合計。

12.345

clusterOwnerUserName

string

クラスター/ウェアハウスを作成したユーザーのユーザー名(Eメールアドレス)。

user@yourcompany.com

tags

string(「"」がエスケープされたJSON)

この時間中にクラスターに関連付けられたデフォルトおよびカスタムのインスタンス プール タグ (該当する場合)。 「クラスタータグ」「ウェアハウスタグ」 、および「プールタグ」を参照してください。 これは、 clusterCustomTags 列のスーパーセットです。

"{""dept"":""mktg"",""op_phase"":""dev"", ""Vendor"":""Databricks"", ""ClusterId"":""0405-020048-brawl507"", ""Creator"":""user@yourcompany.com""}"

請求SKU

  • AWS_ENHANCED_SECURITY_AND_COMPLIANCE

  • ENTERPRISE_ALL_PURPOSE_COMPUTE

  • ENTERPRISE_ALL_PURPOSE_COMPUTE_(PHOTON)

  • ENTERPRISE_DLT_CORE_COMPUTE

  • ENTERPRISE_DLT_CORE_COMPUTE_(PHOTON)

  • ENTERPRISE_DLT_PRO_COMPUTE

  • ENTERPRISE_DLT_PRO_COMPUTE_(PHOTON)

  • ENTERPRISE_DLT_ADVANCED_COMPUTE

  • ENTERPRISE_DLT_ADVANCED_COMPUTE_(PHOTON)

  • ENTERPRISE_JOBS_COMPUTE

  • ENTERPRISE_JOBS_COMPUTE_(PHOTON)

  • ENTERPRISE_JOBS_LIGHT_COMPUTE

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_US_EAST_N_VIRGINIA

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_US_EAST_OHIO

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_US_WEST_OREGON

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_CANADA

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_EUROPE_IRELAND

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_EUROPE_FRANKFURT

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_AP_SINGAPORE

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_AP_SYDNEY

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_US_EAST_N_VIRGINIA

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_US_EAST_OHIO

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_US_WEST_OREGON

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_CANADA

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_EUROPE_IRELAND

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_EUROPE_FRANKFURT

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_AP_SINGAPORE

  • ENTERPRISE_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_AP_SYDNEY

  • ENTERPRISE_SERVERLESS_SQL_COMPUTE_US_EAST_N_VIRGINIA

  • ENTERPRISE_SERVERLESS_SQL_COMPUTE_US_WEST_OREGON

  • ENTERPRISE_SERVERLESS_SQL_COMPUTE_EUROPE_IRELAND

  • ENTERPRISE_SERVERLESS_SQL_COMPUTE_AP_SYDNEY

  • ENTERPRISE_SQL_COMPUTE

  • ENTERPRISE_SQL_PRO_COMPUTE_US_EAST_N_VIRGINIA

  • ENTERPRISE_SQL_PRO_COMPUTE_US_EAST_OHIO

  • ENTERPRISE_SQL_PRO_COMPUTE_US_WEST_OREGON

  • ENTERPRISE_SQL_PRO_COMPUTE_US_WEST_CALIFORNIA

  • ENTERPRISE_SQL_PRO_COMPUTE_CANADA

  • ENTERPRISE_SQL_PRO_COMPUTE_SA_BRAZIL

  • ENTERPRISE_SQL_PRO_COMPUTE_EUROPE_IRELAND

  • ENTERPRISE_SQL_PRO_COMPUTE_EUROPE_FRANKFURT

  • ENTERPRISE_SQL_PRO_COMPUTE_EUROPE_LONDON

  • ENTERPRISE_SQL_PRO_COMPUTE_EUROPE_FRANCE

  • ENTERPRISE_SQL_PRO_COMPUTE_AP_SYDNEY

  • ENTERPRISE_SQL_PRO_COMPUTE_AP_MUMBAI

  • ENTERPRISE_SQL_PRO_COMPUTE_AP_SINGAPORE

  • ENTERPRISE_SQL_PRO_COMPUTE_AP_TOKYO

  • ENTERPRISE_SQL_PRO_COMPUTE_AP_SEOUL

  • PREMIUM_ALL_PURPOSE_COMPUTE

  • PREMIUM_ALL_PURPOSE_COMPUTE_(PHOTON)

  • PREMIUM_DLT_CORE_COMPUTE

  • PREMIUM_DLT_CORE_COMPUTE_(PHOTON)

  • PREMIUM_DLT_PRO_COMPUTE

  • PREMIUM_DLT_PRO_COMPUTE_(PHOTON)

  • PREMIUM_DLT_ADVANCED_COMPUTE

  • PREMIUM_DLT_ADVANCED_COMPUTE_(PHOTON)

  • PREMIUM_JOBS_COMPUTE

  • PREMIUM_JOBS_COMPUTE_(PHOTON)

  • PREMIUM_JOBS_LIGHT_COMPUTE

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_US_EAST_N_VIRGINIA

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_US_EAST_OHIO

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_US_WEST_OREGON

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_CANADA

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_EUROPE_IRELAND

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_EUROPE_FRANKFURT

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_AP_SINGAPORE

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_AP_SYDNEY

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_US_EAST_N_VIRGINIA

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_US_EAST_OHIO

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_US_WEST_OREGON

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_CANADA

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_EUROPE_IRELAND

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_EUROPE_FRANKFURT

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_AP_SINGAPORE

  • PREMIUM_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_AP_SYDNEY

  • PREMIUM_SERVERLESS_SQL_COMPUTE_US_EAST_N_VIRGINIA

  • PREMIUM_SERVERLESS_SQL_COMPUTE_US_WEST_OREGON

  • PREMIUM_SERVERLESS_SQL_COMPUTE_EUROPE_FRANKFURT

  • PREMIUM_SERVERLESS_SQL_COMPUTE_EUROPE_IRELAND

  • PREMIUM_SERVERLESS_SQL_COMPUTE_AP_SYDNEY

  • PREMIUM_SQL_COMPUTE

  • PREMIUM_SQL_PRO_COMPUTE_US_EAST_N_VIRGINIA

  • PREMIUM_SQL_PRO_COMPUTE_US_EAST_OHIO

  • PREMIUM_SQL_PRO_COMPUTE_US_WEST_OREGON

  • PREMIUM_SQL_PRO_COMPUTE_US_WEST_CALIFORNIA

  • PREMIUM_SQL_PRO_COMPUTE_CANADA

  • PREMIUM_SQL_PRO_COMPUTE_SA_BRAZIL

  • PREMIUM_SQL_PRO_COMPUTE_EUROPE_IRELAND

  • PREMIUM_SQL_PRO_COMPUTE_EUROPE_FRANKFURT

  • PREMIUM_SQL_PRO_COMPUTE_EUROPE_LONDON

  • PREMIUM_SQL_PRO_COMPUTE_EUROPE_FRANCE

  • PREMIUM_SQL_PRO_COMPUTE_AP_SYDNEY

  • PREMIUM_SQL_PRO_COMPUTE_AP_MUMBAI

  • PREMIUM_SQL_PRO_COMPUTE_AP_SINGAPORE

  • PREMIUM_SQL_PRO_COMPUTE_AP_TOKYO

  • PREMIUM_SQL_PRO_COMPUTE_AP_SEOUL

  • STANDARD_ALL_PURPOSE_COMPUTE

  • STANDARD_ALL_PURPOSE_COMPUTE_(PHOTON)

  • STANDARD_DLT_CORE_COMPUTE

  • STANDARD_DLT_CORE_COMPUTE_(PHOTON)

  • STANDARD_DLT_PRO_COMPUTE

  • STANDARD_DLT_PRO_COMPUTE_(PHOTON)

  • STANDARD_DLT_ADVANCED_COMPUTE

  • STANDARD_DLT_ADVANCED_COMPUTE_(PHOTON)

  • STANDARD_JOBS_COMPUTE

  • STANDARD_JOBS_COMPUTE_(PHOTON)

  • STANDARD_JOBS_LIGHT_COMPUTE

非推奨SKU

以下のSKUは非推奨になりました。

非推奨のSKU名

非推奨になった日

代替SKU

LIGHT_AUTOMATED_NON_OPSEC LIGHT_AUTOMATED_OPSEC

2020年3月

STANDARD_JOBS_LIGHT_COMPUTE PREMIUM_JOBS_LIGHT_COMPUTE ENTERPRISE_JOBS_LIGHT_COMPUTE

STANDARD_AUTOMATED_NON_OPSEC STANDARD_AUTOMATED_OPSEC

2020年3月

STANDARD_JOBS_COMPUTE PREMIUM_JOBS_COMPUTE ENTERPRISE_JOBS_COMPUTE

STANDARD_INTERACTIVE_NON_OPSEC STANDARD_INTERACTIVE_OPSEC

2020年3月

STANDARD_ALL_PURPOSE_COMPUTE PREMIUM_ALL_PURPOSE_COMPUTE ENTERPRISE_ALL_PURPOSE_COMPUTE

ENTERPRISE_ALL_PURPOSE_COMPUTE_(DLT) PREMIUM_ALL_PURPOSE_COMPUTE_(DLT) STANDARD_ALL_PURPOSE_COMPUTE_(DLT)

2022年4月

ENTERPRISE_DLT_CORE_COMPUTE PREMIUM_DLT_CORE_COMPUTE STANDARD_DLT_CORE_COMPUTE

ENTERPRISE_SERVERLESS_SQL_COMPUTE PREMIUM_SERVERLESS_SQL_COMPUTE STANDARD_SERVERLESS_SQL_COMPUTE

2022年6月

ENTERPRISE_SERVERLESS_SQL_COMPUTE_US_EAST_N_VIRGINIA ENTERPRISE_SERVERLESS_SQL_COMPUTE_US_WEST_OREGON ENTERPRISE_SERVERLESS_SQL_COMPUTE_EUROPE_IRELAND ENTERPRISE_SERVERLESS_SQL_COMPUTE_AP_SYDNEY PREMIUM_SERVERLESS_SQL_COMPUTE_US_EAST_N_VIRGINIA PREMIUM_SERVERLESS_SQL_COMPUTE_US_WEST_OREGON PREMIUM_SERVERLESS_SQL_COMPUTE_EUROPE_IRELAND PREMIUM_SERVERLESS_SQL_COMPUTE_AP_SYDNEY

Databricksで使用状況データを分析する

このセクションでは、請求対象使用量CSVファイルのデータをDatabricksで分析用に利用できるようにする方法について説明します。

CSVファイルでは市販の表計算アプリケーションの標準的な形式が使用されていますが、Apache Sparkで読み込むには修正が必要です。Databricksで使用状況テーブルを作成するときは、option("escape", "\"")を使用する必要があります。

合計DBUは、dbus列の合計です。

テーブル作成UIを使用してログをインポートする

データ追加UIを使用してデータを読み込むと、CSVファイルをDatabricksにインポートして分析できます。

Spark DataFrameを作成する

以下のコードを使用して、CSVファイルへのパスから使用状況テーブルを作成することもできます。

df = (spark.
      read.
      option("header", "true").
      option("inferSchema", "true").
      option("escape", "\"").
      csv("/FileStore/tables/usage_data.csv"))

df.createOrReplaceTempView("usage")

ファイルがS3バケットに保存されていて、たとえばログ配信で使用される場合、コードは以下のようになります。ファイルパスまたはディレクトリを指定できます。ディレクトリを指定すると、すべてのファイルがインポートされます。以下の例では、ファイルを指定しています。

df = (spark.
      read.
      option("header", "true").
      option("inferSchema", "true").
      option("escape", "\"").
      load("s3://<bucketname>/<pathprefix>/billable-usage/csv/workspaceId=<workspace-id>-usageMonth=<month>.csv"))

df.createOrReplaceTempView("usage")

以下の例では、課金利用ファイルのディレクトリをインポートしています。

df = (spark.
      read.
      option("header", "true").
      option("inferSchema", "true").
      option("escape", "\"").
      load("s3://<bucketname>/<pathprefix>/billable-usage/csv/"))

df.createOrReplaceTempView("usage")

Deltaテーブルを作成する

前述の例のDataFrame(df)からDeltaテーブルを作成するには、以下のコードを使用します。

(df.write
    .format("delta")
    .mode("overwrite")
    .saveAsTable("database_name.table_name")
)

警告

保存されたDeltaテーブルは、新しいCSVファイルを追加または置換しても自動的には更新されません。最新のデータが必要な場合は、Deltaテーブルを使用する前にこれらのコマンドを再実行してください。

使用状況分析ダッシュボードノートブック

課金利用配信を使用している場合、CSVファイルが保存されているS3バケットへのパスを指定し、ウィジェットにレポートパラメーターを入力することで、以下のノートブックを使用して使用状況分析ダッシュボードを実行できます。

レポートパラメーターの入力に使用するウィジェットは、ノートブックをDatabricksワークスペースにインポートするときに、最初のノートブックセルの上に表示されます。ウィジェットは、ノートブックのブラウザ専用ビューには表示されません。以下はウィジェットの画像です。

使用状況ダッシュボードウィジェット

使用状況分析ダッシュボードノートブック

ノートブックを新しいタブで開く