LIVEスキーマ（レガシー）

LIVE仮想スキーマは、パイプライン内でデータセットを参照するために従来の公開モードで使用される非推奨のパイプライン機能です。

このモードで作成されたパイプラインでは、従来の公開モードとLIVE仮想スキーマを引き続き使用できます。

Databricks では、すべてのパイプラインを新しい公開モードに移行することをお勧めします。移行には 2 つの選択肢があります。

テーブル (マテリアライズドビューとストリーミングテーブルを含む) を従来のパイプラインから、デフォルト公開モードを使用するパイプラインに移動します。パイプライン間でテーブルを移動する方法の詳細については、「パイプライン間でのテーブルの移動」を参照してください。
現在従来の公開モードを使用しているパイプラインでデフォルトの公開モードを有効にします。「パイプラインでデフォルトの公開モードを有効にする」を参照してください。

どちらの方法も一方向の移行です。テーブルをレガシーモードに戻すことはできません。

レガシーLIVE仮想スキーマおよびレガシー公開モードのサポートは、Databricksの将来のバージョンで削除が予定されています。

注記

レガシー公開モードのパイプラインは、パイプライン設定 UI の概要フィールドに示されています。

パイプライン構成 UI を使用して、レガシー公開モードで新しいパイプラインを作成することはできません。従来のLIVE構文を使用して新しいパイプラインをデプロイする必要がある場合は、Databricks アカウント担当者にお問い合わせください。

LIVE 仮想スキーマとは何ですか?

注記

LIVE仮想スキーマは、パイプラインのdefault公開モードでデータセットの依存関係を分析するために不要になりました。

LIVE スキーマは、パイプラインで作成または更新されるすべてのデータセットの仮想境界を定義する、パイプラインにおけるプログラミング概念です。設計上、LIVE スキーマは公開されたスキーマのデータセットに直接関連付けられていません。代わりに、LIVE スキーマを使用すると、ユーザーがデータセットをスキーマに公開したくない場合でも、パイプラインにおけるロジックを計画し、ランできます。

レガシー公開モードのパイプラインでは、LIVE キーワードを使用して、現在のパイプライン内の読み取り用の他のデータセットを参照できます。たとえば、SELECT * FROM LIVE.bronze_table です。新しいパイプラインのdefault公開モードでは、この構文は黙って無視されます。つまり、修飾されていない識別子は現在のスキーマを使用します。ターゲットカタログとスキーマの設定を参照してください。

パイプラインの従来の公開モード

LIVE 仮想スキーマは、パイプラインの従来の公開モードで使用されます。2025年2月5日より前に作成されたすべてのテーブルでは、defaultで従来の公開モードが使用されます。

次の表は、レガシー公開モードのパイプラインで作成または更新されたすべてのマテリアライズドビューとストリーミングテーブルの動作を説明しています。

ストレージオプション	保管場所またはカタログ	ターゲットスキーマ	挙動
Hiveメタストア	指定なし	指定なし	データセットのメタデータとデータはDBFSルートに保存されます。 Hive metastoreにデータベースオブジェクトが登録されていません。
Hiveメタストア	クラウドオブジェクトストレージへの URI またはファイルパス。	指定なし	データセットのメタデータとデータは、指定されたストレージの場所に保存されます。Hive metastoreにデータベースオブジェクトが登録されていません。
Hiveメタストア	指定なし	Hive metastore内の既存または新しいスキーマ。	データセットのメタデータとデータはDBFSルートに保存されます。パイプライン内のすべてのマテリアライズドビューとストリーミングテーブルは、 Hive metastore内の指定されたスキーマに公開されます。
Hiveメタストア	クラウドオブジェクトストレージへの URI またはファイルパス。	Hive metastore内の既存または新しいスキーマ。	データセットのメタデータとデータは、指定されたストレージの場所に保存されます。パイプライン内のすべてのマテリアライズドビューとストリーミングテーブルは、 Hive metastore内の指定されたスキーマに公開されます。
Unity Catalog	既存の Unity Catalog カタログ。	指定なし	データセットのメタデータとデータは、ターゲットカタログに関連付けられたデフォルトのストレージの場所に保存されます。Unity Catalogにデータベースオブジェクトが登録されていません。
Unity Catalog	既存の Unity Catalog カタログ。	Unity Catalog内の既存または新しいスキーマ。	データセットのメタデータとデータは、ターゲットスキーマまたはカタログに関連付けられたデフォルトのストレージの場所に保存されます。パイプライン内のすべてのマテリアライズドビューとストリーミングテーブルは、 Unity Catalogの指定されたスキーマに公開されます。

ストレージオプション	保管場所またはカタログ	ターゲットスキーマ	挙動
Hiveメタストア	指定なし	指定なし	データセットのメタデータとデータはDBFSルートに保存されます。 Hive metastoreにデータベースオブジェクトが登録されていません。
Hiveメタストア	クラウドオブジェクトストレージへの URI またはファイルパス。	指定なし	データセットのメタデータとデータは、指定されたストレージの場所に保存されます。Hive metastoreにデータベースオブジェクトが登録されていません。
Hiveメタストア	指定なし	Hive metastore内の既存または新しいスキーマ。	データセットのメタデータとデータはDBFSルートに保存されます。パイプライン内のすべてのマテリアライズドビューとストリーミングテーブルは、 Hive metastore内の指定されたスキーマに公開されます。
Hiveメタストア	クラウドオブジェクトストレージへの URI またはファイルパス。	Hive metastore内の既存または新しいスキーマ。	データセットのメタデータとデータは、指定されたストレージの場所に保存されます。パイプライン内のすべてのマテリアライズドビューとストリーミングテーブルは、 Hive metastore内の指定されたスキーマに公開されます。
Unity Catalog	既存の Unity Catalog カタログ。	指定なし	データセットのメタデータとデータは、ターゲットカタログに関連付けられたデフォルトのストレージの場所に保存されます。Unity Catalogにデータベースオブジェクトが登録されていません。
Unity Catalog	既存の Unity Catalog カタログ。	Unity Catalog内の既存または新しいスキーマ。	データセットのメタデータとデータは、ターゲットスキーマまたはカタログに関連付けられたデフォルトのストレージの場所に保存されます。パイプライン内のすべてのマテリアライズドビューとストリーミングテーブルは、 Unity Catalogの指定されたスキーマに公開されます。

LIVEスキーマからソースコードを更新する

新しいデフォルトの公開モードで実行するように構成されたパイプラインは、 LIVEスキーマ構文を黙って無視します。デフォルトでは、すべてのテーブル読み取りで、パイプライン構成で指定されたカタログとスキーマが使用されます。

既存のほとんどのパイプラインでは、従来のLIVE仮想スキーマ動作もパイプライン構成で指定されたカタログとスキーマへの読み取りを指示するため、この動作変更は影響しません。

重要

ワークスペースのデフォルトのカタログとスキーマを活用する読み取りを含むレガシーコードでは、コードの更新が必要です。次のマテリアライズドビューの定義を考えてみましょう。

SQL
CREATE MATERIALIZED VIEW silver_table
AS SELECT * FROM raw_data

従来の公開モードでは、 raw_dataテーブルからの非修飾読み取りでは、ワークスペースのデフォルトのカタログとスキーマ (例: main.default.raw_data ) が使用されます。新しいデフォルトのパイプラインモードでは、デフォルトで使用されるカタログとスキーマは、パイプライン構成で構成されたものになります。このコードが期待どおりに動作し続けるようにするには、次の例のように、テーブルの完全修飾識別子を使用するように参照を更新します。

SQL
CREATE MATERIALIZED VIEW silver_table
AS SELECT * FROM main.default.raw_data

Unity Catalogレガシー発行モードパイプラインのイベントログを操作する

重要

event_log TVF は、Unity Catalog にテーブルを公開する従来の公開モードパイプラインで使用できます。新しいパイプラインの動作では、パイプライン用に構成されたターゲットカタログとスキーマにイベントログが公開されます。「イベントログのクエリ」を参照してください。

Hive metastoreで構成されたテーブルも、イベントログのサポートと動作が異なります。「Hive metastoreパイプラインのイベントログを操作する」を参照してください。

パイプラインが従来の公開モードでテーブルを Unity Catalog に公開する場合は、 event_log テーブル値関数 (TVF) を使用してパイプラインのイベントログを取得する必要があります。パイプラインのイベントログを取得するには、パイプライン ID またはテーブル名を TVF に渡します。たとえば、ID 04c78631-3dd7-4856-b2a6-7d84e9b2638bのパイプラインのイベントログレコードを取得するには、次のようにします。

SQL
SELECT * FROM event_log("04c78631-3dd7-4856-b2a6-7d84e9b2638b")

テーブルmy_catalog.my_schema.table1を作成または所有するパイプラインのイベントログレコードを取得するには:

SQL
SELECT * FROM event_log(TABLE(my_catalog.my_schema.table1))

TVF を呼び出すには、共有クラスターまたはSQLウェアハウスを使用する必要があります。たとえば、 SQLウェアハウスに接続されたSQLエディターを使用できます。

パイプラインのイベントのクエリを簡素化するために、パイプラインの所有者はevent_log TVF 上にビューを作成できます。次の例では、パイプラインのイベントログのビューを作成します。このビューは、この記事に含まれるイベントログクエリの例で使用されます。

注記

event_log TVF はパイプライン所有者のみが呼び出すことができます。
パイプラインまたはクエリでevent_logテーブル値関数を使用して、複数のパイプラインのイベントログにアクセスすることはできません。
event_logテーブル値関数で作成されたビューを他のユーザーと共有することはできません。

SQL
CREATE VIEW event_log_raw AS SELECT * FROM event_log("<pipeline-ID>");

<pipeline-ID> をパイプラインの一意の識別子に置き換えます。ID は、パイプライン UI の [パイプラインの詳細] ペインで確認できます。

パイプライン実行の各インスタンスは、更新と呼ばれます。多くの場合、最新の更新プログラムの情報を抽出したい場合があります。次のクエリを実行して、最新の更新プログラムの識別子を検索し、 latest_update_id 一時ビューに保存します。このビューは、この記事に含まれるイベントログクエリの例で使用されます。

SQL
CREATE OR REPLACE TEMP VIEW latest_update AS SELECT origin.update_id AS id FROM event_log_raw WHERE event_type = 'create_update' ORDER BY timestamp DESC LIMIT 1;

LIVE 仮想スキーマとは何ですか?​

パイプラインの従来の公開モード​

LIVEスキーマからソースコードを更新する​

Unity Catalogレガシー発行モードパイプラインのイベントログを操作する​

LIVE 仮想スキーマとは何ですか?

パイプラインの従来の公開モード

LIVEスキーマからソースコードを更新する

Unity Catalogレガシー発行モードパイプラインのイベントログを操作する