レイクハウス リアルタイム
ベータ版
この機能はベータ版です。アカウントでこの機能を有効にするには、Databricksアカウントチームにお問い合わせください。
レイクハウス//RTは現在、積極的に開発中です。パフォーマンス特性とサポートされる機能セットは、一般提供前に変更される可能性があります。
Lakehouse Real-Time (Lakehouse//RT) は、カスタムアプリケーションへの分析データの提供、運用アナリティクスの実行、数百から数千の同時実行ユーザーに対してミリ秒以下の応答時間が必要な BI ダッシュボードの強化など、低レイテンシーで高同時実行性が求められるユースケース向けに構築されたサーバレス コンピュートです。
レイクハウス//RT は、クラウドストレージにある Delta Lake または Apache Iceberg 形式を使用する Unity Catalog テーブルに対する SQL 読み取りクエリで、ミリ秒以下の遅延を提供します。レイクハウス//RT は、他の SQLウェアハウス と同様に、作成および管理します。ワークスペース管理者または特権ユーザーがワークスペースごとに1つ以上作成し、ユーザーに権限を割り当てます。
要件
Lakehouse//RTを使用するには、次の操作を行う必要があります。
- サポートされているリージョンをご利用ください。
- ワークスペースでレイクハウス//RT ベータを有効にしてください。
ワークスペースでレイクハウス//RTを有効にします
ワークスペース管理者は、ワークスペースでレイクハウス//RT Betaを有効にできます:
- ワークスペースのメニュー(右上隅)で、 プレビュー を選択します。
- レイクハウス RT を検索します。
- プレビューを有効にします。
プレビューを有効にすると、ワークスペースのSQLウェアハウス作成フローで リアルタイム ウェアハウスタイプが利用可能になります。
レイクハウスウェアハウスの作成
レイクハウス/RTウェアハウスを作成するには:
- 「コンピュート」 > 「SQL ウェアハウス」 > 「SQL ウェアハウスを作成」 をクリックします。
- Select リアルタイム .
- サイズを選択してください:**小**、**中**、**大**、または **X-Large** (クエリに必要なパフォーマンスに応じて)。
- ウェアハウスの名前を入力します。
- 作成 をクリックします。
権限を割り当てるには、SQLウェアハウスと同様に、ユーザーとグループに 使用可能 、 監視可能 、または 管理可能 を付与します。
現在、既存のSQLウェアハウスをレイクハウス//RTにアップグレードしたり、既存のレイクハウス//RTウェアハウスを別のウェアハウスタイプにダウングレードしたりすることはできません。
レイクハウス//RTアクティビティを監視する
Lakehouse//RT クエリは、SQLウェアハウスで実行される任意のクエリと同じように監視できます。
- クエリ履歴: レイクハウス//RTクエリは、「クエリ履歴 UI」および「クエリ履歴システムテーブル」に表示されます。
- クエリ プロファイル: クエリ履歴 UI でレイクハウス//RT クエリを開いて、そのクエリ プロファイルを表示できます。
- モニタリング ページ: 各レイクハウスまたはRTウェアハウスのクエリのスループット、キューに入っているクエリ、クエリ履歴をモニタリングページで確認します。
- 請求:レイクハウス//RT の使用量は、請求システムテーブルに
sku_nameというLakehouse_Serverlessで表示されます。
ベストプラクティス
レイクハウス//RTから最高の結果を得るには、ワークロードを移行する前に準備してください。
- サーバレスSQLを最初に検証する。 サーバレス SQLウェアハウスでクエリを実行し、数秒で実行されることを確認してください。
- Unity Catalog マネージドテーブルを使用します。 予測的最適化とリキッドクラスタリングを備えたマネージドテーブルは、ワークロードパターンに合わせてデータが適切にクラスタリングされることを保証します。
- クエリの選択性を確認します。 1秒以内のレイテンシを実現するには、クエリがスキャンするデータ量が少ないことを確認してください。
WHERE句で早めにフィルタリングを行い、必要な列のみを選択し、集計を活用してください。テーブル間の結合はサポートされていますが、クエリが複雑になったり、処理が遅くなったりする場合は、より速い待機時間のためにデータを事前に集計するマテリアライズドビューの使用を検討してください。 - SQLカバレッジを確認してください。 レイクハウス//RT は ANSI 準拠の読み取りクエリのみをサポートしています。ワークロードがANSI 準拠であることを確認し、制限事項に記載されているサポートされていないステートメント、関数、およびデータ型を避けてください。
サポートされている機能
ツールとインターフェース
以下のDatabricks機能のいずれかで、コンピュートピッカーからレイクハウス//RTを選択できます。
- SQLエディタ
- SQL ノートブック
- AI/BIダッシュボード
- カタログエクスプローラー
- アラート
テーブルタイプ
レイクハウス//RT は Unity Catalog データのみを照会します。最高のパフォーマンスを得るには、低遅延に必要なデータレイアウトをエンジンに提供するUnity Catalogのマネージドテーブルを使用してください。
レイクハウス//RTは以下のテーブルタイプをサポートしています:
- マネージドテーブル(Delta Lake および Apache Iceberg テーブル)
- マテリアライズドビュー と ストリーミングテーブル
- メトリクスビュー
接続性
レイクハウス//RT は、Statement Execution APIを使用する接続のみを受け入れます。レガシーなThriftプロトコルをサポートしていないため、Statement Execution API を明示的に使用せずに接続するドライバーは501エラーを受け取ります。
「Lakehouse//RT」ウェアハウスには、以下の方法で接続できます。
- ステートメント実行 API: 外部アプリケーションから API を直接呼び出します。ステートメント実行 API:ウェアハウスで SQL を実行を参照してください。
- Databricks SQL ドライバー: Statement Execution APIを使用するように構成すると、次のドライバーが接続できます。ドライバーの HTTP パスをレイクハウス//RT ウェアハウスに指定し、次のオプションを設定します:
- Databricks SQL Connector for Python:
use_kernel=Trueを設定します。 - Databricks SQL Driver for Node.js:
useKernel: trueを設定します。 - JDBC:
UseThriftClient=0接続URLで を設定してください。
- Databricks SQL Connector for Python:
価格
価格情報については、レイクハウス リアルタイム価格ページを参照してください。
制限事項:
クエリがサポートされていない機能を使用すると、レイクハウス//RT はその機能の名前を示すエラーを返します。クエリを正常に実行するには、サーバレスSQLウェアハウスを使用してください。
ツールと機能
レイクハウス//RT は、以下の機能をサポートしていません。
- Genie
- Genieスペース
- ジョブタスク
テーブルタイプ
ベータ期間中、次のテーブルの種類はサポートされていません。
- システムテーブル
- Delta Sharing テーブル
- Unity Catalog デフォルトストレージのテーブル
- Unity Catalog 外部テーブル
レイクハウス//RT は以下のテーブルタイプをサポートしていません。
- Hive metastore テーブル(マネージドまたは外部)
- フォーリンテーブルとクエリフェデレーション(レイクハウスフェデレーション)
- 一時テーブル
- 他のデータ形式(CSV、JSON、Avro、Parquet、ORC、およびテキスト)を使用するテーブル
ドライバーとコネクタ
レイクハウス//RTは、次のドライバーとコネクタをサポートしていません。
- ADBC
- ODBC
- Go
SQL言語
Lakehouse//RT は、ANSIモードでのみSQL読み取りクエリを実行します。
レイクハウス//RTは、次のものはサポートされていません。
- データ型:
GEOGRAPHYおよびGEOMETRYのデータ型です。 - 機能: AI 関数、Python UDF、空間 SQL 関数、XPath 関数および XML 関数。
- ガバナンス:属性ベースのアクセス制御(ABAC)、行レベルセキュリティと列マスキングを含む。
レイクハウス//RT は読み取り (SELECT) クエリ専用です。「Write」コマンドおよびETLコマンドはサポートされていません:
- 書き込み操作:
INSERT、UPDATE、DELETE、MERGE、およびCREATE TABLE AS SELECT(CTAS)。 - 「DDL」:オブジェクトを作成または変更する、
CREATE、ALTER、DROP、およびその他のステートメントです。 - セキュリティステートメント:
GRANTおよびREVOKE。 - スクリプト、ストアドプロシージャ、一時テーブル、およびマルチステートメントトランザクション。
- Delta Lake のメンテナンス:
OPTIMIZE、ANALYZE、VACUUM、およびREFRESH。
ネットワークセキュリティ
Lakehouse//RT は以下のネットワーク設定ではサポートされていません。
コンプライアンス
コンプライアンスセキュリティプロファイルはサポートされていません。
既知の問題
- レイクハウス//RTは、他のSQLウェアハウスタイプよりも厳密なSQLタイプチェックを適用します。文字列と数値の比較や、互換性のない型を持つ
COALESCEの使用など、型を混在させるクエリは、動作が異なるか失敗する可能性があります。予期せぬ結果を避けるために、明示的なCAST式を使用してください。