今後の予定

今後の Databricks リリースの機能と動作の変更点について説明します。

予測最適化による統計情報管理のデフォルト有効化

1月21日より、 Databricks は予測的最適化を有効にした全アカウントに対して統計管理の有効化を開始します。 統計管理は、書き込み時に統計コレクションを追加し、 Unity Catalog マネージドテーブルのANALYZEコマンドを自動的に実行することにより既存の予測的最適化機能を拡張します。 予測的最適化の詳細については、「 予測的最適化 for Unity Catalog マネージドテーブル」を参照してください。

データセット定義が Delta Live Tables パイプラインから削除された場合の動作の変更

Delta Live Tables の今後のリリースでは、具体化されたビューまたはストリーミング テーブルがパイプラインから削除されたときの動作が変更されます。 この変更により、削除された具体化されたビューまたはストリーミング テーブルは、次回のパイプライン更新の実行時に自動的に削除されなくなります。 代わりに、 DROP MATERIALIZED VIEW コマンドを使用して実体化ビュー (Materialized View) を削除したり、 DROP TABLE コマンドを使用してストリーミング テーブルを削除したりできます。 オブジェクトをドロップした後、パイプライン更新を実行しても、オブジェクトは自動的に回復されません。 同じ定義を持つマテリアライズドビューまたはストリーミングテーブルがパイプラインに再追加されると、新しいオブジェクトが作成されます。 ただし、 UNDROP コマンドを使用してオブジェクトをリカバリーすることはできます。

バリアント型データタイプを操作する際の動作変更

Databricks は、次の演算子と句の一部として実行される比較でバリアントデータ型のフィールドを使用するためのサポートをブロックしています。

  • DISTINCT

  • INTERSECT

  • EXCEPT

  • UNION

  • DISTRIBUTE BY

次の DataFrame 関数についても同じことが言えます。

  • df.dropDuplicates()

  • df.repartition()

Databricks では、これらの演算子と関数は未定義の結果を生成するため、バリアント データ型の比較ではサポートされていません。

これらの式は、Databricks Runtime 16.1 以降でバリアント型を使用するとブロックされます。 メンテナンス リリースは、Databricks Runtime 15.3 以降でのサポートをブロックします。

Databricks ワークロードまたはテーブルで VARIANT の種類を使用する場合は、次の推奨されるアクションを実行します。

  1. リストされている演算子のいずれかでバリアントを使用するクエリを見つけます。

  2. これらのクエリは、バリアント値をバリアント以外の型に明示的にキャストする推奨パターンを使用して更新します。

次の表に、既存の意図しない機能と推奨される回避策の例を示します。

意図しない使用

推奨される使用方法

SELECT distinct(variant_expr) FROM ...

SELECT distinct(variant_expr?::string) FROM ...

SELECT variant_expr FROM ... EXCEPT SELECT variant_expr FROM ...

SELECT variant_expr?::string FROM ... EXCEPT SELECT variant_expr?::string FROM ...

注:

比較または個別の操作に使用する予定のフィールドについては、Databricks では、これらのフィールドを variant 列から抽出し、非 variant 型を使用して格納することをお勧めします。

バリアント データのクエリを参照してください。追加のサポートやアドバイスが必要な場合は、Databricks アカウント担当者にお問い合わせください。

Databricks Marketplace と Partner Connect UI の更新

Partner ConnectMarketplace を 1 つの Marketplace リンクに統合することで、サイドバーを簡素化しています。新しい Marketplace リンクはサイドバーの上位に表示されます。

Marketplace と Partner Connect。

ipynb ノートブックは、Databricks のデフォルト ノートブック形式になります

現在、Databricks はデフォルトですべての新しいノートブックを "Databricks ソース形式" で作成し、コードのみをキャプチャします。 2025 年 1 月には、新しいデフォルト ノートブック形式が ipynb (.ipynb) になり、ノートブック環境、視覚化定義、ノートブック ウィジェットもキャプチャされます。 この新しいデフォルトは、ワークスペース ユーザーの [設定 ] ウィンドウで変更できます。 ノートブック形式の詳細については、「 ノートブック形式」を参照してください。

ワークスペースDatabricks ファイルは、2025 年 2 月 1 日にすべての ワークスペースで有効になります

Databricks は、2025 年 2 月 1 日にすべてのDatabricksワークスペースに対してワークスペース ファイルを有効にします。この変更により、ワークスペース ユーザーが新しいワークスペース ファイル機能を使用できなくなる。 2025 年 2 月 1 日以降は、ワークスペース機能を有効または無効にするための Databricks REST API で enableWorkspaceFilesystem プロパティを使用してワークスペース ファイルを無効にすることはできません。ワークスペース ファイルの詳細については、「 ワークスペース ファイルとは」を参照してください。

Delta Sharingにおいてテーブルはデフォルトで履歴と共有されます

Databricks 、 Delta Sharing で共有しているテーブルの「デフォルト」の設定を変更する予定です。 以前は、履歴共有はデフォルトで無効になっていました。 テーブル履歴を共有すると、読み取りパフォーマンスが向上し、高度な Delta 最適化が自動的にサポートされます。

すべての新規Databricksアカウントで予測的最適化が有効化されます

11 月 11 日に、Databricks はすべての新しいDatabricks アカウントのデフォルトとして予測的最適化を有効にします。以前は、デフォルトで無効になっており、アカウント管理者が有効にすることができました。 予測的最適化が有効な場合、 Databricks は Unity Catalog マネージドテーブルのメンテナンス操作を自動的に実行します。 予測的最適化の詳細については、Unity Catalog マネージドテーブルに対する予測最適化を参照してください。

ワークフローのサーバレスコンピュートのコストパフォーマンスに対するコントロールを強化してコストを削減

現在サポートされている自動パフォーマンス最適化に加えて、サーバレス ワークフロー最適化機能の強化により、ワークロードをパフォーマンスとコストのどちらに最適化するかをより詳細に制御できるようになります。 詳細については、「 Cost savings on Serverレス コンピュート for ノートブック, Jobs, and パイプライン」を参照してください。

従来のダッシュボード バージョンのサポートの変更

Databricks では、AI/BI ダッシュボード (旧称 Lakeview ダッシュボード) の使用を推奨しています。 以前のバージョンのダッシュボード (以前は Databricks SQL ダッシュボードと呼ばれていました) は、 レガシ ダッシュボードと呼ばれるようになりました。 Databricks では、新しいレガシ ダッシュボードを作成することはお勧めしません。 AI/BI ダッシュボードは、AI 支援オーサリング、ドラフトおよび公開モード、クロスフィルタリングなど、従来のバージョンと比較して改善された機能を提供します。

レガシーダッシュボードのサポート終了タイムライン

  • 2025 年 4 月 7 日: 従来のバージョンのダッシュボードの公式サポートが終了します。 重大なセキュリティ問題とサービスの停止のみが対処されます。

  • 2025 年 11 月 3 日: Databricks は、過去 6 か月間アクセスされていないレガシーダッシュボードのアーカイブを開始します。 アーカイブされたダッシュボードにはアクセスできなくなり、アーカイブプロセスはローリングベースで行われます。 アクティブに使用されているダッシュボードへのアクセスは変更されません。

Databricks は、2025 年 11 月 3 日以降にアクティブなレガシ ダッシュボードの移行計画を策定するために、顧客と協力します。

AI/BI ダッシュボードへの移行を支援するために、アップグレード ツールはユーザー インターフェイスと API の両方で利用できます。 UI で組み込み移行ツールを使用する方法については、 レガシ ダッシュボードをAI/BIダッシュボードに複製 する を参照してください。REST APIを使用してダッシュボードを作成、管理するチュートリアルに関してはダッシュボードの管理でDatabricks APIを使うをご覧ください。

サーバレスコンピュートのワークロード属性の変更

現在、料金利用システム テーブルには、run_asjob_idjob_run_id、および notebook_id の値が null のサーバーレスSKU請求レコードが含まれている可能性があります。 これらのレコードは、特定のワークロードに直接起因しない共有リソースに関連するコストを表します。

コスト報告を簡素化するために、Databricks はまもなくこれらの共有コストを、発生した特定のワークロードに関連付ける予定です。 ワークロード識別子フィールドに null 値を持つ請求レコードは表示されなくなります。 サーバーレス コンピュート の使用量を増やしてワークロードを追加すると、これらの共有コストがより多くのワークロード間で共有されるため、請求書における共有コストの割合が減少します。

サーバレス コンピュートのコストのモニタリングの詳細については、 サーバレス コンピュートのコストの監視を参照してください。

Unity Catalog自己仮定型ではないIAMロールを使用するストレージ認証情報のサポートをまもなく終了します。

2024 年 9 月 20 日以降、 Databricks では、新しいストレージ資格情報の AWS IAMロールが自己仮定である必要があります。 2025 年 1 月 20 日に、Databricks は既存のすべてのストレージ資格情報にこの要件を適用します。 この要件に違反するストレージ資格情報は機能しなくなり、依存するワークロードとジョブが失敗する可能性があります。 この要件の詳細と、ストレージの資格情報を確認および更新する方法については、自己引き受けロールの適用ポリシーを参照してください。

監査ログの sourceIpAddress フィールドにポート番号が含まれなくなります

バグにより、特定の認証および認証監査ログには、 sourceIPAddress フィールドに IP に加えてポート番号が含まれます (例: "sourceIPAddress":"10.2.91.100:0")。 0として記録されるポート番号は実際の値を提供しず、Databricks 監査ログの残りの部分と一致しません。 監査ログの一貫性を高めるために、Databricks はこれらの監査ログ イベントの IP アドレスの形式を変更する予定です。 この変更は、2024 年 8 月上旬から段階的に展開されます。

監査ログに0.0.0.0sourceIpAddressが含まれている場合、Databricks はログ記録を停止する可能性があります。

従来の Git 統合は 1 月 31 日にサポート終了

2024 年 1 月 31 日以降、Databricks は従来のノートブック Git 統合を削除します。 この機能は 2 年以上にわたってレガシー ステータスになっており、2023 年 11 月から製品 UI に非推奨の通知が表示されています。

従来の Git 統合から Databricks Git フォルダー (旧称 Repos) への移行の詳細については、 「従来の Git 統合から Databricks Repos への切り替え」を参照してください。 この削除が影響し、拡張機能が必要な場合は、Databricks アカウント チームにお問い合わせください。

外部サポートチケットの送信はまもなく廃止されます

Databricks は、サポート チケットの送信エクスペリエンスをhelp.databricks.comから Databricks ワークスペースのヘルプ メニューに移行しています。 help.databricks.com によるサポート チケットの送信は、まもなく廃止されます。チケットの表示とトリアージは、引き続き help.databricks.comで行うことができます。

組織が Databricks サポート契約を結んでいる場合に利用できる製品内エクスペリエンスは、Databricks Assistant と統合され、チケットを送信しなくても問題に迅速に対処できます。

製品内エクスペリエンスにアクセスするには、ワークスペースの上部バーにあるユーザー アイコンをクリックし、 サポートに問い合わせ をクリックするか、アシスタントに「ヘルプが必要です」と入力します。

サポートに問い合わせ モーダルが開きます。

サポート問い合わせモーダル

製品内エクスペリエンスがダウンしている場合は、問題に関する詳細情報を含むサポートの要求を help@databricks に送信してくださいcomです。 詳細については、「 ヘルプ」を参照してください

JDK8 および JDK11 はサポートされません

Databricks は、Spark 4.0 のリリース時に、次のメジャー Databricks Runtime バージョンで JDK 8 のサポートを削除する予定です。 Databricks は、Databricks Runtime 14.x の次の LTS バージョンで JDK 11 のサポートを削除する予定です。

新しいワークスペース の Unity Catalog の自動有効化

Databricks は、新しいワークスペースに対して Unity Catalog を自動的に有効にし始めました。 これにより、ワークスペースの作成後にアカウント管理者が Unity Catalog を構成する必要がなくなります。 ロールアウトはアカウント間で段階的に進行しています。

sqlite-jdbcのアップグレード

Databricks Runtimeは、すべてのDatabricks Runtimeメンテナンスリリースでsqlite-jdbcバージョンを3.8.11.2から3.42.0.0にアップグレードする予定です。バージョン3.42.0.0のAPIは、3.8.11.2との互換性が完全ではありません。バージョン3.42.0.0を使用しているメソッドと戻り値の型を確認してください。

コードでsqlite-jdbcを使用している場合は、sqlite-jdbcの互換性レポートを確認してください。