メインコンテンツまでスキップ

Unity Catalog要件と制限

このページでは、 Unity Catalogのコンピュート要件、サポートされているファイル形式、命名規則、既知の制限事項について説明します。

地域サポート

すべてのリージョンで Unity Catalog がサポートされています。 詳細については、「 Databricks のクラウドとリージョン」を参照してください。

コンピュート要件

Unity Catalogは、Databricks Runtime 11.3LTS 以降が実行されるクラスターでサポートされています。Unity Catalog は、すべての SQLウェアハウス コンピュート バージョンでデフォルトによってサポートされています。

以前のバージョンの Databricks Runtime で実行されているクラスターでは、 Unity Catalog GA のすべての機能がサポートされているわけではありません。

Unity Catalogでデータにアクセスするには、クラスターを正しい アクセス・モードで 構成する必要があります。Unity Catalog はデフォルトによって保護されています。 クラスターが標準アクセスモードまたは専用アクセスモードで設定されていない場合、クラスターは Unity Catalog内のデータにアクセスできません。 アクセスモードを参照してください。

それぞれのDatabricks Runtime バージョンにおけるUnity Catalog機能の変更点の詳細については、リリースノート を参照してください。

ファイル形式のサポート

Unity Catalogでは、次のテーブル形式がサポートされています。

セキュリティ保護可能なオブジェクト命名要件

Unity Catalog内のすべてのオブジェクト名には、以下の制限が適用されます。

  • オブジェクト名は255文字を超えることはできません。

  • 以下の特殊文字は使用できません。

    • 期間( .
    • スペース( )
    • スラッシュ( /
    • すべてのASCII制御文字(16進数で00~1F)
    • DELETE文字(16進数7F)
  • Unity Catalogすべてのオブジェクト名を小文字で保存します。

  • SQL で UC 名を参照する場合、ハイフン ( - ) などの特殊文字を含む名前をエスケープするためにバッククォートを使用する必要があります。

注記

列名には特殊文字を使用できますが、特殊文字を使用する場合は、すべてのSQL文で列名をバッククォートでエスケープする必要があります。Unity Catalogは列名の大文字小文字を保持しますが、Unity Catalogテーブルに対するクエリは大文字小文字を区別しません。

制限事項

Unity Catalogには以下の制限事項があります。これらの一部は、古いDatabricks Runtimeバージョンとコンピュート アクセス モードに固有のものです。

構造化ストリーミングワークロードには、Databricks Runtimeとアクセスモードに応じて、追加の制限事項があります。「標準コンピュートの要件と制限」および「専用コンピュートの要件と制限」を参照してください。

Databricksは、このリストを定期的に縮小する新機能をリリースしています。

  • ワークスペースで以前に作成されたグループ (つまり、ワークスペース レベルのグループ) は、 Unity Catalog GRANTステートメントでは使用できません。 これは、複数のワークスペースにまたがるグループについても、一貫した表示を確保するためです。GRANTステートメントでグループを使用するには、アカウント レベルでグループを作成し、ワークスペース エンドポイントではなくアカウント エンドポイントを参照するようにプリンシパルまたはグループ管理の自動化 ( SCIM 、 Okta およびMicrosoft Entra ID コネクタ、 Terraformなど) を更新します。 グループソースを参照してください。

  • R のワークロードはDatabricks Runtime 15.3 以前を実行しているコンピュートでは、行レベルまたは列レベルのセキュリティのための動的ビューの使用をサポートしていません。

    • 動的ビューをクエリする R のワークロードには、 Databricks Runtime 15.4 LTS以降を実行する専用のコンピュート リソースを使用します。 このようなワークロードには、サーバレス コンピュートが有効になっているワークスペースも必要です。 詳細については、 「専用コンピュートでのきめ細かいアクセス制御」を参照してください。
  • マネージドテーブルは、 Databricks Runtime 13.3 LTS以降で別のマネージドテーブルにシャロークローンできます。 Databricks Runtime 14.2以降では、外部テーブルを別の外部テーブルにシャロークローンすることができます。マネージドテーブルを外部テーブルにシャロークローンすることはできません。 また、外部テーブルをマネージドテーブルにシャロークローンすることはできません。 詳細については、 Unity Catalogテーブルのシャローク ローン」を参照してください。

  • バケット化は、Unity Catalogテーブルではサポートされません。Unity Catalogでバケットテーブルを作成しようとするコマンドを実行すると、例外がスローされます。

  • 一部のクラスターのみがUnity Catalogにアクセスし、他のクラスターがアクセスしない場合、複数のリージョンのワークスペースから同じパスまたはDelta Lakeテーブルに書き込むと、パフォーマンスの信頼性が低下する可能性があります。

  • ALTER TABLE ADD PARTITIONのようなコマンドを使用して外部テーブルのパーティションを操作するには、パーティションメタデータのログ記録を有効にする必要があります。外部テーブルのパーティション検出を参照してください。

  • Delta形式ではないテーブルに対して上書きモードを使用する場合、ユーザーは親スキーマに対するCREATE TABLE権限を持ち、かつ既存オブジェクトの所有者であるか、またはオブジェクトに対するMODIFY権限を持っている必要があります。

  • Python UDFは、Databricks Runtime 12.2 LTS以前のバージョンではサポートされていません。これには、 UDAFs 、UDTF、およびSpark上のPandas ( applyInPandasおよびmapInPandas ) が含まれます。 PythonのスカラーUDFは、Databricks Runtime 13.3 LTS以降でサポートされています。

  • Scala UDFは、標準アクセスモードのコンピュート環境において、Databricks Runtime 14.1以前のバージョンではサポートされていません。スカラーUDFは、標準アクセスモードのコンピュート環境において、Databricks Runtime 14.2以降でサポートされています。

  • 標準のScalaスレッドプールはサポートされていません。代わりに、org.apache.spark.util.ThreadUtilsの特殊なスレッドプール(org.apache.spark.util.ThreadUtils.newDaemonFixedThreadPoolなど)を使用します。ただし、ThreadUtilsのスレッドプール(ThreadUtils.newForkJoinPoolおよびScheduledExecutorServiceスレッドプール)はサポートされません。

Unity Catalogに登録されたモデルには、追加の制限事項があります。 制限事項を参照してください。

リソース割り当て

Unity Catalogは、セキュリティ保護可能なすべてのオブジェクトに対してリソース割り当て量を強制します。これらの割り当て量は「リソース制限」に記載されています。これらのリソース制限を超えることが予想される場合は、Databricksのアカウントチームにご連絡ください。

クォータの使用状況は、 Unity Catalog リソース クォータ APIを使用して監視できます。 「Unity Catalog のリソース クォータの使用状況を監視する」を参照してください。