サーバレスコンピュート制限

この記事では、ノートブックとジョブのサーバレス コンピュートの現在の制限について説明します。 まず、最も重要な考慮事項の概要から始め、次に制限事項の包括的な参照リストを示します。

制限事項の概要

新しいワークロードを作成したり、ワークロードをサーバーレス コンピュートに移行する前に、まず次の制限を考慮してください。

  • サポートされている言語は Python と SQL のみです。

  • Spark接続APIsのみがサポートされます。 Spark RDD APIsサポートされていません。

  • JAR ライブラリはサポートされていません。 回避策については、 「サーバレス コンピュートのベスト プラクティス」を参照してください。

  • サーバレス コンピュートは、すべてのワークスペース ユーザーに無制限のアクセス権を与えます。

  • AWS PrivateLink はサポートされていません。

  • ノートブックのタグはサポートされていません。

  • ストリーミングの場合、増分バッチ ロジックのみを使用できます。 デフォルトまたは時間ベースのトリガー間隔はサポートされていません。 ストリーミングの制限事項を参照してください。

制限事項の参照リスト

以下のセクションでは、サーバレス コンピュートの現在の制限事項を示します。

サーバレス コンピュートは共有コンピュート アーキテクチャに基づいています。 共有コンピュートから継承される最も関連性の高い制限と、サーバー固有の追加の制限を以下に示します。 共通のカタログ制限の完全なリストについては、 Unity Catalogのカタログ アクセス モードの制限」を参照してください。

一般的な制限事項

  • Scala と R はサポートされていません。

  • SQL を記述する場合、ANSI SQL がデフォルトになります。 ANSI モードをオプトアウトするには、 spark.sql.ansi.enabledfalseに設定します。

  • Spark RDD APIsサポートされていません。

  • Spark コンテキスト (sc)、 spark.sparkContext 、およびsqlContextはサポートされていません。

  • Webターミナルはサポートされていません。

  • クエリは 48 時間を超えて実行することはできません。

  • 外部データソースに接続するには、 Unity Catalogを使用する必要があります。 クラウド ストレージにアクセスするには外部のポートを使用します。

  • データソースのサポートは、 AVRO 、 BINARYFILE 、 CSV 、 DELTA 、 JSON 、 Kafka 、 ORC 、 PARQUET 、 ORC 、 TEXT 、 XML に限定されています。

  • ユーザー定義関数 (UDF) はインターネットにアクセスできません。

  • 個々の行は、最大サイズの 128MB を超えてはなりません。

  • Spark UI は使用できません。 代わりに、クエリ プロファイルを使用して Spark クエリに関する情報を表示します。 「クエリ プロファイル」を参照してください。

  • Databricks エンドポイントを使用する Python クライアントでは、「CERTIFICATE_VERIFY_FAILED」などの SSL 検証エラーが発生する可能性があります。 これらのエラーを回避するには、 /etc/ssl/certs/ca-certificates.crtにある CA ファイルを信頼するようにクライアントを構成します。 たとえば、サーバーレス プログラミングまたはジョブの開始時に次のコマンドを実行します。 import os; os.environ['SSL_CERT_FILE'] = '/etc/ssl/certs/ca-certificates.crt'

  • ワークスペース間の API リクエストはサポートされていません。

ストリーミングの制限

機械学習の制限事項

ノートブックの制限

  • ノートブックは 8GB のメモリにアクセスできますが、構成することはできません。

  • ノートブックスコープのライブラリは、開発セッション間でキャッシュされません。

  • ユーザー間でノートブックを共有する場合、TEMP テーブルとビューの共有はサポートされていません。

  • ノートブック内のデータフレームのオートコンプリートと変数エクスプローラーはサポートされていません。

ワークフローの制限

  • サーバレスコンピュート for Jobのドライバサイズは現在固定で変更できません。

  • タスク ログはタスク実行ごとに分離されていません。 ログには複数のタスクからの出力が含まれます。

  • タスク ライブラリは、デルタスクではサポートされていません。 代わりにノートブックスコープのライブラリを使用してください。 ノートブックスコープの Python ライブラリを参照してください。

コンピュート固有の制限

以下のコンピュート固有の機能はサポートされていません。

  • コンピュートポリシー

  • コンピュートスコープの init スクリプト

  • カスタム データソースとSpark拡張機能を含む、コンピュート スコープのライブラリ。 代わりにノートブックスコープのライブラリを使用してください。

  • インスタンス プロファイルを含む、コンピュート レベルのデータ アクセス構成。 その結果、クラウド パス上の HMS 経由、または埋め込まれた資格情報を持たない DBFS マウントを使用したテーブルやファイルへのアクセスは機能しなくなります。

  • インスタンスプール

  • コンピュートイベントログ

  • Apache Sparkコンピュートの設定と 環境変数