Databricks Connect for Python の制限事項
注
この記事では、Databricks Runtime 13.3 LTS 以降の Databricks Connect について説明します。
この記事では、Databricks Connect for Python の制限事項を示します。 Databricks Connect を使用すると、一般的な IDE、ノートブック サーバー、およびカスタム アプリケーションを Databricks クラスターに接続できます。 「Databricks Connect とは」を参照してください。この記事の Scala バージョンについては、「 Databricks Connect for Scala の制限事項」を参照してください。
重要
使用している Python、Databricks Runtime、Databricks Connect のバージョンによっては、一部の機能にバージョン要件がある場合があります。 「要件」を参照してください。
機能の可用性
Databricks Connect for Databricks Runtime 13.3 LTS 以下では使用できません。
ストリーミング
foreachBatch
128 MB を超える DataFrames の作成
3600秒以上の長いクエリー
利用できません:
dataframe.display()
APIDatabricks ユーティリティ:
credentials
、library
、notebook workflow
、widgets
Spark コンテキスト
RDDの
RDD、Spark Contextを使用するライブラリ、または基盤となるSpark JVM(Mosaic geospatial、GraphFrames、GreatExpectationsなど)にアクセスするライブラリ
CREATE TABLE <table-name> AS SELECT
(代わりに、spark.sql("SELECT ...").write.saveAsTable("table")
を使用します)ApplyinPandas()
および共有クラスターを使用したCogroup()
log4j ログレベルの変更
SparkContext
分散機械学習トレーニング
ローカル開発環境とリモート・クラスターの同期
サーバレス コンピュートでは、UDF にカスタム ライブラリを含めることはできません。