Visual Studio Code の Databricks 拡張機能とは何ですか?
Visual Studio Code の Databricks 拡張機能の使用をすぐに開始するには、「 Databricks の VSCode 拡張機能のチュートリアル: クラスターで Python をジョブとして実行する」に進んでください。
Visual Studio Code 用の Databricks 拡張機能を使用すると、ローカル開発コンピューターで実行されている Visual Studio Code 統合開発環境 (IDE) からリモート Databricks ワークスペースに接続できます。 これらの接続を通じて、次のことができます。
Visual Studio Code で開発したローカル コードをリモート ワークスペースのコードと同期します。
リモート ワークスペース内の Databricks クラスター上の Visual Studio Code からローカル Python コード ファイルを実行します。
ローカル Python コード ファイル (
.py
) と Python、R、Scala、SQL ノートブック (.py
、.ipynb
、.r
、.scala
、.sql
) をリモート ワークスペースで自動化された Databricks ジョブとして Visual Studio Code から実行します。
注:
Visual Studio Code の Databricks 拡張機能では、自動化されたジョブとして R、Scala、および SQL ノートブックを実行できますが、Visual Studio Code 内でこれらの言語をより深くサポートすることはできません。
Visual Studio Code 用の Databricks 拡張機能 (現在プライベート プレビュー版) では、Visual Studio Code を使用して、CI/CD パターンとベスト プラクティスを Databricks ジョブに適用することにより、Databricksアセット バンドルを定義、デプロイ、実行することもできます。 Delta Live Tablesパイプラインと MLOps スタック。 「Databricks アセット バンドルとは何ですか?」を参照してください。拡張機能のバージョン 2 で Databricks アセット バンドルを使用します。
Visual Studio Code バージョン 2 の Databricks 拡張機能の使用を開始するには、 「Databricks バージョン 2 の VSCode 拡張機能チュートリアル: クラスター上でジョブとして Python を実行する」を参照してください。
はじめに
実践的なチュートリアルから始めて、拡張機能を試してみてください。 Databricks の VSCode 拡張機能に関するチュートリアル「クラスターで Python を実行し、ジョブとして実行する」を参照してください。
チュートリアルを完了したら、拡張機能を使用して次の 1 つ以上の操作を行います。
Databricks個人アクセストークン認証以外のDatabricks認証タイプを使用して、Visual Studio Code 用のDatabricks拡張機能をDatabricksワークスペースに対して認証します。 VS Code の Databricks 拡張機能の認証設定を参照してください。
ワークスペースで接続する別のクラスターを選択します。 「Visual Studio Code の Databricks 拡張機能のクラスターの選択」を参照してください。
ワークスペースで接続する別のワークスペースディレクトリを選択します。 「Visual Studio Code の Databricks 拡張機能のワークスペース ディレクトリを選択する」を参照してください。
Databricks Connect 統合を使用してコードをデバッグします。 Visual Studio Code の Databricks 拡張機能については、「Databricks Connect を使用したコードのデバッグ」を参照してください。
pytest
を使用してコードをテストします。Visual Studio Code の Databricks 拡張機能については、「pytest を使用した実行テスト」を参照してください。