Databricks アシスタントを使用する

Databricks Assistant は、Databricks ノートブック、SQL エディター、ファイル エディターで利用できるコンテキスト認識 AI アシスタントです。 Databricks Assistant を使用すると、会話型インターフェイスを使用してデータをクエリできるため、Databricks 内での生産性が向上します。 タスクを英語で説明し、アシスタントに Python コードまたは SQL クエリを生成させ、複雑なコードを説明させ、エラーを自動的に修正させることができます。 アシスタントはUnity Catalogメタデータを使用してテーブル、列、説明、社内全体で人気のあるデータ資産を理解し、パーソナライズされた応答を提供します。

Databricks アシスタントは次のタスクを実行できます。

  • コードを生成します。

  • エラーの特定と修正の提案を含む、コードをデバッグします。

  • コードを変換して最適化します。

  • コードを説明する。

  • Databricks ドキュメントで関連情報を見つけるのに役立ちます。

Databricks アシスタントはデフォルトで有効になっています。 管理者は、アカウント内のすべてのワークスペースに対して Databricks Assistant を無効または有効にすることができます。 管理者がワークスペース設定のオーバーライドを許可している場合、ワークスペース管理者は特定のワークスペースに対してDatabricks Assistant を有効または無効にすることができます。 詳細については、 「Databricks Assistant を有効または無効にする」を参照してください。

アカウントに対するDatabricks Assistant の有効化は、監査ログ内のアカウント イベントとしてキャプチャされます。 「アカウント レベルのアカウント イベント」を参照してください。

追加情報

次の記事には、Databricks Assistant の使用に関する追加情報が含まれています。

Databricks アシスタントの使用方法

Databricks Assistant は、ノートブック、SQL エディター、ファイル エディター、ダッシュボードで利用できます。 このドキュメントではノートブックに焦点を当てています。 他の製品での使用方法も同様です。 Databricks Assistant を使用してダッシュボードの視覚エフェクトを作成する方法については、 Databricks Assistant を使用した視覚エフェクトの作成」を参照してください。

ノートブックでは、Databricks アシスタントはアシスタント ペインまたはコード セルのインラインで使用できます。

ノートブックのセルで Databricks アシスタントを使用する

コード セルで Databricks アシスタントを直接使用するには、MacOS の場合はCmd + i 、Windows の場合はCtrl + iを押します。 セル内にテキストボックスが表示されます。 英語で質問またはコメントを入力し、 Enter キー(セルを実行する場合のようにShift+Enter キーではありません) を押すと、アシスタントが応答を生成します。

使用中のインラインアシスタントのスクリーンショット

また、 /と入力して一般的なコマンドのリストを表示することもできます。たとえば、 /explainと入力するとセル内のコードを説明し、 /fixと入力するとコードにエラーがある場合に修正を提案し、 /docと入力するとドキュメントのコメントが提案されます。あなたのコードのために。

/fix または /docを使用すると、アシスタントは提案された変更を差分ウィンドウに表示します。[同意する] を選択して提案された変更を受け入れるか、[拒否] を選択して元のコードを保持します。提案されたコードを受け入れる場合、コードは自動的に実行されません。 コードを実行する前に、コードを確認できます。 生成されたコードが意図したものではない場合は、コメントに詳細や情報を追加して再試行してください。 「 Databricks Assistant の使用に関するヒント 」を参照してください。

コードのオートコンプリートの場合、ノートブックのセルよりもアシスタント ペインを使用した方がパフォーマンスが向上する可能性があります。

ノートブックのセルでアシスタントを終了するには、クローズアシスタントセルの右上隅にあります。 アシスタントは、生成されたコードを 承認 または 拒否 すると自動的に閉じます。

[アシスタント] ウィンドウを使用する

[アシスタント] ペインを開くには、左側のサイドバーの をクリックします Databricks アシスタントアイコン

使用中のアシスタントペインのスクリーンショット

[アシスタント] ウィンドウの下部にあるテキスト ボックスに質問を入力し、 Enter キーを押すか、テキスト ボックスの右側にある をクリックします アシスタントテキストの入力 。 アシスタントに回答が表示されます。 次のスクリーンショットは、アシスタントが [アシスタント] ウィンドウでコードを生成した後に実行できるアクションを示しています。

アイコンは、アシスタントペインのコードボックスの上部にあります

同じクエリを再度実行して、別の回答を生成できます。 これを行うには、回答の上にカーソルを置き、 をクリックします 再生するアイコン

ウィンドウを閉じるには、アイコンをもう一度クリックするか、セルの右上隅にある をクリックします クローズアシスタント 。 をクリックすると、ペインを全幅に拡大できます。全幅アイコンを開く ;クリック全幅アイコンを閉じるペインをデフォルトの幅に戻すには、

アシスタントペインの上部にあるアイコン

[アシスタント] ウィンドウでは、ウィンドウやノートブックを閉じた場合でも会話が追跡されます。 以前の会話を消去するには、[アシスタント] ペインの右上にある をクリックします クリアアシスタント

コードのデバッグ

Databricks アシスタントを使用してコードを修正するには、アシスタント ペインで質問するか、エラーが発生したときにセルの結果に表示される[エラーの診断]ボタンをクリックします。

アシスタントのデバッグ例

コードの変換または最適化

Databricks Assistant は、コードを最適化して効率を高めるのに役立ちます。 たとえば、不要なループを組み込み関数に置き換えるなど、低速または非効率なコードを最適化する方法を提案したり、 Pandasコードを PySpark または Spark SQL に変換したりできます。

コードの説明

Databricks Assistant は、コード スニペットの詳細な説明を提供できます。 提供するプロンプトには、"簡潔にする" や "コードを 1 行ずつ説明する" などの用語を含めて、提供される説明の詳細レベルを要求できます。 Databricks Assistant にコードにコメントを追加するよう依頼することもできます。

Databricks ドキュメントで関連情報を見つける

Databricks アシスタントは、Databricks ドキュメントに基づく質問にノートブック エディターから直接回答するのに役立ちます。

Databricks ドキュメントに基づいて質問に回答します

Databricks アシスタントを使用するためのヒント

このセクションには、Databricks Assistant を使用する際の一般的なヒントとベスト プラクティスが含まれています。

Databricks Assistant はコンテキストを使用してより適切な回答を提供します

Databricks Assistant は、テーブルと列のスキーマとメタデータにアクセスできます。 これにより、自然言語を使用して、より正確なクエリを生成できます。 たとえば、テーブルに State 列がある場合、Databricks Assistant にミシガン州に住むユーザーのリストを生成するように依頼できます。

Databricks アシスタントは次のコンテキストを使用します。

  • 現在のノートブック セルまたは Databricks SQL エディター タブ内のコードまたはクエリ。

  • テーブルと列の名前と説明。

  • 以前のプロンプトの質問。

  • お気に入りのテーブルとアクティブなテーブル。

  • エラーの診断 機能の場合、エラー出力からのスタックトレース。

DataFrame から列を選択する場合、開始クエリを指定すると、より正確な結果を得ることができます。 たとえば、 SELECT * FROM <table_name>のようなステートメントを指定します。 これにより、Databricks Assistant は列名を取得できるようになり、推測する必要がなくなります。

Databricks アシスタントは会話履歴を使用してより適切で正確な回答を提供するため、以下に示すように、プロンプト全体を書き直すことなく、Databricks アシスタントに以前の回答の出力を変更するよう依頼できます。

上の例と同様に、アシスタントのチャット履歴を使用して、アシスタント ペインでDataFramesクリーニング、探索、フィルター、スライスを繰り返し行うことができます。

コードを自動的に書式設定する

ベスト プラクティスに準拠するようにコードを書式設定するには、アシスタント テキスト ボックスまたはアシスタント ウィンドウに「prettify」と入力します。

フォーマットコード例

具体的な指示

Databricks Assistant は行レベルのデータを使用しないため、プロンプトにさらに詳細を入力して、最も正確な答えを得ることができます。 たとえば、データがどのように見えるか、または操作を実行するために列のデータ型の変換が必要かどうかを指定します。

例: 「このコードをPandasから PySpark に変換します。これには、 Pandas DataFrame を PySpark DataFrame に変換するのに必要なコードと、列チャーンのデータ型をBooleanから整数に変更するために必要なコードが含まれます。」

Shift+Enter を使用して、チャット テキスト ボックスに新しい行を追加します

Shift+Enter キーを使用して、[アシスタント チャット] テキスト ボックスに新しい行を追加できます。これにより、Databricks Assistant へのメッセージの書式設定と整理が簡単になります。

Databricks アシスタントのチャット ウィンドウでコードを編集して実行する

[アシスタント] ペインでコードを実行して検証したり、スクラッチパッドとして使用したりできます。 コードを実行するには、コードを実行するアイコン [アシスタント] ペインのコード ボックスの左上隅にある

アシスタントペインでコードを実行する

[アシスタント] ペインでコードを実行すると、出力が表示され、変数がノートブックで使用できるようになります。

コードをノートブックに移動する前に、Databricks アシスタントが生成したコードをアシスタント チャット ボックスで直接編集することもできます。