Databricks Assistantを使用する
Databricks Assistant は、Databricks ノートブック、SQL エディター、ジョブ、Lakeview ダッシュボード、ファイル エディターを支援できるコンテキスト認識 AI アシスタントです。 Databricks Assistant は、会話型インターフェースを使用してヘルプを依頼すると、データとコードのサポートを提供します。
Databricks Assistantでできること
Databricks Assistant は次のタスクに役立ちます。
コードの生成、デバッグ、最適化、および説明を行います。
データからビジュアライゼーションを作成します。 「Databricks Assistant を使用してビジュアライゼーションを作成する」を参照してください。
ジョブのデバッグ (パブリック プレビュー機能)。
SQL クエリをコーディングおよび編集します。
Databricksドキュメントで関連するヘルプを見つけます。
アシスタントは Unity Catalog メタデータを使用して、社内のテーブル、列、説明、一般的なデータ資産を理解し、パーソナライズされた応答を提供します。
Databricks Assistantを有効にする
Databricks Assistant はデフォルトで有効になっています。 「アカウントの場合: Databricks Assistant 機能を有効または無効にする」を参照してください。
ノートブックのセルで Databricks Assistantを使用する
ノートブックでは、Databricks Assistantはアシスタントペインまたはコードセルのインラインで使用できます。
コード セル内で Databricks Assistant を直接使用するには、MacOS ではCmd + i 、Windows ではCtrl + i を押します。 セルにテキストボックスが表示されます。 質問やコメントを英語で入力し、 Enter キーを押すと(セルを実行するときのようにShift+Enter キーではなく)、アシスタントが応答を生成できます。
![インライン アシスタントは、エンリッチメント データの検索と追加に役立ちます。](../_images/inline-assistant-example-weather.png)
セル操作プロンプト
プロンプトのショートカットは、一般的なプロンプトの作成に役立ちます。
プロンプト テキスト |
アシスタントの機能 |
---|---|
|
一般的なコマンドを表示します |
|
差分ビューでコードにコメントを付ける |
|
セル内のコードの説明を提供します |
|
差分ビューのコードエラーの修正を提案します |
/fix
または /doc
を使用する場合は、差分ウィンドウで [同意する] を選択して提案された変更を受け入れるか、[拒否] を選択して元のコードを保持します。提案されたコードを承認した場合、コードは自動的に実行されません。 コードを実行する前に、コードを確認できます。 生成されたコードが期待どおりでない場合は、コメントに詳細や情報を追加してもう一度試してください。 Databricks Assistant の使用に関するヒントを参照してください。
コードのオートコンプリートの場合、ノートブックのセルよりもアシスタント ペインを使用した方がパフォーマンスが向上する可能性があります。
アシスタントは、生成されたコードを 承認 または 拒否 すると自動的に閉じます。
[アシスタント] ウィンドウを使用する
このセクションでは、アシスタント ペインのデフォルトのエクスペリエンスについて説明します。
[アシスタント] ペインを開くには、左側のサイドバーの をクリックします。
![使用中のアシスタントペインのスクリーンショット。](../_images/assistant-pane-example-weather.png)
[アシスタント] ウィンドウの下部にあるテキスト ボックスに質問を入力し、 Enter キーを押すか、テキスト ボックスの右側にある をクリックします。 すると、アシスタントに回答が表示されます。 次のスクリーンショットは、アシスタントが [アシスタント] ウィンドウでコードを生成した後に実行できるアクションを示しています。
![アシスタントペインのコードボックスの上部にあるアイコン。](../_images/assistant-pane-codebox-header.png)
同じクエリを再度実行して、別の回答を生成できます。 これを行うには、回答の上にカーソルを置き、をクリックします。
ウィンドウを閉じるには、アイコンをもう一度クリックするか、セルの右上隅にある をクリックします。
をクリックすると、ペインを全幅に拡大できます。ペインをデフォルトの幅に戻すには、
をクリックします。
![アシスタントペインの上部にあるアイコン。](../_images/assistant-pane-header.png)
[アシスタント] ウィンドウでは、ウィンドウやノートブックを閉じた場合でも会話が追跡されます。 以前の会話を消去するには、[アシスタント] ペインの右上にある をクリックします。
AIベースのオートコンプリート
プレビュー
この機能はパブリックプレビュー段階です。
AI ベースのオートコンプリートにより、Databricks ノートブック、SQL エディター、ファイル エディターに入力するときにインライン コードの候補が表示されます。 インライン コードの提案は、Python と SQL で利用できます。
注:
インラインコード提案は、 AWS GovCloudリージョンまたは FedRAMP コンプライアンスを備えたワークスペースでは利用できません。
デバッグコード: Python と SQL の例
Databricks Assistant を使用してコードを修正するには、次のいずれかを実行します。
[アシスタント] ウィンドウで質問します。
エラーが発生したときにセルの結果に表示される [ エラーの診断 ] ボタンをクリックします。
[デバッグ]をクリックすると、対話的にコードを 1 行ずつステップ実行し、ブレークポイントを設定し、変数を検査し、プログラムの実行を分析できます。
以下のタブには、Python および SQL コードの例が表示されます。
![Python でのアシスタントのデバッグ例。](../_images/diagnose-error.png)
![SQL でのアシスタントのデバッグ例。](../_images/diagnose-error-sql.png)
コードの説明
Databricks Assistant は、コード スニペットの詳細な説明を提供できます。 /explain
プロンプトを使用し、"簡潔にする" や "コードを 1 行ずつ説明する" などの用語を含めて、必要な詳細レベルを要求します。Databricks Assistant にコードにコメントを追加するよう依頼することもできます。
Databricksドキュメントから情報を取得する
データベース エディターでは、 Databricks Assistant Databricksドキュメントに基づいて質問に答えることができます。 質問またはプロンプトをプロンプトボックスに入力します。
![Databricksドキュメントに基づいて質問に回答します。](../_images/documentation-question.png)
Databricks Assistantを使用するためのヒント
このセクションには、Databricks Assistantを使用する際の一般的なヒントとベストプラクティスが含まれています。
Databricks Assistantによるコンテキストを使用した適切な回答の提供
Databricks Assistant は、テーブルと列のスキーマおよびメタデータにアクセスできます。 これにより、自然言語を使用して、より正確なクエリを生成できます。 たとえば、テーブルにStateという列がある場合、Databricks Assistant にミシガン州に住んでいるユーザーのリストを生成するように依頼できます。
Databricks Assistant は次のコンテキストを使用します。
現在のノートブック セルまたは Databricks SQL エディター タブ内のコードまたはクエリ。
テーブルと列の名前と説明。
以前のプロンプトの質問。
お気に入りのテーブルとアクティブなテーブル。
エラーの診断 機能の場合、エラー出力からのスタックトレース。
DataFrame から列を選択する場合、開始クエリを指定すると、より正確な結果を得ることができます。 たとえば、 SELECT * FROM <table_name>
のようなステートメントを指定します。 これにより、Databricks Assistant は列名を取得できるようになり、推測する必要がなくなります。
Databricks Assistant は会話履歴を使用してより適切で正確な回答を提供するため、プロンプト全体を書き直さなくても、以前の応答の出力を変更するように Databricks Assistant に依頼できます。 アシスタントのチャット履歴を使用して、アシスタント ペインでDataFrames繰り返しクリーンアップ、探索、フィルタリング、スライスします。
具体的な指示
Databricks Assistant が提供する構造と詳細は、同じプロンプトであっても時々変化します。 アシスタントが希望する形式、詳細レベルなどで必要な情報を返すことができるように、できる限り多くのガイダンスを提供するようにしてください。 例えば:
「このコードを数文で説明してください」または「このコードを行ごとに説明してください」。
「MatPlotLib を使用してビジュアライゼーションを作成」または「Seaborn を使用してビジュアライゼーションを作成」。
行レベルのデータ値の例を挙げる
Databricks Assistant は行レベルのデータを使用しないため、最も正確な回答を得るには、プロンプトにさらに詳細な情報を提供する必要がある場合があります。 「カタログエクスプローラ」(Catalog Explorer) でテーブルまたは列のコメントを使用して、サンプルデータの行を追加します。 たとえば、高さの列が feet
-inches
という形式であるとします。 アシスタントがデータを解釈できるように、「高さの列は文字列形式であり、ハイフンで区切られています。」などのコメントを追加します。 例: '6-2'。 テーブルと列のコメントの詳細については、 「データとAIアセットにコメントを追加する」を参照してください。
操作を実行するために列のデータ型変換を使用する必要がある場合は、詳細を指定する必要がある場合があります。 たとえば、「このコードをPandasからPySparkに変換します。これには、 Pandas DataFrameをPySpark DataFrameに変換し、列 churn のデータ型をBooleanから整数に変更するために必要なコードが含まれます」。