データサイエンスエージェントの使用
ベータ版
この機能は ベータ版です。
このページでは、Databricksアシスタントで エージェントモードを選択すると利用できるAIデータエージェントであるデータサイエンス エージェントを紹介します。Databricks ノートブックと SQL エディター専用に設計されており、データの探索、コードの生成と実行、エラーの修正をすべて 1 つのプロンプトから行います。
データサイエンスエージェントとは
データサイエンス エージェントは、Databricks アシスタントのエージェント モードの強力な機能であり、Databricksアシスタントを、ノートブックとSQLエディターのマルチステップ データサイエンス ワークフロー全体を自動化できるインテリジェント コンパニオンに変換します。
アシスタントチャットモードと比較して、エージェントモードは、ソリューションの計画、関連アセットの取得、コードの実行、セル出力を使用した結果の改善、エラーの自動修正など、機能が拡張されています。
データサイエンス エージェントは、ノートブックで実行するコードや、 SQL エディターで実行するクエリを計画および生成できます。 エージェントは、続行する前に、プランを承認し、次のステップを確認するためにお客様と協力します。ユーザーの承認を得て、データサイエンス エージェントはツールを使用して、テーブルの検索、ノートブックの編集、セルの実行、セル出力の読み取りなどのタスクを実行できます。
データサイエンスエージェントのアクセスとアクションは、ユーザーの権限によって管理されます。アクセス権のあるデータにのみアクセスし、アクセス許可を持つ操作を実行できます。
必要条件
データサイエンスエージェントを使用するには、ワークスペースに次のものが必要です。
- パートナーが提供する AI 機能がアカウントとワークスペースの両方で有効になります。パートナーが提供する AI 機能をご覧ください。
- データサイエンスエージェントのプレビューが有効になっています。「 Databricks プレビューの管理」を参照してください。
データサイエンスエージェントの使用
データサイエンスエージェントを使用するには:
-
Databricks ノートブックまたは SQL エディターから、アシスタントのサイド パネルを開きます。
-
右下隅にある [エージェント] を選択します。これにより、アシスタントのエージェントモードがオンになり、データサイエンスエージェントと対話できるようになります。
-
(オプション)より長く、よりオープンエンドのタスクの場合は、 Planner をオンに切り替えます。これにより、データサイエンスエージェントは複数ステップのワークロードをオーケストレーションできます。エージェントは、次のステップに進む前に、計画を作成し、明確な質問をします。 Planner を有効にすると、エージェントはデータ分析と視覚化を含む完全なノートブックを生成できます。
-
エージェントのプロンプトを入力します。たとえば、「samples.bakehouse の
@sales_transactions
を分析して、最も売れている製品を特定します」などです。
@table_name
を使用して特定のテーブルを参照します。エージェントは、そのテーブルと関連するメタデータを使用して、応答をキュレーションします。エージェントはユーザーの Unity Catalog アクセス許可を尊重するため、アクセス権のあるデータにのみアクセスできます。
-
エージェントが応答を生成し、計画を実行すると、入力を取得するために一時停止することがよくあります。
-
Planner を有効にすると、エージェントは段階的な計画を作成し、明確な質問をします。エージェントの明確な質問に答えて、計画を磨くのに役立ちます。
-
エージェントがコードを実行する必要がある場合は、続行する前に承認を求めます。その要求を 許可 または 拒否 します。 このスレッドで許可する (アシスタントの会話スレッドを参照) または 常に許可する を選択することもできます。
-
データサイエンスエージェントは、ノートブックでコードを生成して実行できます。危険な行為を防ぐためのガードレールはありますが、依然としてリスクはあります。信頼できるコードとデータでのみ使用してください
-
エージェントが作業を続行すると、 続行 または 拒否 を選択するように求められる場合があります。エージェントの既存の作業を確認し、 続行 を選択してエージェントが次のステップに進むことを許可するか、 拒否 を選択して他のことを試すように指示します。
-
動作中にエージェントを停止するには、赤い
をクリックします。
エージェントは、新しいノートブックセル(またはクエリ)の作成、テキストとコードの生成、ノートブックセルの実行、セル出力へのアクセス、結果の解釈を行うことができます。
データサイエンスエージェントが作業を続行し、次のステップを実行するには、エージェントが作業している現在のタブにとどまる必要があります。
ユースケース
エージェントモードでは、アシスタントは、データの検索、出力の解釈、セルアクションの実行などの機能が拡張されています。
Planner を有効にすると、 データサイエンス エージェントは、探索的データ分析、予測、機械学習など、より複雑なデータサイエンスタスクを支援できます。データサイエンスエージェントを使用して、新しいデータ分析ノートブックを最初から作成することもできます。より良い結果を得るには、使用するテーブルを「@table_name
」で指定してください。
開始するには、次のプロンプトを試してください。
-
データディスカバリー :
- 「どのテーブルにベークハウスのトランザクションデータが含まれていますか?」
- 「カリフォルニア州ロサンゼルス市の日付 2025-01-01 の天気データを見たいです。」
- 「ニューヨーク市のタクシーデータを含むテーブルを見つけて、最初の 10 行を表示します。」
-
探索的データ分析 :
- 「列 A の JSON 文字列を解析するのを手伝ってください。」
- 「このテーブルからデータの視覚化を作成します。」
- 「この棒グラフを解釈してください。」
- 「
@sales_transactions
データセットについて説明してください。列の統計量を理解し、値の分布を視覚化するために、いくつかの EDA を実行します。データサイエンティストのように考えてください。」 - 「
@workload_insights
を分析して、先週の Databricks SQL ワークロードの収益上位 5 社の顧客を見つけます。次に、過去 6 週間に Databricks SQL に対して毎週の顧客のユーザー数をプロットします。」
-
予測 :
- 「
@incidents
データセットを使用して、今後 2 週間の毎日のインシデント数の予測を作成します。完了したら、結果を表示するためのデータテーブルとインタラクティブなグラフをください。」 - 「
@website_traffic
データセットを使用して、来月の毎日の訪問者数を予測します。季節のパターンを強調してください。」 - 「信頼区間を含む、
@inventory
データセットから今後6か月間の製品需要の予測を生成します。」
- 「
-
機械学習 :
- 「データ準備と特徴エンジニアリングを実行して、このデータセットをモデルトレーニング用に準備します。」
- "トレーニングする 分類モデル の 分類モデル の @customer_data データセット 解約を予測します。 モデルを正確に評価し、AUC メトリクス。」
- 「@housing_pricesデータセットを使用して回帰モデルでハイパーパラメーターチューニングを実行し、予測誤差を改善します。」
- 「構築する クラスタリング モデル @sales_leads データセット 顧客セグメントを特定し、各クラスターの特性の概要を提供します。」
-
ノートブックの整理:
- 「このノートブックの結果を要約する新しいセルを作成します。」
- 「このノートブックに適切な名前を付けてください。」
探索的データ分析
データサイエンスエージェントを使用して、データセットに対して探索的データ分析を実行します。たとえば、エージェントを使用して、 samples.bakehouse.sales_transactions
データセットを分析する新しいノートブックを作成してみてください。
空のノートブック タブで [アシスタント] パネルを開き、[ エージェント モードと プランナー ] を選択して、次のプロンプトを入力します: 「データセット samples.bakehouse の @sales_transactions を説明してください。列の統計を解き明かし、値の分布を視覚化できるように、EDAを行いたいと思います。データサイエンティストのように考えてください。」
エージェントは、プロンプトに答えるための計画を作成し、明確な質問をする場合があります。承認を得て、データを調べるためのコードを含む新しいノートブック セルと、そのプロセスと結果を説明するテキストが生成されます。