メインコンテンツまでスキップ

LakeFlow Designer とは何ですか?

備考

プレビュー

この機能は パブリック プレビュー段階です。

LakeFlow Designer は、アナリストがデータ分析、準備、および基本的な自動化を実行するための視覚的なキャンバスを提供します。 Designerでは、ビジュアルデータ準備を作成します。各データ準備は、結果を生成するためにDAGとして配置された一連の演算子(フィルタ、結合、変換など)で構成されます。すべての変換はコードによってサポートされており、ワークフローの本番運用への移行をサポートします。

LakeFlow Designer を使用すると、次のことが可能になります。

  • ドラッグ&ドロップキャンバスを使用して、 デザインビジュアルのデータ準備を行います
  • 組み込み演算子を使用してデータをフィルタリング、集計、結合、および再形成することで 、コードを記述せずにデータを変換します
  • Genie Code を使用すると 、自然言語を使ってビジュアルデータ準備における変換を生成または調整できます。
  • パイプライン全体を実行せずに、 各中間ステップをプレビューできます

ビジュアルデータ準備の機能を示すLFD。

上の画像には、以下のものが写っています。

  1. ドラッグ&ドロップキャンバス
  2. オペレーター2名
  3. 2人のオペレーター間の接続
  4. 出力ペイン
  5. 出力のデータプロファイリング
  6. Genie Codeプロンプト

重要な概念

キャンバス

キャンバスは、ビジュアルデータ準備を構築するために、オペレーターを追加、構成、接続する主要なワークスペースです。

キャンバス内を移動するには:

  • パン : スペースキー を押しながらクリックしてドラッグするか、トラックパッド上で 2 本の指をスライドします。
  • ズーム : トラックパッド上でピンチまたはストレッチするか、 Ctrl キー を押しながらスクロールします。

キャンバスの左下には、キャンバス ナビゲーション ツールを含むツールバーがあります。ズームインアイコン。ズームイン、ズームアウトアイコン。ズームアウト、Fullscreenアイコン。フィットビュー、DAG 水平アイコン。自動レイアウト、そしてアイコンをドラッグします。ドラッグモード。

キャンバス上の任意の場所を右クリックすると、演算子の追加、元に戻すとやり直し、自動レイアウト、ビューの調整、コード ペインのオープンなどの一般的なアクションにアクセスできます。

Excel または CSV ファイルをキャンバスに直接ドラッグ アンド ドロップして、そのファイルのソース演算子を作成することもできます。

オペレーター

オペレーター は、ビジュアルデータ準備の構成要素です。演算子とは、結合、変換、フィルタリングなどの操作のことです。キャンバス上で演算子を連結することでワークフローを構築します。各オペレーターは、そのタイプに基づいて設定可能です。

LFDキャンバスには、DAG上のオペレーターが表示されています。

LakeFlow Designer には、一般的なデータ変換タスク用の組み込み演算子が含まれています。 詳細については、 LakeFlow Designer の組み込み演算子」を参照してください。

接続

接続とは、オペレーター間でデータがどのように流れるかを定義するものです。接続を作成するには、一方の演算子の右端にある小さな円を、もう一方の演算子の左端にある小さな円にドラッグします。これは、データが最初の演算子から2番目の演算子へ流れることを指定するものです。データはビジュアルデータ準備プロセスにおいて、左から右へと流れます。 JoinCombine などの一部の演算子は、複数の入力接続を受け入れます。

LFDキャンバスには、2人のオペレーター間の接続状況が表示されている。

出力ペイン

演算子を選択すると、画面の下部に出力ペインが表示されます。任意の演算子を選択すると、画面下部の出力ウィンドウに結果が表示されます。ほとんどの演算子タイプでは、入力データは左側にあり、出力データは右側にあります。

デフォルトでは、演算子は最大 1,000 行のデータのサンプルに対して実行されます。完全なデータセットで実行するには、出力ペインで [サンプル データセット] をクリックし、 [完全なデータセット] に切り替えます。

キャンバスの下にあるLFD出力ペイン。

警告

完全なデータセットで実行すると、すべての上流オペレーターが完全で無制限のデータセットで再実行されるため、長い時間がかかることがあります。

出力ペインでは、出力データの詳細を表示するかどうかを選択できます。出力ペインの右上隅で、サイドバーアイコン。サイドバーのボタンをクリックして、選択内容の詳細を開きます。選択したデータの詳細を表示するには、データの一部を選択してください。

選択した出力データに関するグラフと詳細情報を表示するサイドバー。

Genie Code

Genie Code を使用すると、自然言語で変換を記述できます。すべてのインタラクションはエージェント的であり、Databricks プラットフォームのコンテキストを使用します。

LFD Genie Codeプロンプト

変換を生成または変更するためのプロンプトを入力します。Genie Codeのインタラクション履歴を表示し、各レスポンスの詳細を確認するには、クリックしてGenie Codeサイドパネルを開きます。キラキラ色のアイコン。右側のサイドバーにあります。サイド ペインが開いている場合、キャンバス内のツールバーは最小化されます。

次のステップ