メインコンテンツまでスキップ

Databricks ノートブックでのビジュアライゼーション

Databricks には、 Databricks SQL とノートブックの両方でグラフと視覚化の組み込みサポートがあります。 このページでは、Databricks ノートブックでビジュアライゼーションを操作する方法について説明します。 Databricks SQLでのビジュアライゼーションの使用に関する情報については、「Databricks SQLでのビジュアライゼーション」を参照してください。

ビジュアライゼーションのタイプを表示するには、 ビジュアライゼーションのタイプを参照してください。

新しいビジュアライゼーションを作成してください

このセクションの例を再現するには、以下のコードを使用してください:

Python
sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)

ビジュアライゼーションを作成するには、結果の上にある [ + ] をクリックし、[ ビジュアライゼーション ] を選択します。ビジュアライゼーションエディタが表示されます。

新しいビジュアライゼーションメニュー

  1. [ ビジュアライゼーションのタイプ ] ドロップダウンで、[ バー ] を選択します。

    ビジュアライゼーションエディタ

  2. ビジュアライゼーションに表示するデータを選択します。使用できるフィールドは、選択したタイプによって異なります。

  3. [ 保存 ]をクリックします。

新しいデータプロファイリングを作成する

注記

Databricks Runtime 9.1 LTS 以降で利用可能です。

データプロファイルは、Apache Spark データフレーム、pandas データフレーム、または SQL テーブルの要約統計を表形式とグラフィック形式で表示します。結果のセルからデータプロファイルを作成するには、[ + ] クリックして、[ データプロファイル ] を選択します。

Databricks が要約統計を計算して表示します。

データプロファイル

  • 数値特徴量とカテゴリ特徴量は別々の表に表示されます。
  • タブの上部では、特徴量を並べ替えたり検索したりできます。
  • チャート列の上部では、ヒストグラム( Standard )と分位のどちらを表示するかを選択できます。
  • チャートを拡大するには、[ 展開 ] をオンにします。
  • 対数スケールでチャートを表示するには、[ 対数 ] にチェックを入れます。
  • チャートの上にカーソルを置くと、ヒストグラムの列の境界や行数、分位値など、より詳細な情報を見ることができます。

また、プログラムによってデータプロファイリングを生成することもできます。 summarize コマンド (dbutils.data.summarize)を参照してください。

視覚化とデータプロファイリングの操作

注記

データプロファイルは Databricks Runtime 9.1 LTS 以降で利用可能です。

ビジュアリゼーションまたはデータプロファイリングの名前変更、複製、または削除

ビジュアリゼーションまたはデータプロファイリングの名前を変更、複製、または削除するには、タブ名の右側にある下向きの矢印をクリックします。 メニューからダッシュボードを作成することもできます。

注記

セルにデータプロファイリングが含まれている場合、関連するビジュアライゼーションとデータプロファイリングはノートブックダッシュボードにのみ追加できます。 ビジュアライゼーションのみのセルの場合、ドロップダウンに追加の [ダッシュボードに追加 ] メニュー項目が表示されます。 「ダッシュボードへのビジュアリゼーションの追加」を参照してください。

ノートブック データプロファイリング ドロップダウン メニュー

名前を直接クリックすることで、その場で名前を変更することもできます。

ビジュアライゼーションの編集

ビジュアライゼーションの下にある ビジュアライゼーションの編集ボタン をクリックして、ビジュアライゼーション エディターを開きます。 変更が完了したら、[ 保存 ] をクリックします。

色の編集

ビジュアライゼーションの作成時または編集することで、ビジュアライゼーションの色をカスタマイズできます。

  1. ビジュアライゼーションを作成または編集します。

  2. [ ] をクリックします。

  3. 色を変更するには、四角をクリックし、次のいずれかの方法で新しい色を選択します。

    • カラーセレクターでクリックする。
    • 16進数を入力する。
  4. カラーセレクターの外側の任意の場所をクリックして閉じます。

  5. Visualization EditorSave をクリックして、変更を保存します。

シリーズ選択

グラフで分析する特定の系列を選択するには、次のコマンドを使用します。

  • 1 つの凡例項目をクリックして、そのシリーズを選択します
  • 凡例項目を Cmd/Ctrl + クリックして、複数のシリーズを選択または選択解除します

シリーズ選択

並べ替えられたツールチップ

折れ線グラフと積み上げられていない棒グラフでツールチップを大きさの順に並べて使用すると、分析が容易になります。

ソートされたツールチップ

ズーム

データ密度の高いチャートの場合、個々のデータポイントを拡大すると、詳細を調査したり、外れ値をトリミングしたりするのに役立ちます。 グラフを拡大するには、キャンバスをクリックしてドラッグします。 ズームをクリアするには、キャンバスにカーソルを合わせ、ビジュアライゼーションの右上隅にある [ ズームのクリア ] ボタンをクリックします。

ズームインして詳細を確認する

ビジュアライゼーションを PNG ファイルとしてダウンロードする

ビジュアライゼーションを PNG ファイルとしてダウンロードするには、キャンバスにカーソルを合わせ、右上隅にあるダウンロード アイコンをクリックします。

[ダウンロード] をクリックして、ビジュアライゼーションを PNG ファイルとしてエクスポートします

pngファイルがデバイスにダウンロードされます。

ダッシュボードにビジュアリゼーションを追加する

  1. タブ名の右にある下向きの矢印をクリックします。
  2. [ ダッシュボードに追加 ] を選択します。利用可能なダッシュボードビューのリストが、メニューオプション [ 新しいダッシュボードに追加 ] と共に表示されます。
  3. ダッシュボードを選択するか、 新しいダッシュボードに追加 を選択します。 ダッシュボードが開き、新しく追加されたビジュアライゼーションが表示されます。

従来のビジュアライゼーション

最新バージョンのグラフ ビジュアライゼーションは、デフォルトでオンになっています。 このセクションの設定では、古いグラフで作業するとき、または最新バージョンをオフにしている場合に発生する可能性のある従来の視覚化について説明します。

視覚化ツール

グラフの右上にカーソルを合わせると、Plotlyツールバーが表示され、選択、ズーム、パンなどの操作を実行できます。

ノートブックのビジュアライゼーションエディターツールバー

ビジュアライゼーションのダウンロード

.png でビジュアライゼーションをダウンロードするには [形式] で、カメラ アイコン カメラアイコンノートブックのセルまたは Visualization Editor で) をクリックします。

  • 結果のセルでは、セル上にカーソルを移動すると、右上にカメラアイコンが表示されます。

    ノートブックセルのカメラ

  • ビジュアライゼーション エディターでは、カーソルをチャートの上に移動すると、カメラ アイコンが表示されます。 視覚化ツールを参照してください。

シリーズを一時的に非表示または表示する

ビジュアライゼーション内の系列を非表示にするには、凡例で系列をクリックします。 系列を再度表示するには、凡例でもう一度クリックします。

単一の系列のみを表示するには、凡例内の系列をダブルクリックします。他の系列を表示するには、それぞれの系列をクリックしてください。