ダッシュボードの視覚化の種類
この記事では、AI/BI ダッシュボードで使用できる視覚化の種類の概要と、各視覚化の種類の例を作成する方法を示します。 ダッシュボードの作成手順については、「 ダッシュボードの作成」を参照してください。 自然言語を使用して、アシスタントに棒グラフ、折れ線グラフ、散布図、円グラフ、およびカウンターグラフを作成するように促すことができます。 「Databricks Assistant を使用した視覚化の作成」を参照してください。
パフォーマンスを最適化するために、グラフは 10K 行または 10MB のいずれか小さい方のみをキャンバスにレンダリングできます。 そうしないと、ビジュアライゼーションが切り捨てられる可能性があります。
エリアの視覚化
エリア ビジュアライゼーションは、折れ線グラフと棒グラフのビジュアライゼーションを組み合わせて、1 つ以上のグループの数値が 2 番目の変数 (通常は時間の進行) でどのように変化するかを示します。 これらは、時間の経過に伴うセールスファネルの変化を示すためによく使用されます。
レイアウトを調整するには:
- ビジュアライゼーション編集パネルの[Y 軸]
セクションにある [ ケバブ] メニューをクリックします。
- [レイアウト ] セクションで、[ スタック ] または [100% スタック ] を選択します。
構成値 : 提供されたエリア視覚化の例では、次の値が設定されました。
-
データセット: TPCH 注文
-
ビジュアライゼーション: エリア
-
タイトル:
Total price and order year by order priority and clerk
-
X軸:
- フィールド:
o_orderdate
- スケールタイプ:
Temporal
- 変換:
Yearly
- 軸タイトル:
Order year
- フィールド:
-
Y軸:
- フィールド:
o_totalprice
- 軸タイトル:
Total price
- スケールタイプ:
Quantitative
- 変換:
Sum
- フィールド:
-
グループ化:
- フィールド:
o_orderpriority
- 凡例タイトル:
Order priority
- フィールド:
-
フィルタ
- フィールド:
TPCH orders.o_clerk
- フィールド:
SQL クエリ : このエリアの視覚化では、次の SQL クエリを使用して TPCH orders
という名前のデータセットが生成されました。
SELECT * FROM samples.tpch.orders
棒グラフ
棒グラフは、時間の経過に伴う、またはカテゴリ間でのメトリクスの変化を表し、 円の 視覚化と同様に比例性を示します。
レイアウトを調整するには:
- ビジュアライゼーション編集パネルの[Y 軸]
セクションにある [ ケバブ] メニューをクリックします。
- [レイアウト ] セクションで、[ スタック ] または [100% スタック ] または [グループ ] を選択します。
構成値 : 提供されている棒グラフの例では、次の値が設定されています。
-
データセット: TPCH 注文
-
視覚化: バー
-
タイトル:
Total price and order month by order priority and clerk
-
X軸:
- フィールド:
o_orderdate
- 変換:
Monthly
- スケールタイプ:
Temporal
- 軸タイトル:
Order month
- フィールド:
-
Y軸:
- フィールド:
o_totalprice
- スケールタイプ:
Quantitative
- 変換:
Sum
- 軸タイトル:
Total price
- フィールド:
-
グループ化:
- フィールド:
o_orderpriority
- 凡例タイトル:
Order priority
- フィールド:
-
フィルタ
- フィールド:
TPCH orders.o_clerk
- フィールド:
SQL クエリ : 次の SQL クエリは、このバーの視覚化のデータ セット TPCH orders
を生成しました。
SELECT * FROM samples.tpch.orders
ボックスチャート
ボックス チャートの視覚化には、数値データの分布の概要が表示され、必要に応じてカテゴリ別にグループ化されます。 ボックス チャートの視覚化を使用すると、カテゴリ間の値の範囲をすばやく比較し、値の局所性、広がり、歪度グループを四分位数で視覚化できます。 各ボックスの暗い線は四分位範囲を示しています。 ボックス プロットの視覚化の解釈の詳細については、Wikipedia の 「ボックス チャート」の記事 を参照してください。
提供されているボックス チャートの例では、次の値が設定されています。
- X 列 (データセット列):
l-returnflag
- Y 列 (データセット列):
l_extendedprice
- X軸のタイトル:
Return flag1
- Y軸のタイトル:
Extended price
SQL クエリ : このボックス チャートの視覚化では、次の SQL クエリを使用してデータ セットが生成されました。
select * from samples.tpch.lineitem
バブルチャート
バブルチャートは、各ポイントマーカーのサイズが関連するメトリクスを反映している散布図です。 バブル チャートを作成するには、視覚化の種類として [散布 図] を選択します。 「サイズ 」設定で、マーカーのサイズで表すメトリクスを選択します。
設定値 :提供されているバブルチャートの例では、次の値が設定されています。
-
データセット: NYC タクシー旅行
-
ビジュアライゼーション: スキャッター
-
タイトル:
Trip distance, fares, and trip duration
-
X軸:
- フィールド:
trip_distance
- スケールタイプ:
Quantitative
- 変換:
None
- フィールド:
-
Y軸:
- フィールド:
fare_amount
- スケールタイプ:
Quantitative
- 変換:
None
- フィールド:
-
カラーバイ:
- フィールド:
pickup_zip
- フィールド:
-
サイズ:
- フィールド:
time_spent
- 変換:
None
- フィールド:
コンボグラフ
コンボ チャートは、折れ線グラフと横棒グラフを組み合わせて、時間の経過に伴う変化を比例して表示します。
構成値 : このコンボ グラフの視覚化では、次の値が設定されました。
-
データセット: partsupp
-
視覚化: コンボ
-
X軸:
ps_partkey
- スケールタイプ:
Quantitative
- スケールタイプ:
-
Y軸:
- バー:
ps_availqty
- 集計の種類:
SUM
- 線:
ps_supplycost
- 集計の種類:
AVG
- バー:
-
Yシリーズによるカラー:
Sum of ps_availqty
Average ps_supplycost
SQL クエリ : このコンボ チャートの視覚化では、次の SQL クエリを使用してデータ セットが生成されました。
SELECT * FROM samples.tpch.partsupp
2 軸コンボ グラフ
コンボグラフを使用して、2 つの異なる y 軸を表示できます。 コンボチャートウィジェットを選択した状態で、チャート設定パネルの Y軸 設定にある ケバブメニューをクリックします。 [2 軸を有効にする ] オプションをオンにします。
構成値 : このコンボ グラフでは、[ 二重軸を有効にする ] オプションがオンです。 その他の設定は次のように設定します。
-
データセット: Trips
-
視覚化: コンボ
-
X軸:
tpep_pickup_datetime
- スケールタイプ:
Temporal
- 変換:
Weekly
- スケールタイプ:
-
Y軸:
-
左のY軸 (バー):
trip_distance
- 変換:
AVG
- 変換:
-
右の Y 軸 (直線):
fare_amount
- 変換:
AVG
- 変換:
-
Yシリーズ別の色:
Average trip_distance
Average fare_amount
SQL クエリ : 次の SQL クエリを使用して、データ セットが生成されました。
SELECT * FROM samples.nyctaxi.trips
カウンターの視覚化
カウンターは 1 つの値を目立つように表示し、それらをターゲット値と比較するオプションもあります。 カウンターを使用するには、 Value Column と TargetColumn のカウンター ビジュアリゼーションに表示するデータ行を指定します。
条件付き書式を設定し、テキストスタイルをカスタマイズするには、 値 設定の詳細を使用します。
設定値 :このカウンターの視覚化の例では、次の値が設定されています。
-
データセット: TPCH 注文
-
視覚化: カウンター
-
タイトル:
Orders: Target amount vs. actual amount by date
-
価値:
- フィールド:
avg(o_totalprice)
- 値の行番号: 1
- フィールド:
-
ターゲット:
- フィールド:
avg(o_totalprice)
- 値の行番号: 2
- フィールド:
-
フィルタ
- フィールド:
TPCH orders.o_orderdate
- フィールド:
SQL クエリ : このカウンターの視覚化では、次の SQL クエリを使用して TPCH orders_target
という名前のデータセットが生成されました。
SELECT o_orderdate, avg(o_totalprice)
FROM samples.tpch.orders
GROUP BY 1
ORDER BY 1
ラインビジュアライゼーション
折れ線グラフの視覚化は、時間の経過に伴う 1 つ以上のメトリクスの変化を示します。
設定値 :このラインビジュアライゼーションの例では、次の値が設定されています。
-
データセット: TPCH 注文
-
視覚化: 折れ線
-
タイトル:
Average price and order year by order priority and clerk
-
X軸:
- フィールド:
o_orderdate
- 変換:
Yearly
- スケールタイプ:
Temporal
- 軸タイトル:
Order year
- フィールド:
-
Y軸:
- フィールド:
o_totalprice
- 変換:
Average
- スケールタイプ:
Quantitative
- 軸タイトル:
Average price
- フィールド:
-
グループ化:
- フィールド:
o_orderpriority
- 凡例タイトル:
Order priority
- フィールド:
-
フィルタ
- フィールド:
TPCH orders.o_clerk
- フィールド:
SQL クエリ : このバーの視覚化ビジュアライゼーションでは、次の SQL クエリを使用して TPCH orders
という名前のデータセットが生成されました。
SELECT * FROM samples.tpch.orders
ヒートマップチャート
ヒートマップチャートは、バーチャート、スタッキング、バブルチャートの機能を組み合わせたもので、数値データを色で視覚化できます。 ヒートマップの一般的なカラーパレットは、オレンジや赤などの暖かい色で最高値を表示し、青や紫などの冷たい色で最低値を表示します。
たとえば、次のヒートマップは、各日に最も頻繁に発生するタクシー乗車距離を視覚化し、その結果を曜日、距離、および合計料金でグループ化します。
ヒートマップには、最大 64K 行または 10MB まで表示できます。
構成値 : このヒートマップ グラフの視覚化では、次の値が設定されました。
-
データセット: TPCH 注文
-
視覚化: ヒートマップ
-
X 列 (データセット列):
o_orderpriority
-
Y 列 (データセット列):
o_orderstatus
-
カラーカラム:
- データセット列:
o_totalprice
- 集計の種類:
Average
- データセット列:
-
X 軸の名前 (デフォルト値を上書き):
Order priority
-
Y軸名(デフォルト値を上書き):
Order status
-
配色 (デフォルト値を上書き):
YIGnBu
SQL クエリ : このヒートマップ チャートの視覚化では、次の SQL クエリを使用してデータ セットが生成されました。
SELECT * FROM samples.tpch.orders
ヒストグラム チャート
ヒストグラムは、データセットで特定の値が発生する頻度をプロットします。 ヒストグラムは、データセットの値が少数の範囲に集まっているのか、それともより広がっているのかを理解するのに役立ちます。 ヒストグラムは、個別のバー (ビンとも呼ばれます) の数を制御する棒グラフとして表示されます。
構成値 : このヒストグラム グラフの視覚化では、次の値が設定されました。
- データセット: TPCH 注文
- 視覚化: ヒストグラム
- X 列 (データセット列):
o_totalprice
- ビンの数:20
- X 軸の名前 (デフォルト値を上書き):
Total price
構成オプション : ヒストグラム・チャートの構成オプションについては、 ヒストグラム・チャートの構成オプションを参照してください。
SQL クエリ : このヒストグラム グラフの視覚化では、次の SQL クエリを使用してデータ セットが生成されました。
select * from samples.tpch.orders
円 見える化
円 visualizations は、メトリクス間の比例性を示します。 時系列データを伝達するための ものではありません 。
構成値 : この円グラフの視覚化の例では、次の値が設定されました。
-
データセット: TPCH 注文
-
視覚化: 円グラフの視覚化
-
タイトル:
Total price by order priority and clerk
-
角度:
- フィールド:
o_totalprice
- 変換:
Sum
- 軸タイトル:
Total price
- フィールド:
-
グループ化:
- フィールド:
o_orderpriority
- 凡例タイトル:
Order priority
- フィールド:
-
フィルタ
- フィールド:
TPCH orders.o_clerk
- フィールド:
SQL クエリ : この円グラフの視覚化では、次の SQL クエリを使用して TPCH orders
という名前のデータセットが生成されました。
SELECT * FROM samples.tpch.orders
ピボットの視覚化
ピボット視覚化は、クエリ結果のレコードを表形式表示に集約します。 これは、SQL の PIVOT
ステートメントや GROUP BY
ステートメントに似ています。 ピボットの視覚化は、ドラッグアンドドロップフィールドを使用して構成します。
パフォーマンス上の理由から、ピボットテーブルは100列 x 100行のレンダリングしかサポートしていません。
構成値 : このピボット視覚化の例では、次の値が設定されました。
-
データセット: TPCH lineitem
-
視覚化: ピボット
-
タイトル:
Line item quantity by return flag and ship mode by supplier
-
行:
- フィールド:
l_returnflag
- フィールド:
-
列:
- フィールド:
l_shipmode
- フィールド:
-
セル
- データセット:
- フィールド:
l_quantity
- 変換:合計
-
フィルタ
- フィールド:
TPCH lineitem.l_supplierkey
- フィールド:
SQL クエリ : このピボット視覚化では、次の SQL クエリを使用して TPCH lineitem
という名前のデータセットが生成されました。
SELECT * FROM samples.tpch.lineitem
ポイントマップ
ポイントマップは、定量的データを特定のマップ位置に配置されたシンボルとして表示します。 マーカーは緯度と経度の座標を使用して配置されます。このグラフタイプの結果セットには、これらの座標を含める必要があります。 次の例では、ニューヨーク州ニューヨークでの自動車衝突事故のデータを使用しています。
構成値 : このポイント マップ ビジュアライゼーションでは、次の値が設定されました。
-
データセット: 自動車の衝突事故
-
視覚化: シンボル マップ
-
座標:
- 緯度:
LATITUDE
- 経度:
LONGITUDE
- 緯度:
-
色/グループ化:
- フィールド:
CONTRIBUTING FACTOR
- フィールド:
Databricks データセットには緯度または経度のデータが含まれていないため、この例ではサンプル SQL クエリは提供されていません。
散布図の視覚化
散布図の視覚化は、2 つの数値変数間の関係を示すためによく使用されます。 3 番目の次元を色でエンコードして、数値変数がグループ間でどのように異なるかを示すことができます。
構成値 : この散布図の視覚化の例では、次の値が設定されました。
-
データセット: TPCH lineitem
-
ビジュアライゼーション: スキャッター
-
タイトル:
Total price and quantity by ship mode and supplier
-
X軸:
- フィールド:
l_quantity
- 軸タイトル:
Quantity
- スケールタイプ:
Quantitative
- 変換:
None
- フィールド:
-
Y軸:
- フィールド:
l_extendedprice
- スケールタイプ:
Quantitative
- 変換:
None
- 軸タイトル:
Price
- フィールド:
-
グループ化:
- フィールド:
l_shipmode
- 凡例タイトル:
Ship mode
- フィールド:
-
フィルタ
- フィールド:
TPCH lineitem.l_supplierkey
- フィールド:
SQL クエリ : この散布図の視覚化では、次の SQL クエリを使用して TPCH lineitem
という名前のデータセットが生成されました。
SELECT * FROM samples.tpch.lineitem
テーブルの視覚化
テーブルの視覚化では、標準のテーブルにデータが表示されますが、データの並べ替え、非表示、および書式設定を手動で行うことができます。
テーブルには最大64,000行または10MBまで表示できます。
構成値 : このテーブル視覚化の例では、次の値が設定されました。
-
データセット: TPCH lineitem
-
視覚化: テーブル
-
タイトル:
Line item summary by supplier
-
列:
-
表示行番号: 有効
-
フィールド:
l_orderkey
-
フィールド:
l_extendedprice
- 表示形式:
Number
- 数値フォーマット:$0.00
- 表示形式:
-
フィールド:
l_discount
- 表示形式:
Number
- 数値フォーマット:%0.00
- 表示形式:
-
フィールド:
l_tax
- 表示形式:
Number
- 数値フォーマット:%0.00
- 表示形式:
-
フィールド:
l_shipdate
-
フィールド:
l_shipmode
-
-
フィルタ
- フィールド:
TPCH lineitem.l_supplierkey
- フィールド:
構成オプション : テーブル視覚化の構成オプションについては、 テーブル オプションを参照してください。
SQL クエリ : このテーブル視覚化では、次の SQL クエリを使用して TPCH lineitem
という名前のデータセットが生成されました。
SELECT * FROM samples.tpch.lineitem