ダッシュボードの可視化の種類
この記事では、AI/BI ダッシュボードで使用できる視覚化の種類の概要と、各視覚化の種類の例を作成する方法を示します。ダッシュボードの作成手順については、「 ダッシュボードの作成」を参照してください。自然言語を使用して、アシスタントに棒グラフ、折れ線グラフ、ポイントマップ、散布図、円グラフ、カウンターグラフを作成するように促すことができます。「Databricks Assistant を使用した視覚化の作成」を参照してください。
パフォーマンスを最適化するために、グラフは 10K 行または 10MB のいずれか小さい方のみをキャンバスにレンダリングできます。 そうしないと、可視化が切り捨てられる可能性があります。
エリアの可視化
エリア ビジュアライゼーションは、折れ線グラフと棒グラフのビジュアライゼーションを組み合わせて、1 つ以上のグループの数値が 2 番目の変数 (通常は時間の進行) でどのように変化するかを示します。これらは、時間の経過に伴うセールスファネルの変化を示すためによく使用されます。
レイアウトを調整するには:
- 可視化編集パネルの [Y 軸] セクションにある
[ ケバブ] メニューをクリックします。
- レイアウト セクションで、 スタック または 100% スタック を選択します。
構成値 : 指定されたエリア可視化の例では、次の値が設定されました。
-
データセット: TPCH orders
-
可視化: エリア
-
タイトル:
Total price and order year by order priority and clerk
-
X軸:
- フィールド:
o_orderdate
- スケールタイプ:
Temporal
- 変換:
Yearly
- 軸タイトル:
Order year
- フィールド:
-
Y軸:
- フィールド:
o_totalprice
- 軸タイトル:
Total price
- スケールタイプ:
Quantitative
- 変換:
Sum
- フィールド:
-
グループ化:
- フィールド:
o_orderpriority
- 凡例タイトル:
Order priority
- フィールド:
-
フィルタ
- フィールド:
TPCH orders.o_clerk
- フィールド:
SQL クエリ : このエリアの視覚化では、次の SQL クエリを使用して TPCH orders
という名前のデータセットが生成されました。
SELECT * FROM samples.tpch.orders
棒グラフ
棒グラフは、時間の経過に伴う、またはカテゴリ間でのメトリクスの変化を表し、 円の可視化と同様に比例性を示します。
レイアウトを調整するには:
- 可視化編集パネルの [Y 軸] セクションにある
[ ケバブ] メニューをクリックします。
- レイアウト セクションで、 スタック または 100% スタック または グループ を選択します。
構成値 : 指定された棒グラフの例では、次の値が設定されています。
-
データセット: TPCH orders
-
可視化: バー
-
タイトル:
Total price and order month by order priority and clerk
-
X軸:
- フィールド:
o_orderdate
- 変換:
Monthly
- スケールタイプ:
Temporal
- 軸タイトル:
Order month
- フィールド:
-
Y軸:
- フィールド:
o_totalprice
- スケールタイプ:
Quantitative
- 変換:
Sum
- 軸タイトル:
Total price
- フィールド:
-
グループ化:
- フィールド:
o_orderpriority
- 凡例タイトル:
Order priority
- フィールド:
-
フィルタ
- フィールド:
TPCH orders.o_clerk
- フィールド:
SQL クエリ : 次の SQL クエリは、このバーの可視化のデータ セット TPCH orders
を生成しました。
SELECT * FROM samples.tpch.orders
ボックスチャート
ボックス チャートの可視化には、数値データの分布の概要が表示され、必要に応じてカテゴリ別にグループ化されます。 ボックス チャートの可視化を使用すると、カテゴリ間の値の範囲をすばやく比較し、値の局所性、広がり、歪度グループを四分位数で視覚化できます。 各ボックスの暗い線は四分位範囲を示しています。 ボックス プロットの可視化の解釈の詳細については、Wikipedia の 「ボックス チャート」の記事 を参照してください。
提供されているボックス チャートの例では、次の値が設定されています。
- X 列 (データセット列):
l-returnflag
- Y 列 (データセット列):
l_extendedprice
- X軸のタイトル:
Return flag1
- Y軸のタイトル:
Extended price
SQL クエリ : このボックス チャートの可視化では、次の SQL クエリを使用してデータ セットが生成されました。
select * from samples.tpch.lineitem
バブルチャート
バブルチャートは、各ポイントマーカーのサイズが関連するメトリクスを反映している散布図です。 バブル チャートを作成するには、視覚化の種類として 散布図 を選択します。 サイズ 設定で、マーカーのサイズで表すメトリクスを選択します。
設定値 :提供されているバブルチャートの例では、次の値が設定されています。
-
データセット: NYC taxi trips
-
可視化: スキャッター
-
タイトル:
Trip distance, fares, and trip duration
-
X軸:
- フィールド:
trip_distance
- スケールタイプ:
Quantitative
- 変換:
None
- フィールド:
-
Y軸:
- フィールド:
fare_amount
- スケールタイプ:
Quantitative
- 変換:
None
- フィールド:
-
カラーバイ:
- フィールド:
pickup_zip
- フィールド:
-
サイズ:
- フィールド:
time_spent
- 変換:
None
- フィールド:
コロプレス地図
コロプレスの視覚化では、国や州などの地理的な地域は、各キー列の集計値に従って色分けされます。クエリは、地理的な場所を名前で返す必要があります。ユーザーは、国、州、郡、地区レベルで行政境界を表示するマップを作成できます。
構成値 : このコロプレスの視覚化では、次の値が設定されました。
- データセット:
tcph nation
- 国名
Country
- カラー:合計(c_acct_bal)
SQL クエリ : このコロプレスの視覚化では、次の SQL クエリを使用してデータ セットが生成されました。
SELECT
initcap(n_name) as Country,
sum(c_acctbal)
FROM samples.tpch.customer
join samples.tpch.nation where n_nationkey = c_nationkey
GROUP BY 1
コンボグラフ
コンボ チャートは、折れ線グラフと横棒グラフを組み合わせて、時間の経過に伴う変化を比例して表示します。
構成値 : このコンボ グラフの視覚化では、次の値が設定されました。
-
データセット: partsupp
-
視覚化: コンボ
-
X軸:
ps_partkey
- スケールタイプ:
Quantitative
- スケールタイプ:
-
Y軸:
- バー:
ps_availqty
- 集計の種類:
SUM
- 線:
ps_supplycost
- 集計の種類:
AVG
- バー:
-
Yシリーズによるカラー:
Sum of ps_availqty
Average ps_supplycost
SQL クエリ : このコンボ チャートの視覚化では、次の SQL クエリを使用してデータ セットが生成されました。
SELECT * FROM samples.tpch.partsupp
2 軸コンボ グラフ
コンボグラフを使用して、2 つの異なる y 軸を表示できます。 コンボチャートウィジェットを選択した状態で、チャート設定パネルの Y軸 設定にある ケバブメニューをクリックします。 2 軸を有効にする オプションをオンにします。
構成値 : このコンボ グラフでは、[ 二重軸を有効にする ] オプションがオンです。 その他の設定は次のように設定します。
-
データセット: Trips
-
視覚化: コンボ
-
X軸:
tpep_pickup_datetime
- スケールタイプ:
Temporal
- 変換:
Weekly
- スケールタイプ:
-
Y軸:
-
左のY軸 (バー):
trip_distance
- 変換:
AVG
- 変換:
-
右の Y 軸 (直線):
fare_amount
- 変換:
AVG
- 変換:
-
Yシリーズ別の色:
Average trip_distance
Average fare_amount
SQL クエリ : 次の SQL クエリを使用して、データ セットが生成されました。
SELECT * FROM samples.nyctaxi.trips
カウンターの可視化
カウンターは 1 つの値を目立つように表示し、それらをターゲット値と比較するオプションもあります。カウンターを使用するには、カウンターのビジュアリゼーションに表示するデータを [値 ] 列と [ターゲット ] 列に指定します。視覚化エディターで集計を適用する場合、次の例のように [値] 行番号 を選択して値を比較することはできません。特定の行値を比較するには、その行を定義する SQL に必要な集計を含むデータセットを使用します。これにより、比較対象と値の行を選択できます。
条件付き書式を設定し、テキストスタイルをカスタマイズするには、 値 設定の詳細を使用します。
設定値 :このカウンターの視覚化の例では、次の値が設定されています。
-
データセット: 反例
-
可視化: カウンター
-
タイトル:
Orders: Total price by date (previous two days)
-
価値:
- フィールド:
total price
- 値の行番号: 1
- フィールド:
-
ターゲット:
- フィールド:
total price
- 値の行番号: 2
- フィールド:
SQL クエリ : このカウンターの視覚化では、次の SQL クエリを使用してデータセットが生成されました。
SELECT
SUM(o_totalprice) as `total price`,
o_orderdate
FROM
samples.tpch.orders
GROUP BY o_orderdate
ORDER BY o_orderdate DESC
ファネルチャート
ファネルチャートは、さまざまな段階でメトリクスの変化を分析するのに役立ちます。 ファネルを使用するには、 step
列と value
列を指定します。
たとえば、次のファネル チャートは、ユーザーがサインアップ フローの段階をどのように進めるかを示しています。各ステージはプロセスのステップを表し、そのサイズはそのステップに到達したユーザーの数を反映します。
構成値 : このファネル チャートでは、次の値が設定されています。
-
データセット: ユーザーエンゲージメントファネルステージ
-
視覚化: ファネル
-
X軸:
stage
-
Y軸:
count
- 集計の種類:
SUM
- 集計の種類:
-
カラーカラム:
- データセット列:
count
- データセット列:
SQL クエリ : 次の SQL クエリは、このファネル チャートの視覚化のデータセットを生成しました。
SELECT *
FROM VALUES
('Visited Website', 10000),
('Signed Up', 4000),
('Activated Account', 2500),
('Added First Item', 1500),
('Completed Purchase', 800)
AS funnel(stage, count);
ヒートマップチャート
ヒートマップチャートは、棒グラフ、積み上げチャート、バブルチャートの機能を融合させ、数値データを色で可視化することができます。
たとえば、次のヒートマップは、優先度と配送方法に基づいて注文の数を視覚化します。X 軸はさまざまな注文の優先順位を表し、Y 軸はさまざまな配送方法を表します。色の濃さは注文数の合計を示し、凡例は注文数のスケールを示します。
ヒートマップには、最大 64K 行または 10MB まで表示できます。
構成値 : このヒートマップ グラフの可視化では、次の値が設定されました。
-
データセット: TPCH orders
-
視覚化: ヒートマップ
-
X軸:
priority
-
Y軸:
ship_mode
-
カラーカラム:
- データセット列:
order_count
- 集計の種類:
SUM
- データセット列:
-
X 軸の名前 (デフォルト値を上書き):
Order Priority
-
Y軸名(デフォルト値を上書き):
Shipping method
-
カラーランプ:
Green Blue
SQL クエリ : このヒートマップ チャートの視覚化では、次の SQL クエリを使用してデータ セットが生成されました。
SELECT
o.o_orderpriority AS priority,
l.l_shipmode AS ship_mode,
COUNT(*) AS order_count,
o.o_orderdate
FROM
samples.tpch.orders AS o
JOIN
samples.tpch.lineitem AS l
ON
o.o_orderkey = l.l_orderkey
GROUP BY
o.o_orderpriority,
l.l_shipmode,
o.o_orderdate
ORDER BY
priority,
ship_mode;
ヒストグラム チャート
ヒストグラムは、データセットで特定の値が発生する頻度をプロットします。 ヒストグラムは、データセットの値が少数の範囲に集まっているのか、それともより広がっているのかを理解するのに役立ちます。 ヒストグラムは、個別のバー (ビンとも呼ばれます) の数を制御する棒グラフとして表示されます。
構成値 : このヒストグラム グラフの視覚化では、次の値が設定されました。
- データセット: TPCH orders
- 可視化: ヒストグラム
- X 列 (データセット列):
o_totalprice
- ビンの数:20
- X 軸の名前 (デフォルト値を上書き):
Total price
構成オプション : ヒストグラム・チャートの構成オプションについては、 ヒストグラム・チャートの構成オプションを参照してください。
SQL クエリ : このヒストグラム グラフの視覚化では、次の SQL クエリを使用してデータ セットが生成されました。
select * from samples.tpch.orders
ライン可視化
折れ線グラフの可視化は、時間の経過に伴う 1 つ以上のメトリクスの変化を示します。
設定値 :このライン可視化の例では、次の値が設定されています。
-
データセット: TPCH orders
-
可視化: 折れ線
-
タイトル:
Average price and order year by order priority and clerk
-
X軸:
- フィールド:
o_orderdate
- 変換:
Yearly
- スケールタイプ:
Temporal
- 軸タイトル:
Order year
- フィールド:
-
Y軸:
- フィールド:
o_totalprice
- 変換:
Average
- スケールタイプ:
Quantitative
- 軸タイトル:
Average price
- フィールド:
-
グループ化:
- フィールド:
o_orderpriority
- 凡例タイトル:
Order priority
- フィールド:
-
フィルタ
- フィールド:
TPCH orders.o_clerk
- フィールド:
SQL クエリ : このバーの視覚化可視化では、次の SQL クエリを使用して TPCH orders
という名前のデータセットが生成されました。
SELECT * FROM samples.tpch.orders
円の可視化
円の可視化は、メトリクス間の比例性を示します。 時系列データを伝達するための ものではありません 。
構成値 : この円グラフの視覚化の例では、次の値が設定されました。
-
データセット: TPCH orders
-
可視化: 円グラフの可視化
-
タイトル:
Total price by order priority and clerk
-
角度:
- フィールド:
o_totalprice
- 変換:
Sum
- 軸タイトル:
Total price
- フィールド:
-
グループ化:
- フィールド:
o_orderpriority
- 凡例タイトル:
Order priority
- フィールド:
-
フィルタ
- フィールド:
TPCH orders.o_clerk
- フィールド:
SQL クエリ : この円グラフの可視化では、次の SQL クエリを使用して TPCH orders
という名前のデータセットが生成されました。
SELECT * FROM samples.tpch.orders
ピボットの可視化
ピボット視覚化は、クエリ結果のレコードを表形式表示に集約します。これは、SQL の PIVOT
ステートメントや GROUP BY
ステートメントに似ています。ピボットの視覚化は、ドラッグアンドドロップフィールドを使用して構成します。
パフォーマンス上の理由から、ピボットテーブルは100列 x 100行のレンダリングしかサポートしていません。
構成値 : このピボット可視化の例では、次の値が設定されました。
-
データセット: TPCH lineitem
-
可視化: ピボット
-
タイトル:
Line item quantity by return flag and ship mode by supplier
-
行:
- フィールド:
l_returnflag
- フィールド:
-
列:
- フィールド:
l_shipmode
- フィールド:
-
セル
- データセット:
- フィールド:
l_quantity
- 変換:合計
-
フィルタ
- フィールド:
TPCH lineitem.l_supplierkey
- フィールド:
SQL クエリ : このピボット可視化では、次の SQL クエリを使用して TPCH lineitem
という名前のデータセットが生成されました。
SELECT * FROM samples.tpch.lineitem
ポイントマップ
ポイントマップは、定量的データを特定のマップ位置に配置されたシンボルとして表示します。 マーカーは緯度と経度の座標を使用して配置されます。このグラフタイプの結果セットには、これらの座標を含める必要があります。 次の例では、ニューヨーク州ニューヨークでの自動車衝突事故のデータを使用しています。
構成値 : このポイント マップ 可視化では、次の値が設定されました。
-
データセット: シアトルの住宅価格分析
-
視覚化: ポイント マップ
-
座標:
- 緯度:
LATITUDE
- 経度:
LONGITUDE
- 緯度:
-
色:
- フィールド:
avg(bedrooms)
- スケールタイプ: カテゴリ
- フィールド:
-
サイズ:
- フィールド:
avg(price)
- フィールド:
Databricks データセットには緯度または経度のデータが含まれていないため、この例ではサンプル SQL クエリは提供されていません。
サンキー図
サンキー図は、ある値セットから別の値セットへのフローを視覚化します。
構成値 : このサンキー ダイアグラムでは、次の値が設定されました。
-
データセット: サンキーの例
-
可視化:サンキー
-
ステージ
stage1
stage2
-
値
- SUM(値)
SQL クエリ : この サンキー 可視化では、次の SQL クエリを使用してデータ セットが生成されました。
SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10
散布図の可視化
散布図の可視化は、2 つの数値変数間の関係を示すためによく使用されます。 3 番目の次元を色でエンコードして、数値変数がグループ間でどのように異なるかを示すことができます。
構成値 : この散布図の可視化の例では、次の値が設定されました。
-
データセット: TPCH lineitem
-
可視化: スキャッター
-
タイトル:
Total price and quantity by ship mode and supplier
-
X軸:
- フィールド:
l_quantity
- 軸タイトル:
Quantity
- スケールタイプ:
Quantitative
- 変換:
None
- フィールド:
-
Y軸:
- フィールド:
l_extendedprice
- スケールタイプ:
Quantitative
- 変換:
None
- 軸タイトル:
Price
- フィールド:
-
グループ化:
- フィールド:
l_shipmode
- 凡例タイトル:
Ship mode
- フィールド:
-
フィルタ
- フィールド:
TPCH lineitem.l_supplierkey
- フィールド:
SQL クエリ : この散布図の可視化では、次の SQL クエリを使用して TPCH lineitem
という名前のデータセットが生成されました。
SELECT * FROM samples.tpch.lineitem
テーブルの可視化
テーブルの視覚化では、標準のテーブルにデータが表示されますが、データの並べ替え、非表示、および書式設定を手動で行うことができます。
テーブルには最大64,000行または10MBまで表示できます。
構成値 : このテーブル可視化の例では、次の値が設定されました。
-
データセット: TPCH lineitem
-
視覚化: テーブル
-
タイトル:
Line item summary by supplier
-
列:
-
表示行番号: 有効
-
フィールド:
l_orderkey
-
フィールド:
l_extendedprice
- 表示形式:
Number
- 数値フォーマット:$0.00
- 表示形式:
-
フィールド:
l_discount
- 表示形式:
Number
- 数値フォーマット:%0.00
- 表示形式:
-
フィールド:
l_tax
- 表示形式:
Number
- 数値フォーマット:%0.00
- 表示形式:
-
フィールド:
l_shipdate
-
フィールド:
l_shipmode
-
-
フィルタ
- フィールド:
TPCH lineitem.l_supplierkey
- フィールド:
構成オプション : テーブル可視化の構成オプションについては、 テーブル オプションを参照してください。
SQL クエリ : このテーブル可視化では、次の SQL クエリを使用して TPCH lineitem
という名前のデータセットが生成されました。
SELECT * FROM samples.tpch.lineitem