ノートブックの出力と結果

ノートブックをクラスターにアタッチして 1 つ以上のセルを実行すると、ノートブックに状態が保持され、出力が表示されます。このセクションでは、ノートブックの状態と出力を管理する方法について説明します。

ノートブックの状態と出力をクリア

ノートブックの状態と出力をクリアするには、実行メニューの下部にある クリア オプションのいずれかを選択します。

メニューオプション	説明
すべてのセル出力をクリア	セル出力をクリアします。これは、ノートブックを共有し、結果を含めないようにする場合に便利です。
状態を消去	ノートブックの状態 (関数と変数の定義、データ、インポートされたライブラリなど) をクリアします。
状態と出力をクリア	セルの出力とノートブックの状態をクリアします。
状態をクリアしてすべて実行	ノートブックの状態をクリアし、新しい実行を開始します。

結果テーブル

セルを実行すると、結果が結果テーブルに表示されます。結果テーブルでは、次の操作を実行できます。

列または表形式の結果データの他のサブセットをクリップボードにコピーします。
結果表でテキスト検索をしてください。
データを並べ替えてフィルタリングします。
キーボードの矢印キーを使用して、テーブルのセル間を移動します。
列名またはセル値の一部を選択するには、ダブルクリックしてドラッグし、目的のテキストを選択します。
列エクスプローラーを使用して、列の検索、表示または非表示、ピン留め、および再配置を行います。

ノートブック結果テーブル

結果テーブルの制限を表示するには、「ノートブックの結果テーブルの制限」を参照してください。

データの選択

結果表のデータを選択するには、次のいずれかを実行してください。

データまたはデータのサブセットをクリップボードにコピーします。
列または行のヘッダーをクリックします。
テーブルの左上のセルをクリックして、テーブル全体を選択します。
任意のセルのセットにカーソルをドラッグして選択します。

選択情報を表示するサイドパネルを開くには、右上隅の検索ボックスの横にあるパネルアイコンをクリックします。

データをクリップボードにコピーする

結果テーブルを CSV 形式でクリップボードにコピーするには、テーブルのタイトルタブの横にある下向き矢印をクリックし、[ 結果をクリップボードにコピー ] をクリックします。

結果テーブルをクリップボードにコピーします。

または、テーブルの左上にあるボックスをクリックしてテーブル全体を選択し、右クリックしてドロップダウンメニューから[ コピー ]を選択します。

選択したデータをコピーするには、いくつかの方法があります。

MacOSの場合は Cmd + C 、Windowsの場合は Ctrl + C を押して、結果をCSV形式でクリップボードにコピーします。
右クリックして コピー を選択し、結果を CSV 形式でクリップボードにコピーします。
右クリックして コピー > を選択し、選択したデータをCSV、TSV、またはMarkdown形式でコピーします。

選択したデータをクリップボードにコピーします。

結果を並べ替える

結果テーブルを列の値で並べ替えるには、列名の上にカーソルを置きます。列名を含むアイコンがセルの右側に表示されます。矢印をクリックして列を並べ替えます。

列を並べ替える方法

複数の列で並べ替えるには、 Shift キーを押しながら列の並べ替え矢印をクリックします。

並べ替えは、デフォルトによる自然な並べ替え順序に従います。辞書式ソート順序を適用するには、SQLの ORDER BY を使用するか、環境で使用可能なそれぞれの SORT 関数を使用します。

結果をフィルタリングする

結果テーブルでフィルタを使用して、データを詳しく調べます。結果テーブルに適用されるフィルターは視覚化にも影響するため、基になるクエリやデータセットを変更せずに対話型の探索が可能になります。「ビジュアリゼーションのフィルター」を参照してください。

フィルターを作成するには、いくつかの方法があります。

Databricks Assistant
Filter dialog
By value
By column

アシスタントで自然言語プロンプトを使用する

自然言語プロンプトを使用してフィルターを作成します。

セル結果の右上にある [ ] をクリックします。
表示されるダイアログで、必要なフィルターを説明するテキストを入力します。
[ ] をクリックします。アシスタントがフィルターを生成して適用します。

アシスタントで追加のフィルターを作成する場合は、フィルターの横にあるをクリックして、別のプロンプトを入力します。

自然言語プロンプトによるデータのフィルタリングを参照してください。

フィルターを一時的に有効または無効にするには、ダイアログの 有効/無効 ボタンを切り替えます。

フィルターを削除するには、フィルター名の横にあるをクリックします。

完全なデータセットにフィルターを適用する

デフォルトでは、フィルタは結果テーブルに表示される結果にのみ適用されます。返されるデータが切り捨てられる場合 (たとえば、クエリが 10,000 行を超える行を返す場合や、データセットが 2 MB を超える場合)、フィルターは返された行にのみ適用されます。表の右上にあるメモは、切り捨てられたデータにフィルターが適用されたことを示しています。

代わりに、データセット全体をフィルタリングすることもできます。 切り捨てられたデータ をクリックし、 完全なデータセット を選択します。データセットのサイズによっては、フィルターの適用に時間がかかる場合があります。

データセット全体にフィルターを適用します。

フィルター処理された結果からクエリを作成する

SQLをデフォルト言語として使用したノートブックのフィルター済み結果テーブルまたはビジュアライゼーションから、フィルターが適用された新しいクエリを作成できます。テーブルまたはビジュアライゼーションの右上にある [ クエリの作成 ] をクリックします。クエリは、ノートブックの次のセルとして追加されます。

作成されたクエリは、元のクエリの上にフィルターを適用します。これにより、より小さく、より関連性の高いデータセットを操作できるため、より効率的なデータ探索と分析が可能になります。

フィルタ処理された結果からクエリを作成する方法を示す Gif。

列の探索

多くの列を持つテーブルの操作を容易にするために、カラムエクスプローラーを使用できます。カラムエクスプローラーを開くには、結果テーブルの右上にあるカラムアイコン () をクリックします。

カラムエクスプローラーでは、次のことができます。

列を検索する : 検索バーに入力して、列のリストをフィルタリングします。エクスプローラで列をクリックすると、結果テーブル内の列に移動します。
列を表示または非表示 にする: チェックボックスを使用して、列の表示を制御します。上部のチェックボックスは、すべての列の表示を一度に切り替えます。個々の列は、名前の横にあるチェックボックスを使用して表示または非表示にできます。
列のピン留め : 列名にカーソルを合わせると、ピン留めアイコンが表示されます。ピン留めアイコンをクリックして、列をピン留めします。ピン留めされた列は、結果テーブルを水平方向にスクロールしても表示されたままになります。
列を並べ替え る: 列の名前の右側にあるドラッグアイコン () をクリックしたまま、列を新しい目的の位置にドラッグアンドドロップします。これにより、結果テーブルの列が並べ替えられます。

カラムエクスプローラーを使用して、列の検索、表示または非表示、ピン留め、および再配置を行います。

列の書式設定

列ヘッダーは、列のデータ型を示します。たとえば、は整数データ型を示します。インジケーターにカーソルを合わせると、データ型が表示されます。

結果テーブルの列は、通貨、 パーセンテージ 、 URL などのタイプとしてフォーマットでき、小数点以下の桁数を制御してテーブルをより明確にすることができます。

列名でケバブメニューの列をフォーマットします。

列のケバブメニューをフォーマット

結果のダウンロード

デフォルトでは、結果のダウンロードは有効になっています。この設定を切り替えるには、「ノートブックから結果をダウンロードする機能を管理する」を参照してください。

表形式の出力を含むセル結果をローカルコンピューターにダウンロードできます。タブタイトルの横にある下向きの矢印をクリックします。メニューオプションは、結果の行数と Databricks Runtime のバージョンによって異なります。ダウンロードした結果は、ノートブック名に対応する名前の CSV ファイルとしてローカルマシンに保存されます。

セルの結果をダウンロードします。

SQLウェアハウスまたはサーバレスコンピュートに接続されているノートブックの場合、結果をExcelファイルとしてダウンロードすることもできます。

すべての行をExcelファイルにダウンロードします。

SQL セルの結果を調べる

Databricks ノートブックでは、SQL 言語セルの結果は、変数 _sqldfに割り当てられたデータフレームとして自動的に使用できます。 _sqldf変数を使用して、後続の Python セルと SQL セルで前の SQL 出力を参照できます。詳細については、「 SQL セルの結果の調査」を参照してください。

セルごとに複数の出力を表示する

Python ノートブックと Python 以外のノートブックの %python セルは、セルごとに複数の出力をサポートします。たとえば、次のコードの出力には、プロットとテーブルの両方が含まれています。

Python
import pandas as pd
from sklearn.datasets import load_iris

data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)

出力のサイズ変更

セル出力のサイズを変更するには、テーブルまたはビジュアライゼーションの右下隅をドラッグします。

出力テーブルのサイズを変更するには、右下隅をドラッグします。

Databricks Git フォルダーにノートブックの出力をコミットする

.ipynb のコミットについて学習するにはノートブック出力については、「 .ipynb ノートブック出力のコミットを許可する」を参照してください。

ノートブックは .ipynb である必要がありますファイル
ワークスペース管理者設定では、ノートブックの出力をコミットできるようにする必要があります

ノートブックの状態と出力をクリア​

結果テーブル​

データの選択​

データをクリップボードにコピーする​

結果を並べ替える​

結果をフィルタリングする​

完全なデータセットにフィルターを適用する​

フィルター処理された結果からクエリを作成する​

列の探索​

列の書式設定​

結果のダウンロード​

SQL セルの結果を調べる​

セルごとに複数の出力を表示する​

出力のサイズ変更​

Databricks Git フォルダーにノートブックの出力をコミットする​