ノートブックの出力と結果

ノートブック をクラスターにアタッチ し、 1 つ以上のセルを実行すると、ノートブックに状態が設定され、出力が表示されます。 このセクションでは、ノートブックの状態と出力を管理する方法について説明します。

ノートブックの状態と出力 をクリアする

ノートブックの状態と出力をクリアするには、[実行] メニューの下部にある [クリア] オプションのいずれかを選択します。

メニューオプション

説明

すべてのセル出力をクリアする

セル出力をクリアします。 これは、ノートブックを共有していて、結果を含めない場合に便利です。

クリア状態

関数と変数の定義、データ、インポートされたライブラリを含むノートブックの状態をクリアします。

クリア状態と出力

セル出力とノートブックの状態の両方をクリアします。

状態をクリアしてすべて実行する

ノートブックの状態をクリアし、新しい実行を開始します。

結果 を表示

セルを実行すると、テーブルの結果は最大 10,000 行または 2 MB のいずれか小さい方を返します。

デフォルトでは、テキストの結果は最大 50,000 文字を返します。 Databricks Runtime 12.1 以降では、Spark 構成プロパティを spark.databricks.driver.maxReplOutputLengthに設定することで、この制限を増やすことができます。

Python を使用してネイティブに Python ノートブックで SQL セルの結果を調べる

SQL を使用してデータを読み込み、Python を使用して探索できます。 Databricks Python ノートブックでは、SQL 言語セルからのテーブル結果は、Python DataFrameとして自動的に使用可能になります。 詳細については、「 Python ノートブックでの SQL セルの結果の調査」を参照してください。

新しいセル結果テーブル

プレビュー

この機能はパブリックプレビュー段階です。

これで、新しいセル結果テーブルのレンダリングを選択できます。 新しい結果表では、以下の操作を行うことができます。

  • 表形式の結果の列またはその他のサブセットをクリップボードにコピーします。

  • 結果テーブルに対してテキスト検索を実行します。

  • データの並べ替えとフィルター処理を行います

  • 表のセル間を移動するには、キーボードの矢印キーを使用します。

  • 列名またはセル値の一部をダブルクリックしてドラッグし、目的のテキストを選択します。

新しい結果表を使用可能にするには、セル結果の右上隅にある「 新規結果表 」をクリックし、トグル・セレクターを「 オフ 」から 「オン」に変更します。

新規結果表示セレクタ

この機能がオンの場合、列ヘッダーまたは行ヘッダーをクリックして列または行全体を選択したり、テーブルの左上のセルをクリックしてテーブル全体を選択したりできます。 長方形のセルセットにカーソルをドラッグして選択できます。

選択したデータをクリップボードにコピーするには、MacOSの場合は Cmd + c キー、Windowsの場合は Ctrl + c を押すか、右クリックしてドロップダウンメニューから[ コピー ]を選択します。

結果テーブル内のテキストを検索するには、[ 検索 ] ボックスにテキストを入力します。 一致するセルが強調表示されます。

選択に関する情報を表示するサイドパネルを開くには、パネルアイコン 検索 ボックスの右上隅にあるパネルアイコンアイコン をクリックします。

パネルアイコンの位置

列ヘッダーは、列のデータ型を示します。 たとえば、整数 Integer型カラムのインジケータ データ型を示します。 インジケーターにカーソルを合わせると、データ型が表示されます。

結果の並べ替えとフィルター処理

新しいセル結果テーブル レンダリングを使用すると、結果を並べ替えたりフィルター処理したりできます。

列の値でテーブルを並べ替えるには、列名の上にカーソルを置きます。 列名を含むセルの右側に、アイコンが表示されます。 矢印をクリックして列を並べ替えます。 連続してクリックすると、昇順、降順、または未ソートの並べ替えが切り替わります。

列を並べ替える方法

複数の列で並べ替えるには、 Shift キーを押しながら列の並べ替え矢印をクリックします。

フィルターを作成するには、セルの結果の右上にある をクリックします フィルター アイコン 。 表示されるダイアログで、フィルター処理する列と、適用するフィルター ルールと値を選択します。 例えば:

フィルターの例

別のフィルタを追加するには、 をクリックします [フィルターの追加] ボタン

フィルターを一時的に有効または無効にするには、ダイアログの [有効/無効 ] ボタンを切り替えます。 フィルタを削除するには、フィルタ名 フィルタ X の削除の横にある [X] をクリックします。

特定の値でフィルタリングするには、その値を持つセルを右クリックし、ドロップダウンメニューから[ この値でフィルタリング ]を選択します。

特定の値

列名のケバブメニューからフィルターを作成することもできます。

フィルターケバブメニュー

フィルターは、結果テーブルに表示される結果にのみ適用されます。 返されたデータが切り捨てられた場合 (たとえば、クエリが 64,000 行を超える行を返す場合)、フィルターは返された行にのみ適用されます。

ダウンロード結果

デフォルトでは、結果のダウンロードは有効になっています。 この設定を切り替えるには、「 ノートブックから結果をダウンロードする機能を管理する」を参照してください。

表形式の出力を含むセルの結果をローカル コンピューターにダウンロードできます。 タブ タイトルの横にある下向き矢印をクリックします。 メニュー オプションは、結果の行数と Databricks Runtime バージョンによって異なります。 ダウンロードした結果は、 export.csvという名前の CSV ファイルとしてローカル コンピューターに保存されます。

セルの結果をダウンロードする

セル ごとに複数の出力を表示する

Python ノートブックと Python 以外のノートブックの %python セルでは、セルごとに複数の出力がサポートされます。 たとえば、次のコードの出力には、プロットとテーブルの両方が含まれます。

import pandas as pd
from sklearn.datasets import load_iris

data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)

ノートブックの出力を Databricks Git フォルダーにコミットする

.ipynb のコミットについて学習するには ノートブック出力については、「 .ipynb ノートブック出力のコミットを許可する」を参照してください。

  • ノートブックは .ipynb である必要があります ファイル

  • ワークスペース管理設定では、ノートブック出力のコミットを許可する必要があります。