DBFSルートの操作に関する推奨事項
Databricksでは、一部のワークスペースでのアクションにおけるデフォルトロケーションとしてDBFS ルート ディレクトリを使用します。Databricksでは、本番運用データや機密情報を DBFSルートに保存しないことをお勧めします。 この記事では、 DBFSルート上の機密データが誤って公開されないようにするための推奨事項に焦点を当てています。
注記
Databricks は、内部 DBFS と呼ばれる顧客所有のクラウド ストレージにデータと構成を保持するために、別のプライベート ストレージの場所を構成します。 この場所はユーザーに公開されません。
DBFSルートにデータを保存しないようにユーザーを教育する
DBFSルートはワークスペース内のすべてのユーザーがアクセスできるため、すべてのユーザーがここに保存されているすべてのデータにアクセスできます。機密データの保存にこの場所を使用しないようにユーザーに指示することが重要です。 DatabricksのHiveメタストアにあるマネージドテーブルのデフォルトロケーションはDBFSルートです。マネージドテーブルを作成するエンドユーザーがDBFS ルートに書き込まないようにするには、Hiveメタストアでデータベースを作成するときに外部ストレージ上のロケーションを宣言します。
監査ログを使用してアクティビティを監視する
注記
DBFS 監査イベントの詳細については、「 DBFS イベント」を参照してください。