メインコンテンツまでスキップ

本番運用 ジョブ スケジューリング チートシート

この記事は、本番運用 ジョブスケジューリングに関する明確で主張のあるガイダンスを提供することを目的としています。 ベスト プラクティスを使用すると、コストの削減、パフォーマンスの向上、セキュリティの強化に役立ちます。

ベストプラクティス

インパクト

ドキュメント

ジョブ クラスターを使用してワークフローを自動化

コスト : ジョブのクラスターは、対話型のクラスターよりも低い料金で課金されます。

長期稼働中のクラスターを再起動する

セキュリティ : クラスターを再起動して、 Databricks Runtimeのパッチとバグ修正を利用します。

user アカウントの代わりにサービスプリンシパルを使用して 本番運用 ジョブを実行

セキュリティ : ジョブが個々のユーザーによって所有されている場合、そのユーザーが組織を離れると、これらのジョブの実行が停止する可能性があります。

可能な限り、オーケストレーションに Databricks ジョブを使用する

コスト : Databricks でのみワークロードをオーケストレーションする場合は、外部ツールを使用してオーケストレーションする必要はありません。

Databricks Runtime の最新の LTS バージョンを使用する

パフォーマンスとコスト : Databricks は、使いやすさ、パフォーマンス、セキュリティのために Databricks Runtime を常に改善しています。

本番運用データを DBFSRouteに保存しない

セキュリティ : データが DBFSルートに格納されている場合、すべてのユーザーがアクセスできます。