本番運用 ジョブ スケジューリング チートシート
この記事は、本番運用 ジョブスケジューリングに関する明確で主張のあるガイダンスを提供することを目的としています。 ベスト プラクティスを使用すると、コストの削減、パフォーマンスの向上、セキュリティの強化に役立ちます。
ベストプラクティス | インパクト | ドキュメント |
|---|---|---|
ジョブにサーバレスコンピュートを使用する | コスト : サーバレス ジョブにはクラスター構成は必要ありません。 Databricksはプロビジョニングとスケーリングを自動的に管理します。 | |
可能な限り Lakeflow ジョブをオーケストレーションに使用 | コスト : Databricks でのみワークロードをオーケストレーションする場合は、外部ツールを使用してオーケストレーションする必要はありません。 | |
ユーザー アカウントの代わりにサービスプリンシパルを使用して 本番運用 ジョブを実行 | セキュリティ : ジョブが個々のユーザーによって所有されている場合、そのユーザーが組織を離れると、これらのジョブの実行が停止する可能性があります。 | |
クラシック コンピュートの場合: 自動化されたワークフローにはジョブ クラスターを使用します | コスト : ジョブのクラスターは、対話型のクラスターよりも低い料金で課金されます。 | |
クラシックコンピュートの場合: 長時間稼働中のクラスターを再起動します | セキュリティ : クラスターを再起動して、 Databricksランタイムのパッチとバグ修正を利用します。 | |
クラシック コンピュートの場合: 最新のLTSバージョンのDatabricks Runtime使用します | パフォーマンスとコスト : Databricks は、使いやすさ、パフォーマンス、セキュリティのために Databricks Runtime を常に改善しています。 | |
クラシック コンピュートの場合: 本番運用データをDBFSルートに保存しないでください | セキュリティ : データが DBFSルートに格納されている場合、すべてのユーザーがアクセスできます。 |