メインコンテンツまでスキップ

Oracle でフェデレーション クエリを実行する

このページでは、Databricksによって管理されていないOracleデータに対してフェデレーションクエリを実行するためにレイクハウスフェデレーションを設定する方法について説明します。レイクハウスフェデレーションの詳細については、外部データベースおよびカタログへの接続を参照してください。

レイクハウスフェデレーションを使用して Oracle データベースに接続するには、 Databricks Unity Catalogメタストアに次のものを作成する必要があります (2024 年 3 月 6 日以降に作成されたワークスペースには、すでにUnity Catalogメタストア プロビジョニングが自動的に作成されています)。

  • Oracle データベースへの接続。
  • OracleUnity Catalog Unity Catalogデータベースを にミラーリングする フォーリンカタログDatabricks 。これにより、 クエリ構文とデータガバナンスツールを使用してデータベースへの ユーザーアクセスを管理できます。

制限

  • レイクハウスフェデレーションは、Oracle Cloudへのトランスポート層セキュリティ(TLS)接続のみをサポートします。 他のOracleデータベースへの接続では、ネイティブ・ネットワーク暗号化(NNE)が使用されます。

  • タイムゾーン値が Etc/UTC のインスタンス 11.2.0.3.0 以降に接続すると、既知の問題があります (エラー: ORA-01882: timezone region not found)。

    • 回避策: spark.databricks.connector.oracle.timezoneAsRegion falseに設定してください。これはoracle.jdbc.timezoneAsRegion JDBCドライバプロパティに直接対応します。クラシック コンピュートでは、この構成をクラスターSpark構成で設定できます。 Databricks SQLウェアハウスおよびサーバレス コンピュートでこの設定を適用するには、 Databricksサポートに問い合わせてください。
警告

この回避策は、夏時間(DST)の動作に誤りを引き起こす可能性があります。恒久的な解決策としては、Oracleデータベースのタイムゾーンファイルを更新してください。Oracleサポート - ORA-01882を参照してください。

ライセンス

Oracle ドライバおよびその他の必要な Oracle jar は、クリックスルーなしの FDHUT ライセンスによって管理されます。

始める前に

開始する前に、このセクションの要件を満たしていることを確認してください。

Databricks の要件

ワークスペースの要件:

  • Unity Catalogのワークスペースが有効になっています。2024年3月6日以降に作成されたワークスペースは、自動メタストアのプロビジョニングを含め、Unity Catalog が自動的に有効になります。自動有効化よりも前に作成され、Unity Catalog がまだ有効になっていないワークスペースの場合を除き、メタストアを手動で作成する必要はありません。Unity Catalog の概要を参照してください。

コンピュートの要件:

  • コンピュート・リソースからターゲット・データベース・システムへのネットワーク接続。 「レイクハウスフェデレーションのネットワーキングに関する推奨事項」を参照してください。
  • Databricks コンピュートは、 Databricks Runtime 16.1 以降と Standard または Dedicated アクセス モードを使用する必要があります。
  • SQLウェアハウスは PRO または サーバレスで、2024.50 以上を使用する必要があります。

必要な権限:

  • 接続を作成するには、メタストア管理者であるか、ワークスペースにアタッチされた Unity Catalog メタストアに対するCREATE CONNECTION権限を持つユーザーである必要があります。Unity Catalogが自動的に有効になったワークスペースでは、ワークスペース管理者は無事にCREATE CONNECTION権限を持ちます。
  • フォーリンカタログを作成するには、メタストアに対するCREATE CATALOG権限があり、接続の所有者であるか、接続に対するCREATE FOREIGN CATALOG権限を持っている必要があります。 Unity Catalogに対して自動的に有効になったワークスペースでは、ワークスペース管理者は無事にCREATE CATALOG権限を持っています。

追加の権限要件は、以下の各タスクベースのセクションに記載しています。

Oracleの要件

ネイティブネットワーク暗号化を使用する接続の場合は、サーバー側の NNE (少なくともACCEPTED レベル) を有効にする必要があります。Oracleドキュメントの ネットワーク・データ暗号化の構成 を参照してください。これは、かわりにTLSを使用するOracle Cloud接続には適用されません。

Databricks 接続を作成する

接続では、外部データベースシステムにアクセスするためのパスと認証情報を指定します。接続を作成するには、カタログエクスプローラーを使用するか、Databricksノートブックまたは Databricks SQLクエリーエディタで CREATE CONNECTION SQLコマンドを使用できます。

注記

Databricks REST API または Databricks CLI を使用して接続を作成することもできます。 POST /api/2.1/unity-catalog/connections を参照してください。 および Unity Catalog コマンド

必要な権限: メタストア管理者またはCREATE CONNECTION権限を持つユーザー。

  1. Databricks ワークスペースで、[データアイコン。 カタログ] をクリックします。

  2. クリックプラグアイコン。 接続し てから、 「接続」 をクリックします。

  3. 「接続を作成」 ボタンをクリックしてください。

  4. 接続のセットアップ ウィザードの 接続の基本 ページで、わかりやすい 接続名 を入力します。

  5. [ 接続の種類 ] で [Oracle ] を選択します。

  6. (オプション)コメントを追加します。

  7. 次へ をクリックします。

  8. 認証 」ページで、Oracle インスタンスについて次のように入力します。

    • ホスト : たとえば、 oracle-demo.123456.rds.amazonaws.com
    • ポート : たとえば、 1521
    • ユーザー : たとえば、 oracle_user
    • パスワード : たとえば、 password123
    • 暗号化プロトコル : Native Network Encryption (デフォルト) または Transport Layer Security
  9. 接続の作成 をクリックします。

  10. [カタログの基本 ] ページで、フォーリンカタログの名前を入力します。フォーリンカタログは、外部データ・システム内のデータベースをミラーリングするため、 Databricks と Unity Catalogを使用して、そのデータベース内のデータへのアクセスをクエリおよび管理できます。

  11. (オプション)[ 接続をテスト ]をクリックして、動作することを確認します。

  12. [ カタログを作成 ] をクリックします。

  13. [ アクセス ] ページで、作成したカタログにユーザーがアクセスできるワークスペースを選択します。[ すべてのワークスペースにアクセス権がある ] を選択するか、[ ワークスペースに割り当て ] をクリックし、ワークスペースを選択して [ 割り当て] をクリックします。

  14. カタログ内のすべてのオブジェクトへのアクセスを管理できる 所有者 を変更します。テキスト ボックスにプリンシパルの入力を開始し、返された結果でプリンシパルをクリックします。

  15. カタログに対する 権限を付与 します。[ 許可 ] をクリックします。

    1. カタログ内のオブジェクトにアクセスできる プリンシパル を指定します。テキスト ボックスにプリンシパルの入力を開始し、返された結果でプリンシパルをクリックします。

    2. 各プリンシパルに付与する 権限プリセット を選択します。デフォルトでは、すべてのアカウントユーザーに BROWSE が付与されます。

      • ドロップダウンメニューから「 データ閲覧者 」を選択して、カタログ内のオブジェクトに対する read 権限を付与します。
      • ドロップダウンメニューから「 データエディタ 」を選択して、カタログ内のオブジェクトに対する read 権限と modify 権限を付与します。
      • 付与する権限を手動で選択します。
    3. 付与 をクリックします。

  16. 次へ をクリックします。

  17. [メタデータ] ページで、タグのキーと値のペアを指定します。詳細については、「Unity Catalog セキュリティ保護可能なオブジェクトにタグを適用する」を参照してください。

  18. (オプション)コメントを追加します。

  19. 保存 をクリックします。

フォーリンカタログの作成

注記

UI を使用してデータソースへの接続を作成する場合は、フォーリンカタログの作成が含まれているため、この手順をスキップできます。

フォーリンカタログは、外部データシステム内のデータベースをミラーリングするため、DatabricksとUnity Catalogを使用して、そのデータベース内のデータへのアクセスを管理できます。フォーリンカタログを作成するには、すでに定義されているデータソースへの接続を使用します。

フォーリンカタログを作成するには、カタログエクスプローラCREATE FOREIGN CATALOGSQL を使用するか、Databricks ノートブックまたは クエリSQL エディターの コマンドを使用します。Databricks REST API または Databricks CLI を使用してカタログを作成することもできます。 POST /api/2.1/unity-catalog/catalogs を参照してください。 および Unity Catalog コマンド

必要な権限: メタストアの CREATE CATALOG 権限、接続の所有権または接続の CREATE FOREIGN CATALOG 権限。

  1. Databricks ワークスペースで、[データアイコン。 カタログ] をクリックして [カタログ エクスプローラー] を開きます。

  2. カタログ ペインの上部で、追加またはプラスアイコン 追加 アイコンをクリックし、メニューから[ カタログを追加 ]を選択します。

    または、 クイックアクセス ページから[ カタログ ]ボタンをクリックし、[ カタログを作成 ]ボタンをクリックします。

  3. 「カタログの作成」のフォーリンカタログの作成手順に従います。

サポートされているプッシュダウン

次の表は、Oracleでサポートされているプッシュダウン操作と、それぞれに必要なコンピュートを示しています。

押し下げ

サポートされているコンピュート

集計

サポート対象すべてのコンピュート

キャスト

サポート対象すべてのコンピュート

含む、開始、終了

サポート対象すべてのコンピュート

フィルター

サポート対象すべてのコンピュート

上限

サポート対象すべてのコンピュート

offset

サポート対象すべてのコンピュート

予測

サポート対象すべてのコンピュート

テーブルのJOIN

サポート対象 Databricks Runtime 17.2以降とSQLウェアハウスコンピュートに対応しています。このプッシュダウン機能はパブリックプレビュー版です。 プレビュー ページで 「フェデレーションクエリのプッシュダウンに参加」の トグルを有効にしてください。

データ型マッピング

Oracle から Spark に読み取る場合、データ型は次のようにマップされます。

オラクルタイプ

Spark タイプ

TIMESTAMP WITH TIMEZONE, TIMESTAMP WITH LOCAL TIMEZONE

TimestampType

DATE, TIMESTAMP

TimestampType/ TimestampNTZType *

NUMBER, FLOAT

DecimalType**

BINARY FLOAT

FloatType

BINARY DOUBLE

DoubleType

CHARNCHARVARCHAR2NVARCHAR2

StringType

* DATETIMESTAMPは、 spark.sql.timestampType = TIMESTAMP_LTZ (デフォルト) の場合、Spark TimestampTypeにマッピングされます。spark.sql.timestampType = TIMESTAMP_NTZの場合、それらはTimestampNTZTypeにマッピングされます。

**精度を指定せずにNUMBER指定すると、Spark では純粋な浮動小数点 Decimal がサポートされていないため、 DecimalType(38, 10)にマッピングされます。

その他のリソース