MySQL でフェデレーションクエリを実行する
このページでは、 によって管理されていない データに対して横串検索を実行するためのレイクハウスフェデレーションの設定方法について説明します。MySQLDatabricksレイクハウスフェデレーションの詳細については、「 レイクハウスフェデレーションとは」を参照してください。
レイクハウスフェデレーションを使用して MySQL データベースに接続するには、 Databricks Unity Catalog メタストアに次のものを作成する必要があります。
- MySQL データベースへの接続。
 - Unity Catalog で MySQL データベースをミラーリングする フォーリンカタログ で、クエリー 構文 Unity Catalog データガバナンス ツールを使用してデータベースへの Databricks ユーザー アクセスを管理できます。
 
始める前に
ワークスペースの要件:
- Unity Catalogのワークスペースが有効になっています。
 
コンピュートの要件:
- コンピュート・リソースからターゲット・データベース・システムへのネットワーク接続。 「レイクハウスフェデレーションのネットワーキングに関する推奨事項」を参照してください。
 - Databricks コンピュートは、 Databricks Runtime 13.3 LTS 以上、 および標準 または 専用 アクセスモードを使用する必要があります。
 - SQLウェアハウスはProまたはServerlessで、2023.40以上を使用している必要があります。
 
必要な権限:
- 接続を作成するには、メタストア管理者か、ワークスペースに接続されているUnity Catalogメタストアの 
CREATE CONNECTION権限を持つユーザーである必要があります。 - フォーリンカタログを作成するには、メタストアに対する 
CREATE CATALOG権限を持ち、接続の所有者であるか、接続に対するCREATE FOREIGN CATALOG権限を持っている必要があります。 
追加の権限要件は、以下の各タスクベースのセクションに記載しています。
接続を作成するには SSL が必要です。
接続を作成する
接続では、外部データベースシステムにアクセスするためのパスと認証情報を指定します。接続を作成するには、カタログエクスプローラーを使用するか、Databricksノートブックまたは Databricks SQLクエリーエディタで CREATE CONNECTION SQLコマンドを使用できます。
Databricks REST API または Databricks CLI を使用して接続を作成することもできます。 POST /api/2.1/unity-catalog/connections を参照してください。 および Unity Catalog コマンド。
必要な権限: メタストア管理者またはCREATE CONNECTION権限を持つユーザー。
- Catalog Explorer
 - SQL
 
- 
Databricks ワークスペースで、
カタログ をクリックします。
 - 
[カタログ]ウィンドウの上部にある [
追加] アイコンをクリックし、メニューから [ 接続の追加] を選択します。
または、 クイックアクセス ページから 外部データ > ボタンをクリックし、 接続 タブに移動して 接続を作成 をクリックします。
 - 
接続のセットアップ ウィザードの 接続の基本 ページで、わかりやすい 接続名 を入力します。
 - 
[ 接続タイプ ] で [MySQL] を選択します。
 - 
(オプション)コメントを追加します。
 - 
次へ をクリックします。
 - 
「 認証 」ページで、MySQL インスタンスの次の接続プロパティを入力します。
- ホスト : たとえば、 
mysql-demo.lb123.us-west-2.rds.amazonaws.com - ポート : たとえば、 
3306 - ユーザー : たとえば、 
mysql_user - パスワード : たとえば、 
password123 
 - ホスト : たとえば、 
 - 
(オプション): [Trust server certificate ] を選択します。これはデフォルトでは選択されていません。選択すると、トランスポート層は SSL を使用してチャンネルを暗号化し、証明書チェーンをバイパスして信頼を検証します。 これは、信頼検証をバイパスする特定の必要がない限り、デフォルトのままにします。
 - 
接続の作成 をクリックします。
 - 
[カタログの基本 ] ページで、フォーリンカタログの名前を入力します。フォーリンカタログは、外部データ・システム内のデータベースをミラーリングするため、 Databricks と Unity Catalogを使用して、そのデータベース内のデータへのアクセスをクエリおよび管理できます。
 - 
(オプション)[ 接続をテスト ]をクリックして、動作することを確認します。
 - 
[ カタログを作成 ] をクリックします。
 - 
[ アクセス ] ページで、作成したカタログにユーザーがアクセスできるワークスペースを選択します。[ すべてのワークスペースにアクセス権がある ] を選択するか、[ ワークスペースに割り当て ] をクリックし、ワークスペースを選択して [ 割り当て] をクリックします。
 - 
カタログ内のすべてのオブジェクトへのアクセスを管理できる 所有者 を変更します。テキスト ボックスにプリンシパルの入力を開始し、返された結果でプリンシパルをクリックします。
 - 
カタログに対する 権限を付与 します。[ 許可 ] をクリックします。
- 
カタログ内のオブジェクトにアクセスできる プリンシパル を指定します。テキスト ボックスにプリンシパルの入力を開始し、返された結果でプリンシパルをクリックします。
 - 
各プリンシパルに付与する 権限プリセット を選択します。デフォルトでは、すべてのアカウントユーザーに
BROWSEが付与されます。- ドロップダウンメニューから「 データ閲覧者 」を選択して、カタログ内のオブジェクトに対する 
read権限を付与します。 - ドロップダウンメニューから「 データエディタ 」を選択して、カタログ内のオブジェクトに対する 
read権限とmodify権限を付与します。 - 付与する権限を手動で選択します。
 
 - ドロップダウンメニューから「 データ閲覧者 」を選択して、カタログ内のオブジェクトに対する 
 - 
付与 をクリックします。
 
 - 
 - 
次へ をクリックします。
 - 
[メタデータ] ページで、タグのキーと値のペアを指定します。詳細については、「Unity Catalog セキュリティ保護可能なオブジェクトにタグを適用する」を参照してください。
 - 
(オプション)コメントを追加します。
 - 
保存 をクリックします。
 
ノートブックまたはDatabricks SQLクエリーエディタで次のコマンドを実行します。
CREATE CONNECTION <connection-name> TYPE mysql
OPTIONS (
  host '<hostname>',
  port '<port>',
  user '<user>',
  password '<password>'
);
資格情報などの機密性の高い値には、プレーンテキスト文字列の代わりに Databricks シークレット を使用することをお勧めします。例えば:
CREATE CONNECTION <connection-name> TYPE mysql
OPTIONS (
  host '<hostname>',
  port '<port>',
  user secret ('<secret-scope>','<secret-key-user>'),
  password secret ('<secret-scope>','<secret-key-password>')
)
ノートブック SQL コマンドでプレーンテキスト文字列を使用する必要がある場合は、 $ を \でエスケープして文字列を切り捨てないようにしてください。 たとえば、 \$のようになります。
シークレットの設定に関する情報については、「 シークレット管理」を参照してください。
フォーリンカタログの作成
UI を使用してデータソースへの接続を作成する場合は、フォーリンカタログの作成が含まれているため、この手順をスキップできます。
フォーリンカタログは、外部データシステム内のデータベースをミラーリングするため、DatabricksとUnity Catalogを使用して、そのデータベース内のデータへのアクセスを管理できます。フォーリンカタログを作成するには、すでに定義されているデータソースへの接続を使用します。
フォーリンカタログを作成するには、カタログエクスプローラCREATE FOREIGN CATALOGSQL を使用するか、Databricks ノートブックまたは クエリDatabricks SQL エディターの コマンドを使用します。Databricks REST API または Databricks CLI を使用してカタログを作成することもできます。 POST /api/2.1/unity-catalog/catalogs を参照してください。 および Unity Catalog コマンド。
必要な権限: メタストアの CREATE CATALOG 権限、接続の所有権または接続の CREATE FOREIGN CATALOG 権限。
- Catalog Explorer
 - SQL
 
- 
Databricks ワークスペースで、
[カタログ]をクリックして カタログエクスプローラー を開きます。
 - 
カタログ ペインの上部で、
追加 アイコンをクリックし、メニューから[ カタログを追加 ]を選択します。
または、 クイックアクセス ページから[ カタログ ]ボタンをクリックし、[ カタログを作成 ]ボタンをクリックします。
 - 
「カタログの作成」のフォーリンカタログの作成手順に従います。
 
ノートブックまたはDatabricks SQLエディタで次のSQLコマンドを実行します。括弧内の項目はオプションです。プレースホルダーの値を置き換えます。
<catalog-name>:Databricksのカタログの名前。<connection-name>: データソース、パス、およびアクセス認証情報を指定する 接続オブジェクト 。
CREATE FOREIGN CATALOG [IF NOT EXISTS] <catalog-name> USING CONNECTION <connection-name>;
サポートされているプッシュダウン
次のプッシュダウンは、すべてのコンピュートでサポートされています。
- フィルター
 - 予測
 - 上限
 - 関数: 部分的、フィルター式のみ。 (文字列関数、数学関数、日付、時刻、タイムスタンプ関数、およびエイリアス、キャスト、ソートオーダーなどのその他の関数)
 
次のプッシュダウンは、 Databricks Runtime 13.3 LTS 以上、および SQLウェアハウスでサポートされています。
- 集計
 - Boolean オペレーター
 - 次の数学関数 (ANSI が無効になっている場合はサポートされません): +、-、*、%、/
 - ソート (制限付きで使用した場合)
 
次のプッシュダウンはサポートされていません。
- テーブルのJOIN
 - Windows の機能
 
データ型マッピング
MySQL から Spark に読み取る場合、データ型は次のようにマップされます。
MySQLタイプ  | Spark タイプ  | 
|---|---|
bigint (signedでない場合)、10 進数  | DecimalType  | 
tinyint*、int、integer、mediumint、smallint  | IntegerType  | 
tinyint(1)  | BooleanType  | 
bigint (signed)  | LongType  | 
float  | FloatType  | 
double  | DoubleType  | 
char, enum, set  | CharType  | 
varchar  | VarcharType  | 
json, longtext, mediumtext, text, tinytext  | StringType  | 
binary, blob, varbinary, varchar binary  | BinaryType  | 
bit, boolean  | BooleanType  | 
date, year  | DateType  | 
datetime, time, timestamp**  | TimestampType/TimestampNTZType  | 
*tinyint(1) signed と tinyint(1) unsigned はブール値として扱われ、 BooleanTypeに変換されます。 MySQL ドキュメントの Connector/J リファレンス を参照してください。
** MySQL から読み取ると、MySQL Timestamp は Spark TimestampType ( preferTimestampNTZ = false の場合) にマップされます (デフォルト)。 MySQL Timestamp は、preferTimestampNTZ = trueの場合TimestampNTZTypeにマップされます。