メインコンテンツまでスキップ

Outlookコネクタのリファレンス

このページには、 LakeFlow Connectの Outlook コネクタに関するリファレンス ドキュメントが含まれています。

接続プロパティ

Unity Catalog接続を作成する際には、以下のプロパティを指定する必要があります。 これらの値の取得方法については、 「Microsoft Outlook の認証を構成する」を参照してください。

属性

説明

クライアントID

Microsoft Entra IDアプリ登録時に取得したアプリケーション(クライアント)ID。

クライアントのシークレット

Microsoft Entra IDアプリ登録時のクライアントシークレット値。

テナントID

Microsoft Entra IDアプリ登録時に取得したディレクトリ(テナント)ID。

宛先スキーマ

コネクタは、 defaultスキーマの下に単一のテーブルemail_messagesを生成します。

  • 主キー(mailbox, outlook_message_id)
  • 増分同期カーソルreceived_at 、メールボックスとフォルダーごとに追跡されます

email_messages

Type

説明

mailbox

string

メールボックスの電子メールアドレス。 主キーの一部。

outlook_message_id

string

Microsoft Graph API から取得した一意のメッセージ ID。主キーの一部。

internet_message_id

string

RFC 2822 インターネットメッセージID。

conversation_id

string

会話スレッドID。

folder

string

フォルダの表示名(例: Inbox )。

to_recipients

array<string>

受信者の電子メール アドレスのリスト。

cc_recipients

array<string>

CC 受信者の電子メール アドレスのリスト。

bcc_recipients

array<string>

BCC 受信者の電子メール アドレスのリスト。

from

string

送信者の電子メールアドレス。

sender

string

実際の送信者のメールアドレス(代理送信の場合はfromと異なる場合があります)。

reply_to

array<string>

返信先電子メールアドレスのリスト。

subject

string

電子メールの件名。

importance

string

重要度レベル(例: normalhighlow )。

is_read

boolean

メッセージが読まれたかどうか。

in_reply_to

string

電子メール ヘッダーからの親メッセージのインターネット メッセージ ID。

references

array<string>

電子メール ヘッダーから参照されるメッセージ ID の配列。

body_preview

string

メール本文のプレビュー。

full_body_content

string

全身の内容。フォーマットは、 body_formatオプションに基づいて、HTML またはプレーンテキストになります。

unique_body_content

string

返信からの引用部分を除く、本文中の固有コンテンツ。

received_at

timestamp

メッセージの受信日時(ISO-8601)。増分同期カーソルとして使用されます。

sent_at

timestamp

メッセージが送信された日時(ISO-8601形式)。

categories

array<string>

メッセージにユーザーが定義するカテゴリまたはタグ。

attachments

array<struct>

添付ファイル構造体の配列。attachment_modeNONEの場合は省略されます。添付ファイル構造を参照してください。

添付ファイル構造

フィールド

Type

説明

attachment_id

string

Microsoft Graph API から取得した添付ファイルの ID。

file_name

string

元のファイル名。

mime_type

string

MIMEタイプ(例: application/pdf )。

size

bigint

ファイルサイズ(バイト単位)。

attachment_kind

string

型インジケータ(例: fileAttachmentitemAttachment )。

is_inline

boolean

添付ファイルがインライン形式であるかどうか(例えば、署名に埋め込まれた画像など)。

content

binary

Base64エンコードされたファイルの内容。

コネクタオプション

これらのオプションは、パイプライン仕様のoutlook_optionsで指定されています。複数のフィルターオプションがどのように相互作用するかについては、 「フィルター組み合わせロジック」を参照してください。

オプション

Type

必須

デフォルト

説明

include_mailboxes

array<string>

No

アクセス可能なすべてのメールボックス

同期するメールボックスの電子メール アドレスのリスト。 指定がない場合、コネクタは Microsoft Graph GET /usersエンドポイントを使用して、テナント内のアクセス可能なすべてのメールボックスを検出して取り込みます。

include_folders

array<string>

No

["Inbox"]

同期するフォルダの表示名の一覧。例: InboxSent ItemsCustom_Folder 。マッチングでは大文字と小文字は区別されません。

include_senders

array<string>

No

すべての送信者

完全一致を使用して、送信者の電子メール アドレスで電子メールをフィルタリングします。 例: user@vendor.com

include_subjects

array<string>

No

全科目

電子メールを件名でフィルタリングします。 末尾が*値は接頭辞一致を使用し、その他の値は部分文字列一致を使用します。例: "Invoice" (部分文字列)、 "Re:*" (接頭辞)。

start_date

string

No

時代から現在までの完全な歴史

初回同期の開始日をYYYY-MM-DD形式で指定します。履歴データを同期する最も古い日付を決定します。

body_format

string

No

TEXT_HTML

電子メール本文のコンテンツ形式を制御します。 TEXT_HTML : HTMLの書式設定を完全に保持します。TEXT_PLAIN : ボディをプレーンテキストに変換します(トークン使用量を削減するために、AI/RAG パイプラインで推奨されます)。

attachment_mode

string

No

ALL

取り込む添付ファイルを制御します。ALL : すべての添付ファイル。NON_INLINE_ONLY : インライン以外の添付ファイルのみ(企業署名画像の使用を避けることを推奨します)。INLINE_ONLY : インライン添付ファイルのみ。NONE : 添付ファイルなし(添付ファイルAPI呼び出しを完全にスキップします)。

フィルタ組み合わせロジック

Eメールメッセージは、指定された各フィルタカテゴリから少なくとも1つの値に一致した場合に取り込まれます。 複数のフィルタカテゴリはAND論理で結合され、単一カテゴリ内の値はOR論理で結合されます。

include_folders=["Inbox"] AND include_senders=["user@vendor.com", "alerts@system.io"]user@vendor.comまたはalerts@system.ioのいずれかによって送信された受信トレイフォルダからの電子メールを取り込みます。