生データの取り込みまたは接続

プレビュー

この機能は プライベート プレビュー段階です。 試してみたい場合は、Databricks の担当者にお問い合わせください。

別のRAG Studioドキュメントをお探しですか?RAGドキュメントインデックスに移動

次のガイドでは、RAG Studioアプリケーションのデータを取り込む手順を説明します。

重要

デフォルトの📥 Data Ingestor Databricks ドキュメントをダウンロードします。

src/notebooks/ingest_data.py のコードを変更して別のソースから取り込むことも、config/rag-config.yml を調整してUnity Catalogボリュームにすでに存在するデータを使用することもできます。

RAG Studio に同梱されているデフォルトの🗃️ Data Processorは、HTML ファイルのみをサポートします。 Unity Catalogボリュームに他のファイル タイプがある場合は、 「🗃️ データ プロセッサ バージョンの作成」のステップに従って、🗃️ Data Processor コードを調整します。

  1. 次のコマンドを実行して、データ取り込みプロセスを開始します。 このステップには約 10 分かかります。

    ./rag ingest-data -e dev
    
  2. 取り込みが完了すると、コンソールに次のメッセージが表示されます。

    -------------------------
    Run URL: <URL to the deployment Databricks Job>
    
    <timestamp> "[dev e] [databricks-docs-bot][dev] ingest_data" RUNNING
    <timestamp> "[dev e] [databricks-docs-bot][dev] ingest_data" TERMINATED SUCCESS
    Successfully downloaded and uploaded Databricks documentation articles to UC Volume '`catalog`.`schema`.`raw_databricks_docs`'
    

次のチュートリアルに従ってください。

RAGアプリケーションのバージョンをデプロイする