RAG Studio のクラスター構成

この記事では、データ取り込み、RAG チェーンの作成、RAG 評価などのタスクを自動化するために RAG Studio がプロビジョニングするクラスターについて説明します。

デフォルトでは、RAG Studio はこれらのタスク専用に新しいジョブ クラスターをプロビジョニングします。

デフォルトのクラスタープロビジョニング

RAG Studio によってプロビジョニングされるデフォルトのクラスターは次のとおりです。

  • アクセスMode : 割り当て済み

  • Databricks Runtimeバージョン: 13.3 LTS 機械学習

このセットアップは、安定性とパフォーマンスのために最適化されています。

アクセス許可の要件

RAG Studio がこれらのクラスターを自動的にプロビジョニングできるようにするには、Databricks アカウントに上記のプロパティを持つジョブ クラスターを作成するために必要な権限があることを確認してください。

既存の対話型クラスターを使用する

RAG Studio タスクに既存の対話型クラスターを使用する場合は、次のように、 ragの使用時にクラスター ID を指定してこれを構成できます。

./rag create-rag-version -e dev --cluster-id <your-cluster-id>

クラスターの ID を識別するには、 クラスターの URL と IDを参照してください。

あるいは、 rag-config.yml構成ファイルでクラスター ID を指定することもできます。 この方法は、特定の環境内のすべての RAG Studio 操作に対してデフォルトのクラスターを設定する場合に便利です。 次に示すように、適切な環境セクションの下に cluster_id フィールドを追加します。

development:
  - name: dev
    ...
    cluster_id: <your_cluster_id>

クラスターのオーバーライドは、 dev環境でのみサポートされます。