John Snow Labs に接続する
John Snow Labs は、自然言語処理(NLP)の最新研究の本番運用グレード、スケーラブル、トレーニング可能なバージョンを、以下の製品を通じて提供しています。
- Spark NLP: Python、Java、または Scala 向けの最先端の NLP。
- Spark NLP for Healthcare:最先端の臨床および生物医学NLP。
- Spark OCR: スケーラブルでプライベート、かつ高精度な OCR および匿名化ライブラリ。
DatabricksクラスターをJohn Snow Labsと統合できます。
John Snow Labs は、Databricks SQL ウェアハウス (旧称 Databricks SQL エンドポイント) と統合されません。
Partner Connect を使用して John Snow Labs に接続する
Partner Connect の手順では、最も一般的な NLP タスクと OCR タスクについて説明します。
- Databricksワークスペースに新しいクラスターを作成します。
- 新しいクラスター John Snow Labs NLPおよびOCRライブラリを自動的にインストールします。
- John Snow Labs の NLP および OCR ライブラリの 30 日間の試用版ライセンスを作成してデプロイします。
- 20+ のすぐに使用できる Python ノートブックを新しいクラスターにコピーします。
標準接続と John Snow Labs の違い
Partner Connect を使用して John Snow Labs に接続するには、「 Partner Connect を使用して ML パートナーに接続する」の手順に従います。 John Snow Labs 接続は、次の点で標準の機械学習接続とは異なります。
- Partner Connect の手順を完了するには、有効なクレジット カードが必要です。 お客様のクレジットカードには、試用期間の終了後に開始する従量課金制の料金が適用されます。
- 画面の指示に従って John Snow Labs NLPの試用を開始したら、Eメールの受信トレイで John Snow Labs からのメッセージに開始方法が記載されたメッセージを確認し、メッセージの指示に従ってください。 このメッセージが届くまで、最大で 30 分かかる場合があります。
接続手順
Partner Connect を使用して Databricks ワークスペースを John Snow Labs に接続するには、「 Partner Connect を使用して ML パートナーに接続する」を参照してください。
John Snow Labs に手動で接続する
次の手順に従って、John Snow Labs NLP and OCR ライブラリとノートブックをクラスターに自動的にインストールし、John Snow Labs アカウントをまだお持ちでない場合は John Snow Labs の試用版をアクティブ化します。
必要条件
John Snow Labs と統合する前に、次のものが必要です。
-
ワークスペースでの Databricksクラスター 。Databricks
-
Databricks 個人用アクセス トークン。
自動化されたツール、システム、スクリプト、アプリで認証する際のセキュリティのベストプラクティスとして、Databricks では OAuth トークンを使用することをお勧めします。
personal access token authentication を使用する場合、 Databricks では、ワークスペース ユーザーではなく 、サービスプリンシパル に属する personal access token を使用することをお勧めします。 サービスプリンシパルのトークンを作成するには、「 サービスプリンシパルのトークンの管理」を参照してください。
プロシージャ
John Snow Labs と統合するには、次の手順を実行します。
-
John Snow Labs の 要件を満たしている ことを確認します。
-
John Snow Labs の Databricks の NLP の Web ページに移動します。
-
[Databricks アカウントでインストール ] をクリックします。
-
「自己紹介をお願いします 」ダイアログで、氏名、会社のメールアドレスを入力します。
-
[Databricks インスタンス URL ] に、Databricks ワークスペース URL を入力します (例:
https://dbc-a1b2345c-cloud.databricks.com/?o=1234567890123456
)。 -
[Databricks アクセス トークン ] には、この記事の要件から Databricks 個人用アクセス トークンの値を入力します。
-
[ テスト接続 ] をクリックします。
-
接続が成功したら、[ インストールするクラスターの選択 ] で、この記事の要件からクラスターを選択します。
-
「 試用版ライセンスを取得 」をクリックします。
-
Eメール アドレスの確認リクエストを含む John Snow Labs からのメールを確認します。
-
メッセージで、[ メールの確認] をクリックします。
-
数分後、Eメール イントレイをもう一度確認して、 John Snow Labs からの別のメッセージに開始方法の説明が記載されていないか確認してください。 場合によっては、このメッセージが到着するまでに最大 30 分かかることがあります。
-
メッセージの指示に従ってください。
John Snow Labs ライブラリとノートブックをクラスターに手動でインストールするには、John Snow Labs Web サイトの以下を参照してください。
-
John Snow Labs の試用版をアップグレードするには、 https://my.johnsnowlabs.com/login で John Snow Labs アカウントにサインインします。
-
次の手順に進みます。
次のステップ
John Snow Labs の Web サイトで、次のリソースの 1 つ以上を調べてください。