John Snow Labs 接続

John Snow Labsは、次の製品を通じて、自然言語処理(NLP)の最新研究のプロダクショングレードでスケーラブルでトレーニング可能なバージョンを提供しています。

  • Spark NLP: Python、Java、または Scala 向けの最先端の NLP。

  • Spark ヘルスケアのためのNLP:最先端の臨床および生物医学NLP。

  • Spark OCR: スケーラブルでプライベートで高精度の OCR および匿名化ライブラリ。

Databricks クラスターを John Snow Labs と統合できます。

John Snow Labs は、Databricks SQLウェアハウス (以前の Databricks SQLエンドポイント) とは統合されません。

Partner Connect を使用してJohn Snow Labs に接続する

Partner Connect ステップ は、最も一般的な NLP および OCR タスクをカバーしています。

  • Databricks ワークスペースに新しいクラスターを作成します。

  • John Snow Labs NLP および OCR ライブラリを新しいクラスターに自動的にインストールします。

  • John Snow Labs の NLP および OCR ライブラリの 30 日間の試用版ライセンスを作成して展開します。

  • 20+ のすぐに使用できる Python ノートブックを新しいクラスターにコピーします。

標準接続とJohn Snow Labs の違い

Partner Connectを使用して John Snow Labs に接続するには、「 Partner Connectを使用して機械学習パートナーに接続する」の手順に従います。John Snow Labs 接続は、次の点で標準の機械学習接続とは異なります。

  • Partner Connect ステップを完了するには、有効なクレジットカードが必要です。クレジット カードには、試用期間の終了後に開始される従量課金制が適用されます。

  • 画面の指示に従って John Snow Labs NLP トライアルを開始したら、Eメール の受信トレイで、開始方法に関する指示が記載された John Snow Labs からのメッセージを確認し、メッセージの指示に従います。 このメッセージが届くまでに最大 30 分かかる場合があります。

接続 するステップ

Partner Connectを使用して Databricks ワークスペースを John Snow Labs に接続するには、「 Partner Connectを使用して機械学習パートナーに接続する」を参照してください。

John Snow Labs に手動で 接続する

次の手順に従って、John Snow Labs の NLP および OCR ライブラリとノートブックをクラスターに自動的にインストールし、John Snow Labs アカウントをまだお持ちでない場合は John Snow Labs の試用版をアクティブ化します。

要件

John Snow Labs と統合する前に、次のものが必要です。

  • Databricks ワークスペース内の Databricks クラスター

  • A Databricks 個人用アクセストークン.

    自動化されたツール、システム、スクリプト、アプリを使用して認証する場合のセキュリティのベスト プラクティスとして、Databricks ではOAuth トークンを使用することをお勧めします。

    個人用アクセストークン認証を使用する場合、Databricks では、ワークスペース ユーザーではなく、 サービスプリンシパル に属する個人用アクセストークンを使用することをお勧めします。 サービスプリンシパルのトークンを作成するには、「 サービスプリンシパルのトークンを管理する」を参照してください。

プロシージャ

John Snow Labs と統合するには、次の手順を実行します。

  1. John Snow Labs の要件を満たし ていることを確認してください。

  2. John Snow Labs NLP on Databricks のウェブページにアクセスしてください。

  3. [ Databricks アカウントにインストール] をクリックします

  4. [ ご自身について教えてください ] ダイアログで、名、姓、会社の Eメール アドレスを入力します。

  5. Databricks インスタンス URL には、 https://dbc-a1b2345c-cloud.databricks.com/?o=1234567890123456 などの Databricks ワークスペース URL を入力します。

  6. [Databricks アクセストークン] には、この記事の要件から Databricks 個人用アクセストークンの値を入力します。

  7. [ 接続のテスト] をクリックします。

  8. 接続が成功したら、[ インストールするクラスターの選択] で、この記事の要件からクラスターを選択します。

  9. [ 試用版ライセンスの取得] をクリックします。

  10. Eメール アドレスを検証する要求を含む John Snow Labs からのメッセージがないか、Eメール 受信トレイを確認します。

  11. メッセージで、[ E メールの検証] をクリックします。

  12. 数分後、Emailの受信トレイをもう一度チェックして、開始方法の説明を含むJohn Snow Labsからの別のメッセージを探します。 場合によっては、このメッセージが到着するまでに最大30分かかることがあります。

  13. メッセージの指示に従ってください。

    John Snow Labs ライブラリとノートブックをクラスターに手動でインストールするには、John Snow Labs Web サイトの以下を参照してください。

  14. John Snow Labs の試用版をアップグレードするには、 https://my.johnsnowlabs.com/login で John Snow Labs アカウントにサインインします。

  15. 次のステップに進みます。