John Snow Labs
John Snow Labs 通过以下产品在自然语言处理 (NLP) 中提供生产级、可缩放、可训练版本的最新研究成果:
- Spark NLP:适用于 Python、Java 或 Scala 的一流 NLP。
- Spark NLP for Healthcare:一流的临床和生物医学 NLP。
- Spark OCR:可缩放、专用且高度准确的 OCR 和去标识化库。
可将 Azure Databricks 群集与 John Snow Labs 集成。
注意
John Snow Labs 不与 Databricks SQL 仓库集成。
有关详细信息,请参阅 Databricks 上的 John Snow Labs NLP。
使用 Partner Connect 连接到 John Snow Labs
本部分中的步骤涵盖最常用的 NLP 和 OCR 任务:
- 在 Azure Databricks 工作区中新建群集。
- 在新群集上自动安装 John Snow Labs NLP 和 OCR 库。
- 为 John Snow Labs NLP 和 OCR 库创建和部署 30 天的试用版许可证。
- 将 20 多个随时可用的 Python 笔记本复制到新群集中。
如果你已有要使用的群集,或已有 John Snow Labs 帐户,请跳到连接到 John Snow Labs。
重要
要完成这些步骤,需要一张有效的信用卡。 信用卡需支付试用结束后开始产生的即用即付费用。
确保 Azure Databricks 帐户、工作区和已登录用户均满足 Partner Connect 的要求。
在边栏中,单击
“Partner Connect”。单击 John Snow Labs 磁贴。
注意
如果 John Snow Labs 磁贴内有一个复选标记图标,这意味着其中一位管理员已使用 Partner Connect 将 John Snow Labs 与工作区中的某个群集集成。 要获取有关现有集成的信息,请单击 John Snow Labs 磁贴,然后展开“连接详细信息”。
如果“连接到合作伙伴”对话框显示“下一步”按钮,请单击此按钮。
Partner Connect 在工作区中创建以下资源:
- 一个名为 JOHN_SNOW_LABS_CLUSTER 的群集。
- 一个名为 JOHN_SNOW_LABS_USER 的 Azure Databricks 服务主体。
- 一个 Azure Databricks 个人访问令牌,它将与 JOHN_SNOW_LABS_USER 服务主体关联。 请注意,无法获取此 Azure Databricks 个人访问令牌的值。
请注意,“电子邮件”框包含 Azure Databricks 中用户的电子邮件地址。 John Snow Labs 使用此电子邮件地址在 https://my.johnsnowlabs.com 上为你创建新帐户,或尝试登录到你现有的 John Snow Labs 帐户。
单击“连接到 John Snow Labs”或“登录”。
Web 浏览器中会打开一个新标签页,其中显示用于为你创建新的 John Snow Labs 帐户的选项,或登录到现有 John Snow Labs 帐户的选项。 按照屏幕上的说明进行操作。
完成屏幕上的说明后,将会显示 John Snow Labs 网站上的“开始使用 Databricks”。
Databricks 实例 URL”框显示 Azure Databricks 工作区 URL。 “Databricks 访问令牌”框已显示 Partner Connect 为你创建的 Azure Databricks 个人访问令牌的前几个字符。 无法在此网页上更改这些值。 如果怀疑这些值不正确,请在继续操作之前联系 John Snow Labs 支持。
完成屏幕上的说明以输入信用卡信息,然后单击“获取许可证”以启动 John Snow Labs NLP 试用版。
几分钟后,检查电子邮件收件箱中是否收到了来自 John Snow Labs 的邮件,其中包含有关如何开始使用的说明。 请注意,在某些情况下,可能需要在长达半小时之后才能收到此邮件。
按照消息中的说明进行操作。
继续执行后续步骤。
连接到 John Snow Labs
按照这些说明在群集上自动安装 John Snow Labs NLP 和 OCR 库以及笔记本,并激活试用版 John Snow Labs(如果你还没有 John Snow Labs 帐户)。
要求
在与 John Snow Labs 集成之前,必须做好以下准备:
过程
要与 John Snow Labs 集成,请完成以下步骤:
注意
要更快地完成 John Snow Labs 集成,请参阅使用 Partner Connect 连接到 John Snow Labs。
确保满足 John Snow Labs 的要求。
单击“在我的 Databricks 帐户中安装”。
在“请自我介绍”对话框中,输入你的名字、姓氏和公司电子邮件地址。
对于“Databricks 实例 URL”,请输入你的 Azure Databricks 工作区 URL,例如
https://adb-1234567890123456.7.azuredatabricks.net/?o=1234567890123456。对于“Databricks 访问令牌”,请输入要求中所述的令牌值。
单击“测试连接”。
连接成功后,对于“选择要安装到的群集”,请选择要求中所述的群集。
单击“获取试用许可证”。
检查电子邮件收件箱中是否收到了来自 John Snow Labs 的邮件,其中包含验证电子邮件地址的请求。
在该邮件中,单击“验证我的电子邮件”。
几分钟后,再次检查电子邮件收件箱中是否收到了来自 John Snow Labs 的另一封邮件,其中包含有关如何开始使用的说明。 请注意,在某些情况下,可能需要在长达半小时之后才能收到此邮件。
按照消息中的说明进行操作。
注意
若要在群集上手动安装 John Snow Labs 库和笔记本,请参阅 John Snow Labs 网站上的以下资源:
要升级试用版 John Snow Labs,请在 https://my.johnsnowlabs.com/login 上登录到你的 John Snow Labs 帐户。
继续执行后续步骤。
后续步骤
在 John Snow Labs 网站上浏览以下一个或多个资源: