Anomalo
Anomalo 是一个数据质量验证平台,可确保数据准确、完整、一致且符合你的期望。 连接到 Azure Databricks 后,Anomalo 将引入一个统一层,确保在各种商业智能和分析工具或建模和机器学习框架使用数据之前你可以信任这些数据的质量。 有关详细信息,请参阅 Anomalo 网站上的什么是 Anomalo。
可将 Databricks SQL 仓库和 Azure Databricks 群集与 Anomalo 集成。
使用 Partner Connect 连接到 Anomalo
确保你的 Azure Databricks 帐户、工作区和已登录用户满足 Partner Connect 的要求。
在边栏中,单击
“Partner Connect”。单击“Anomalo”磁贴。
注意
如果“Anomalo”磁贴内部有一个复选标记图标,这意味着某位管理员已使用 Partner Connect 将 Anomalo 连接到你的工作区。 跳到步骤 9。 Anomalo 将使用你的 Azure Databricks 帐户的电子邮件地址来提示你登录现有的 Anomalo 帐户。
如果工作区中有 SQL 仓库,请从下拉列表中选择一个 SQL 仓库。 如果 SQL 仓库已停止,请单击“启动”。
如果工作区中没有 SQL 仓库,请执行以下操作:
- 单击“创建仓库”。 这会在浏览器中打开一个新标签页,它的 Databricks SQL UI 中将显示“新建 SQL 仓库”页。
- 按照创建 SQL 仓库中的步骤操作。
- 返回到浏览器中的“Partner Connect”选项卡,然后关闭 Anomalo 磁贴。
- 重新打开 Anomalo 磁贴。
- 从下拉列表中选择刚创建的 SQL 仓库。
从下拉列表中选择目录和架构,然后单击“添加”。 可以重复此步骤以添加多个架构。
单击“下一步”。
Partner Connect 在工作区中创建以下资源:
Partner Connect 还向 ANOMALO_USER 服务主体授予以下权限:
- USAGE:需要,为所选架构授予 SELECT 和 READ_METADATA 权限。
- SELECT:授予读取所选架构的能力。
- READ_METADATA:授予读取所选架构的元数据的能力。
- CAN_USE:授予使用所选 SQL 仓库的权限。
单击“下一步”。
“电子邮件”框显示 Azure Databricks 帐户的电子邮件地址。 Anomalo 将使用此电子邮件地址提示你创建新的 Anomalo 帐户或登录到现有的 Anomalo 帐户。
单击“连接到 Anomalo”或“登录”。
此时会在 Web 浏览器中打开一个新选项卡,其中显示了 Anomalo 网站。
完成 Anomalo 中的屏幕说明创建试用 Anomalo 帐户,或登录现有 Anomalo 帐户。
继续执行后续步骤。
连接到 Anomalo
- 请确保 Azure Databricks 工作区满足以下要求,并收集以下信息:
- 注册新的 Anomalo 帐户,或登录到现有的 Anamalo 帐户。
- 执行下列操作之一:
- 如果你刚刚注册了 Anomalo,请在“让我们通过添加数据源开始吧”页上,单击“Databricks”。
- 如果你登录到了现有的 Anomalo 帐户,请依次单击“+ 连接数据源”、“Databricks”。
- 在“连接到数据源”页上,输入此数据源的名称。
- 对于“服务器主机名”,请输入在步骤 1 中获取的“服务器主机名”值。
- 对于“HTTP 路径”,请输入在步骤 1 中获取的“HTTP 路径”值。
- 对于“个人访问令牌”,请输入在步骤 1 中获取的令牌值。
- 单击“继续”以测试与 Anamalo 的连接。
- 连接成功后,在“选择架构”页上,选择希望 Anomalo 在你的工作区中使用的目标架构。
- 在“选择表”页上,选择希望 Anomalo 在你的工作区中开始使用的目标表。
- 在“配置”页上,为 Anomalo 提供用于计划、数据新鲜度以及警报和通知的设置。 如需帮助,请单击每组设置旁边的问号图标。
- 单击“保存并查看表”。
- 继续执行后续步骤。
后续步骤
若要详细了解如何使用 Anomalo,请单击 Anomalo 主页边栏中的图书(文档)图标。
如需更多帮助,请向 Anomalo 支持人员发送电子邮件。