Importar do Banco de Dados SQL do Azure

Este artigo descreve como usar o módulo importar dados no Azure Machine Learning Studio (clássico) para obter dados de um banco de dados SQL do azure ou SQL data warehouse do Azure.

Observação

Aplica-se a: Machine Learning Studio (clássico)

Esse conteúdo pertence apenas ao estúdio (clássico). Módulos de arrastar e soltar semelhantes foram adicionados ao designer de Azure Machine Learning. Saiba mais neste artigo comparando as duas versões.

Para importar dados de um banco de dados do, você deve especificar o nome do servidor e o nome do banco e uma instrução SQL que define a tabela, exibição ou consulta.

Em geral, o armazenamento de dados em bancos de dados do Azure é mais caro do que usar tabelas ou BLOBs no Azure. Também pode haver limites na quantidade de dados que você pode armazenar em um banco de dado, dependendo do tipo de assinatura. No entanto, não há nenhuma taxa de transação em relação ao banco de dados SQL Azure, portanto, essa opção é ideal para acesso rápido a quantidades menores de informações usadas com frequência, como tabelas de pesquisa de dados ou dicionários de dados.

O armazenamento de dados em um banco de dado do Azure também é preferível se você precisar filtrar os dados antes de lê-los ou se quiser salvar previsões ou métricas de volta no banco de dados para relatórios.

Como importar dados do banco de dados SQL do Azure ou SQL Data Warehouse

Usar o assistente de importação de dados

O módulo apresenta um novo assistente para ajudá-lo a escolher uma opção de armazenamento, selecionar entre assinaturas e contas existentes e configurar rapidamente todas as opções.

  1. Adicione o módulo importar dados ao seu experimento. Você pode encontrar o módulo no Studio (clássico), na categoria entrada e saída de dados .

  2. Clique em Iniciar assistente de importação de dados e siga os prompts.

  3. Quando a configuração estiver concluída, para realmente copiar os dados em seu experimento, clique com o botão direito do mouse no módulo e selecione executar selecionado.

Se você precisar editar uma conexão de dados existente, o assistente carregará todos os detalhes de configuração anteriores para que você não precise recomeçar do zero

Definir manualmente as propriedades no módulo importar dados

As etapas a seguir descrevem como configurar manualmente a origem da importação.

  1. Adicione o módulo importar dados ao seu experimento. Você pode encontrar esse módulo no Studio (clássico), na categoria entrada e saída de dados .

  2. Para fonte de dados, selecione Azure SQL Database.

  3. Defina as seguintes opções específicas para o banco de dados SQL do Azure ou SQL Data Warehouse do Azure.

    Nome do servidor de banco de dados: digite o nome do servidor que é gerado pelo Azure. Geralmente, ela contém o formulário <generated_identifier>.database.windows.net.

    Nome do banco de dados: digite o nome de um banco de dados existente no servidor que você acabou de especificar.

    Nome da conta de usuário do servidor: digite o nome de usuário de uma conta que tenha permissões de acesso para o banco de dados.

    Senha da conta de usuário do servidor: forneça a senha para a conta de usuário especificada.

    Consulta de banco de dados: digite ou cole uma instrução SQL que descreva os dados que você deseja ler. Sempre valide a instrução SQL e verifique os resultados da consulta com antecedência, usando uma ferramenta como o Visual Studio Gerenciador de Servidores ou SQL Server Data Tools.

    Observação

    O módulo importar dados só dá suporte à inserção de nome de banco de dado, nome de conta de usuário e senha como credenciais.

  4. Se não for esperado que o conjunto de resultados lido no Azure Machine Learning seja alterado entre as execuções do experimento, selecione a opção usar resultados em cache .

    Quando essa seleção for selecionada, se não houver nenhuma outra alteração nos parâmetros do módulo, o experimento carregará os dados na primeira vez em que o módulo for executado e, depois, usará uma versão armazenada em cache do DataSet.

    Se você quiser recarregar o conjunto de uma vez em cada iteração do experimento, desmarque essa opção. O conjunto de dados é recarregado a partir da origem sempre que todos os parâmetros são alterados em Import data.

  5. Execute o experimento.

    À medida que os dados de importação carregam os dados no estúdio (clássico), alguma conversão implícita de tipo também pode ser executada, dependendo dos tipos de dados usados no banco de dado de origem.

Resultados

Quando a importação for concluída, clique no conjunto de dados de saída e selecione Visualizar para ver se os dados foram importados com êxito.

Opcionalmente, você pode alterar o conjunto de e seus metadados usando as ferramentas no Studio (clássico):

  • Use Editar metadados para alterar nomes de coluna, converter uma coluna em um tipo de dados diferente ou para indicar quais colunas são rótulos ou recursos.

  • Use selecionar colunas no conjunto de linhas para selecionar um subconjunto de colunas.

  • Use Partition e Sample para separar o conjunto de registros por critérios ou obter as n primeiras linhas.

Exemplos

Para obter um exemplo de como usar dados de bancos de dados do Azure no aprendizado de máquina, consulte estes artigos e experimentos:

Observações técnicas

Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.

Perguntas comuns

Posso filtrar os dados conforme eles estão sendo lidos da origem?

O módulo importar dados não dá suporte à filtragem, pois os dados estão sendo lidos. Recomendamos que você crie uma exibição ou defina uma consulta que gere apenas as linhas necessárias.

Observação

Se você achar que você carregou dados mais do que o necessário, você pode substituir o conjunto de dados em cache lendo um novo conjunto de dados e salvando-o com o mesmo nome que os dados mais antigos e maiores.

Por que obtenho o erro "não há suporte para o tipo decimal"?

Ao ler dados de um banco de dado SQL, você pode encontrar uma mensagem de erro relatando um tipo de dados sem suporte.

Se os dados obtidos do banco de dados SQL incluírem tipos de dado que não têm suporte no Azure Machine Learning, você deverá converter os decimais para os dados com suporte antes de ler os dados. Importar dados não pode executar automaticamente qualquer conversões que resultem em uma perda de precisão.

Para obter mais informações sobre os tipos de dados com suporte, consulte tipos de dados de módulo.

O que acontece se o banco de dados estiver em uma região geográfica diferente. O pode importar dados que ainda acessam o banco de dado? Onde os dados são armazenados?

Se o banco de dados estiver em uma região diferente da conta de aprendizado de máquina, o acesso ao dado poderá ser mais lento. Além disso, você será cobrado pela entrada e saída de dados na assinatura se o nó de computação estiver em uma região diferente da conta de armazenamento.

Os dados que você ler em seu espaço de trabalho para um experimento são salvos na conta de armazenamento associada ao experimento.

Por que alguns caracteres não são exibidos corretamente?

Azure Machine Learning dá suporte à codificação UTF-8. Se as colunas de cadeia de caracteres em seu banco de dados usarem uma codificação diferente, os caracteres poderão não ser importados corretamente.

Uma opção é exportar os dados para um arquivo CSV no armazenamento do Azure e usar a opção CSV com codificação para especificar parâmetros para delimitadores personalizados, a página de código e assim por diante.

Parâmetros do módulo

Name Intervalo Type Padrão Descrição
Fonte de dados Lista Fonte de dados ou coletor Armazenamento do Blobs do Azure A fonte de dados pode ser HTTP, FTP, HTTPS anônimo ou FTPS, um arquivo no armazenamento de BLOBs do Azure, uma tabela do Azure, um banco de dados SQL do Azure, um banco de dados SQL Server local, uma tabela Hive ou um ponto de extremidade OData.
URI do servidor HDFS any String nenhum Ponto de extremidade REST do HDFS
Nome do servidor de banco de dados any String nenhum Nome da conta de armazenamento do Azure
Nome do banco de dados any SecureString nenhum Chave de armazenamento do Azure
Nome da conta do usuário do servidor any String nenhum Nome do contêiner do Azure
Nome da conta do usuário do servidor Lista (subconjunto) Conteúdo da URL OData Tipo de formato de dado
Consulta do banco de dados any String nenhum Tipo de formato de dado
Usar resultados em cache TRUE/FALSE Boolean FALSE descrição

Saídas

Nome Tipo Descrição
Conjunto de dados de resultados Tabela de Dados Conjunto de dados com dados baixados

Exceções

Exceção Descrição
Erro 0027 Uma exceção ocorre quando dois objetos precisam ser do mesmo tamanho, mas eles não são.
Erro 0003 Ocorrerá uma exceção se uma ou mais das entradas forem nulas ou estiverem vazias.
Erro 0029 Ocorrerá uma exceção quando um URI inválido for passado.
Erro 0030 ocorrerá uma exceção quando não for possível baixar um arquivo.
Erro 0002 Ocorrerá uma exceção se um ou mais parâmetros não puderem ser analisados ou convertidos do tipo especificado para o tipo exigido pelo método de destino.
Erro 0009 Ocorrerá uma exceção se o nome da conta de armazenamento do Azure ou o nome do contêiner foi especificado incorretamente.
Erro 0048 Uma exceção ocorre quando não for possível abrir um arquivo.
Erro 0015 Ocorrerá uma exceção se houve uma falha na conexão de banco de dados.
Erro 0046 Ocorrerá uma exceção quando não for possível criar um diretório no caminho especificado.
Erro 0049 Uma exceção ocorre quando não for possível analisar um arquivo.

Para obter uma lista de erros específicos para módulos do Studio (clássicos), consulte Machine Learning códigos de erro.

Para obter uma lista de exceções de API, consulte Machine Learning códigos de erro da API REST.

Consulte também

Importar dados
Exportar dados
Importar da URL da Web via HTTP
Importar da consulta do hive
Importar da tabela do Azure
Importar do armazenamento de BLOBs do Azure
Importar de provedores de feed de dados
Importar de um Banco de dados do SQL Server local