Importar a partir da Base de Dados SQL do Azure

Este artigo descreve como usar o módulo de dados de importação no Azure Machine Learning Studio (clássico), para obter dados de uma Base de Dados Azure SQL ou Azure SQL Data Warehouse.

Nota

Aplica-se a: Machine Learning Studio (clássico)

Este conteúdo diz respeito apenas ao Studio (clássico). Módulos semelhantes de arrasto e queda foram adicionados ao designer de Aprendizagem automática Azure. Saiba mais neste artigo comparando as duas versões.

Para importar dados de uma base de dados, deve especificar tanto o nome do servidor como o nome da base de dados, como uma declaração SQL que define a tabela, visualização ou consulta.

Em geral, armazenar dados em bases de dados Azure é mais caro do que usar tabelas ou bolhas em Azure. Pode também haver limites na quantidade de dados que pode armazenar numa base de dados, dependendo do seu tipo de subscrição. No entanto, não existem taxas de transação contra a Base de Dados SQL Azure, pelo que essa opção é ideal para um acesso rápido a quantidades menores de informação frequentemente utilizada, como tabelas de procura de dados ou dicionários de dados.

É também preferível armazenar dados numa base de dados Azure se precisar de ser capaz de filtrar dados antes de os ler, ou se pretender guardar previsões ou métricas de volta à base de dados para reportar.

Como importar dados da Base de Dados Azure SQL ou do Armazém de Dados SQL

Utilize o assistente de importação de dados

O módulo possui um novo assistente para o ajudar a escolher uma opção de armazenamento, selecionar entre as subscrições e contas existentes e configurar rapidamente todas as opções.

  1. Adicione o módulo de Dados de Importação à sua experiência. Pode encontrar o módulo em Estúdio (clássico), na categoria Entrada e Saída de Dados.

  2. Clique em Lançar O Assistente de Dados de Importação e siga as indicações.

  3. Quando a configuração estiver concluída, para copiar os dados na sua experiência, clique com o botão direito no módulo e selecione Executar Selecionado.

Se precisar de editar uma ligação de dados existente, o assistente carrega todos os detalhes de configuração anteriores para que não tenha de recomeçar do zero

Definir manualmente propriedades no módulo de dados de importação

Os seguintes passos descrevem como configurar manualmente a fonte de importação.

  1. Adicione o módulo de Dados de Importação à sua experiência. Pode encontrar este módulo em Studio (clássico), na categoria Entrada e Saída de Dados.

  2. Para obter informações, selecione Azure SQL Database.

  3. Desconfie das seguintes opções específicas da Base de Dados Azure SQL ou do Armazém de Dados Azure SQL.

    Nome do servidor da base de dados: Digite o nome do servidor gerado pelo Azure. Tipicamente tem o <generated_identifier>.database.windows.net formulário.

    Nome da base de dados: Digite o nome de uma base de dados existente no servidor que acabou de especificar.

    Nome da conta do utilizador do servidor: Digite o nome de utilizador de uma conta que tenha permissões de acesso para a base de dados.

    Palavra-passe da conta de utilizadordo servidor : Forneça a palavra-passe para a conta de utilizador especificada.

    Consulta de base de dados: Digite ou cole uma declaração SQL que descreve os dados que pretende ler. Valide sempre a declaração SQL e verifique previamente os resultados da consulta, utilizando uma ferramenta como o Visual Studio Server Explorer ou as Ferramentas de Dados do Servidor SQL.

    Nota

    O módulo de Dados de Importação só suporta a introdução do nome da base de dados, o nome da conta do utilizador e a palavra-passe como credenciais.

  4. Se o conjunto de dados que leu no Azure Machine Learning não for esperado para alterar entre as execuções da experiência, selecione a opção de resultados em cache Utilização.

    Quando este é selecionado, se não houver outras alterações nos parâmetros do módulo, a experiência carrega os dados na primeira vez que o módulo é executado, e depois utiliza uma versão em cache do conjunto de dados.

    Se pretender repor o conjunto de dados em cada iteração da experiência, desmarca esta opção. O conjunto de dados é recarregado a partir da fonte sempre que quaisquer parâmetros são alterados nos Dados de Importação.

  5. Execute a experimentação.

    À medida que os Dados de Importação carregam os dados no Studio (clássico), pode também ser realizada alguma conversão implícita do tipo, dependendo dos tipos de dados utilizados na base de dados de origem.

Resultados

Quando a importação estiver concluída, clique no conjunto de dados de saída e selecione Visualize para ver se os dados foram importados com sucesso.

Opcionalmente, pode alterar o conjunto de dados e os seus metadados utilizando as ferramentas em Studio (clássico):

  • Utilize metadados de edição para alterar nomes de colunas, converter uma coluna para um tipo de dados diferente, ou para indicar quais as colunas que são etiquetas ou funcionalidades.

  • Utilize colunas selecionadas no conjunto de dados para selecionar um subconjunto de colunas.

  • Utilize a Partição e a Amostra para separar o conjunto de dados por critérios ou obtenha as linhas de cima n.

Exemplos

Para um exemplo de como utilizar dados de bases de dados da Azure em machine learning, consulte estes artigos e experiências:

Notas técnicas

Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.

Perguntas comuns

Posso filtrar os dados como está a ser lido pela fonte?

O módulo De Dados de Importação não suporta a filtragem à medida que os dados estão a ser lidos. Recomendamos que crie uma vista ou defina uma consulta que gere apenas as linhas de que necessita.

Nota

Se descobrir que carregou mais dados do que o necessário, pode substituir o conjunto de dados em cache lendo um novo conjunto de dados e guardá-lo com o mesmo nome que os dados mais antigos e maiores.

Por que tenho o erro: "Tipo Decimal não é suportado"?

Ao ler dados de uma base de dados SQL, poderá encontrar uma mensagem de erro a reportar um tipo de dados não suportado.

Se os dados que obtém da base de dados SQL inclui tipos de dados que não são suportados no Azure Machine Learning, deve lançar ou converter os decimais para um dado suportado antes de ler os dados. Os Dados de Importação não podem efetuar automaticamente quaisquer conversões que resultem numa perda de precisão.

Para obter mais informações sobre tipos de dados suportados, consulte os Tipos de Dados do Módulo.

O que acontece se a base de dados estiver numa região geográfica diferente. Os Dados de Importação ainda podem aceder à base de dados? Onde estão os dados armazenados?

Se a base de dados estiver numa região diferente da conta de machine learning, o acesso aos dados pode ser mais lento. Além disso, é cobrado por entrada de dados e saída na subscrição se o nó de computação estiver numa região diferente da conta de armazenamento.

Os dados que lê no seu espaço de trabalho para uma experiência são guardados na conta de armazenamento associada à experiência.

Porque é que alguns personagens não são exibidos corretamente?

A Azure Machine Learning suporta a codificação UTF-8. Se as colunas de cordas na sua base de dados utilizarem uma codificação diferente, os caracteres podem não ser importados corretamente.

Uma opção é exportar os dados para um ficheiro CSV no armazenamento Azure, e usar a opção CSV com codificação para especificar parâmetros para delimiters personalizados, a página de código, e assim por diante.

Parâmetros do módulo

Nome Intervalo Tipo Predefinição Descrição
Origem de dados Lista Fonte de dados ou pia Armazenamento de Blobs do Azure A fonte de dados pode ser HTTP, FTP, HTTPS anónimo ou FTPS, um ficheiro no armazenamento Azure BLOB, uma tabela Azure, uma Base de Dados Azure SQL, uma base de dados sql server no local, uma tabela Hive ou um ponto final OData.
URI do servidor HDFS qualquer String nenhum Ponto final de descanso HDFS
Nome do servidor de base de dados qualquer String nenhum Nome da conta de armazenamento do Azure
Nome da base de dados qualquer SecureString nenhum Chave de armazenamento azul
Nome da conta do utilizador do servidor qualquer String nenhum Nome do recipiente azul
Nome da conta do utilizador do servidor Lista (subconjunto) Conteúdo de url OData Tipo de formato de dados
Consulta de base de dados qualquer String nenhum Tipo de formato de dados
Use resultados em cache VERDADEIRO/FALSO Booleano FALSE descrição

Saídas

Nome Tipo Descrição
Conjunto de dados de resultados Tabela de Dados Dataset com dados descarregados

Exceções

Exceção Descrição
Erro 0027 Uma exceção ocorre quando dois objetos têm que ter o mesmo tamanho, mas não são.
Erro 0003 Uma exceção ocorre se uma ou mais entradas forem nulas ou vazias.
Erro 0029 Uma exceção ocorre quando um URI inválido é passado.
Erro 0030 uma exceção ocorre quando não é possível descarregar um ficheiro.
Erro 0002 Uma exceção ocorre se um ou mais parâmetros não puderem ser analisados ou convertidos do tipo especificado para o tipo exigido pelo método-alvo.
Erro 0009 Ocorre uma exceção se o nome da conta de armazenamento Azure ou o nome do recipiente forem especificados incorretamente.
Erro 0048 Uma exceção ocorre quando não é possível abrir um ficheiro.
Erro 0015 Uma exceção ocorre se a ligação da base de dados tiver falhado.
Erro 0046 Uma exceção ocorre quando não é possível criar um diretório em caminho especificado.
Erro 0049 Uma exceção ocorre quando não é possível analisar um ficheiro.

Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte códigos de erro de aprendizagem automática.

Para obter uma lista de exceções da API, consulte códigos de erro da API de aprendizagem automática.

Ver também

Dados de Importação
Dados de Exportação
Importação de URL web via HTTP
Importação da Consulta de Colmeia
Importação da Tabela Azure
Importação do Armazenamento Azure Blob
Importação de Fornecedores de Feed de Dados
Importação da Base de Dados de Servidor SQL nas Instalações