Importação da Base de Dados de Servidor SQL nas Instalações

Este artigo descreve como usar o módulo de dados de importação no Azure Machine Learning Studio (clássico), para importar dados de uma base de dados do SQL Server no local para uma experiência de aprendizagem automática.

Nota

Aplica-se a: Machine Learning Studio (clássico)

Este conteúdo diz respeito apenas ao Studio (clássico). Módulos semelhantes de arrasto e queda foram adicionados ao designer de Aprendizagem automática Azure. Saiba mais neste artigo comparando as duas versões.

O Azure Machine Learning pode aceder a uma base de dados do SQL Server no local se os dados forem fornecidos através de um Gateway de Gestão de Dados do Microsoft. Portanto, antes de utilizar dados de importação,deve cumprir estes requisitos:

Após a ligação gateway ser estabelecida, pode então especificar propriedades adicionais, tais como os nomes do servidor e da base de dados, o método de autenticação e uma consulta de base de dados.

Como instalar um Gateway de Gestão de Dados do Microsoft

Para aceder a uma base de dados do SQL Server no local em Azure Machine Learning, é necessário descarregar e instalar o Microsoft Data Management Gatewaye, em seguida, registar o portal no Machine Learning Studio (clássico).

Para mais informações sobre a instalação e registo do portal, consulte estes artigos:

Como importar dados a partir de uma base de dados do SQL Server no local

Depois de ter sido instalado um Gateway de Gestão de Dados num computador onde pode aceder à base de dados do SQL Server, e registou o gateway no Machine Learning Studio (clássico), tem de configurar o módulo de Dados de Importação.

Antes de iniciar, desative o bloqueador pop-up do seu navegador para o site, studio.azureml.net .

Se estiver a utilizar o navegador Google Chrome, tem de descarregar e instalar um dos plug-ins disponíveis na Loja Web do Google Chrome: Clique numa extensão da aplicação.

Utilize o assistente de importação de dados

O módulo possui um novo assistente para o ajudar a escolher uma opção de armazenamento, selecionar entre as subscrições e contas existentes e configurar rapidamente todas as opções.

  1. Adicione o módulo de Dados de Importação à sua experiência. Pode encontrar o módulo em Estúdio (clássico), na categoria Entrada e Saída de Dados.

  2. Clique em Lançar O Assistente de Dados de Importação e siga as indicações.

  3. Quando a configuração estiver concluída, para copiar os dados na sua experiência, clique com o botão direito no módulo e selecione Executar Selecionado.

Se necessitar de editar uma ligação de dados existente, o assistente carrega todos os detalhes de configuração anteriores para que não tenha de recomeçar do zero.

Definir manualmente propriedades no módulo de dados de importação

  1. Adicione o módulo de Dados de Importação à sua experiência. Pode encontrar o módulo em Estúdio (clássico), na categoria Entrada e Saída de Dados.

  2. Para obter informações, selecione On-Premises SQL Database.

  3. Desa esta medida de ção específica para a base de dados do SQL Server.

    • Porta de dados: Selecione o portal que criou. O portal deve ser registado ou não aparece na lista.

    • Nome do servidor da base de dados: Digite o nome da instância SQL Server.

    • Nome da base de dados: Digite o nome da base de dados.

    • Clique em Introduzir valores no nome de utilizador e na palavra-passe e insira as credenciais de base de dados. Pode utilizar a autenticação integrada do Windows ou a autenticação do servidor SQL dependendo da configuração do seu Servidor SQL no local.

      Importante

      O gestor de credenciais deve ser lançado a partir da mesma rede que a instância do SQL Server e o cliente gateway. As credenciais não podem ser passadas através de domínios.

    • Digite ou cole na Base de Dados uma declaração SQL que descreve os dados que pretende ler. Valide sempre a declaração SQL e verifique previamente os resultados da consulta, utilizando uma ferramenta como o Visual Studio Server Explorer ou as Ferramentas de Dados do Servidor SQL.

    • Se não se espera que o conjunto de dados altere entre as execuções da experiência, selecione a opção de resultados em cache Utilização. Quando este for selecionado, se não houver outras alterações nos parâmetros do módulo, a experiência carregará os dados da primeira vez que o módulo for executado, e, posteriormente, utilizará uma versão em cache do conjunto de dados.

  4. Execute a experimentação.

Resultados

À medida que os Dados de Importação carregam os dados no Studio (clássico), poderá ser realizada alguma conversão implícita do tipo, dependendo dos tipos de dados utilizados na base de dados de origem. Para obter mais informações sobre tipos de dados, consulte os Tipos de Dados do Módulo.

Quando estiver concluído, clique no conjunto de dados de saída e selecione Visualize para ver se os dados foram importados com sucesso.

Opcionalmente, pode alterar o conjunto de dados e os seus metadados utilizando as ferramentas em Studio (clássico):

  • Utilize metadados de edição para alterar nomes de colunas, converter uma coluna para um tipo de dados diferente, ou para indicar quais as colunas que são etiquetas ou funcionalidades.

  • Utilize colunas selecionadas no conjunto de dados para selecionar um subconjunto de colunas.

  • Utilize a Partição e a Amostra para separar o conjunto de dados por critérios ou obtenha as linhas de cima n.

Notas técnicas

Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.

Perguntas comuns

Posso filtrar os dados como está a ser lido pela fonte?

O módulo de dados de importação em si não suporta a filtragem à medida que os dados estão a ser lidos. Recomendamos que crie uma vista ou defina uma consulta que gere apenas as linhas de que necessita.

Nota

Se descobrir que carregou mais dados do que o necessário, pode substituir o conjunto de dados em cache lendo um novo conjunto de dados e guardá-lo com o mesmo nome que os dados mais antigos e maiores.

Por que tenho o erro: "Tipo Decimal não é suportado"

Ao ler dados de uma base de dados SQL, poderá encontrar uma mensagem de erro a reportar um tipo de dados não suportado.

Se os dados que obtém da base de dados SQL inclui tipos de dados que não são suportados no Azure Machine Learning, deve lançar ou converter os decimais para um tipo de dados suportado antes de ler os dados. A razão é que os Dados de Importação não podem efetuar automaticamente quaisquer conversões que resultem numa perda de precisão.

Por que alguns caracteres não são exibidos corretamente

A Azure Machine Learning suporta a codificação UTF-8. Se as colunas de cordas na sua base de dados utilizarem uma codificação diferente, os caracteres podem não ser importados corretamente.

Uma opção para preservar estes caracteres é exportar os dados para um ficheiro CSV no armazenamento Azure, e usar a opção CSV com codificação para especificar parâmetros para delimitadores personalizados, a página de código, e assim por diante.

Criei um Portal de Gestão de Dados no meu servidor no local. Posso partilhar o mesmo portal entre espaços de trabalho?

Não. Deve criar uma porta de entrada separada para cada espaço de trabalho.

Embora possa configurar vários Gateways de Gestão de Dados num único espaço de trabalho (por exemplo, um para desenvolvimento, testes, produção, etc.), um gateway não pode ser partilhado em espaços de trabalho.

Criei um Gateway de Gestão de Dados no meu servidor no local que uso para Power BI ou Azure Data Factory e quero usar o mesmo portal para a Azure Machine Learning

Cada serviço requer um Gateway de Gestão de Dados separado. Se já tem um portal que está a ser utilizado para power BI ou Azure Data Factory, tem de configurar um servidor separado e instalar um portal para a aprendizagem automática.

Não é possível instalar vários gateways num único servidor.

Quero ser capaz de exportar dados para o meu servidor SQL no local. Posso usar o portal com o módulo de Dados de Exportação para escrever dados para o meu servidor SQL no local?

Atualmente, a Azure Machine Learning apenas suporta a importação de dados. Estamos a avaliar se poderá escrever na sua base de dados no futuro. Entretanto, pode utilizar a Azure Data Factory para copiar dados da nuvem para a sua base de dados no local.

Tenho uma fonte de dados que não é o Microsoft SQL Server (Oracle, Teradata, etc.). Posso ler os dados em Azure Machine Learning utilizando a opção no local no módulo de Dados de Importação?

Atualmente, o módulo de dados de importação de aprendizagem de máquinas Azure suporta apenas o Microsoft SQL Server.

Como solução alternativa, pode utilizar a Azure Data Factory para copiar os seus dados no local para armazenamento em nuvem, como o Azure Blob Storage ou a Azure Database, e depois utilizar a sua fonte de dados em nuvem no módulo De Dados de Importação.

Parâmetros do módulo

Nome Intervalo Tipo Predefinição Descrição
Origem de dados Lista Fonte de dados ou pia Armazenamento de Blobs do Azure A fonte de dados pode ser HTTP, FTP, HTTPS anónimo ou FTPS, um ficheiro no armazenamento Azure BLOB, uma tabela Azure, uma Base de Dados Azure SQL, uma base de dados sql server no local, uma tabela Hive ou um ponto final OData.
Gateway de dados qualquer DataGatewayName nenhum Nome do gateway de dados
Nome do servidor de base de dados qualquer String nenhum Servidor SQL no local
Nome da base de dados qualquer String nenhum Caso de base de dados do SQL Server nas instalações
Nome de utilizador e palavra-passe qualquer SecureString nenhum Nome de utilizador e palavra-passe
Consulta de base de dados qualquer StreamReader nenhum Consulta SQL no local

Saídas

Nome Tipo Descrição
Conjunto de dados de resultados Tabela de Dados Dataset com dados descarregados

Exceções

Exceção Descrição
Erro 0027 Uma exceção ocorre quando dois objetos têm que ter o mesmo tamanho, mas não são.
Erro 0003 Uma exceção ocorre se uma ou mais entradas forem nulas ou vazias.
Erro 0029 Uma exceção ocorre quando um URI inválido é passado.
Erro 0030 uma exceção ocorre quando não é possível descarregar um ficheiro.
Erro 0002 Uma exceção ocorre se um ou mais parâmetros não puderem ser analisados ou convertidos do tipo especificado para o tipo exigido pelo método-alvo.
Erro 0048 Uma exceção ocorre quando não é possível abrir um ficheiro.
Erro 0015 Uma exceção ocorre se a ligação da base de dados tiver falhado.
Erro 0046 Uma exceção ocorre quando não é possível criar um diretório em caminho especificado.
Erro 0049 Uma exceção ocorre quando não é possível analisar um ficheiro.

Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte códigos de erro de aprendizagem automática.

Para obter uma lista de exceções da API, consulte códigos de erro da API de aprendizagem automática.

Ver também

Dados de Importação
Dados de Exportação
Importação de URL web via HTTP
Importação da Consulta de Colmeia
Importação da Base de Dados Azure SQL
Importação da Tabela Azure
Importação do Armazenamento Azure Blob
Importação de Fornecedores de Feed de Dados