Arquitetura da análise avançada

Azure Analysis Services
Armazenamento do Blobs do Azure
Azure Cosmos DB
Azure Synapse Analytics
Power BI

Ideias de soluções

Esse artigo é uma ideia de solução. Caso deseje que ampliemos o conteúdo com mais informações, como possíveis casos de uso, serviços alternativos, considerações sobre implementação ou diretrizes de preços, fale conosco enviando seus comentários no GitHub.

Essa arquitetura permite combinar dados em qualquer escala com aprendizado de máquina personalizado e obter análises de dados quase em tempo real em serviços de streaming.

Arquitetura

Diagram of an advanced analytics architecture using Azure Synapse Analytics with Azure Data Lake Storage, Azure Analysis Services, Azure Cosmos DB, and Power BI.

Baixe um Arquivo Visio dessa arquitetura.

Fluxo de dados

  1. Reúna todos os seus dados estruturados, não estruturados e semiestruturados (logs, arquivos e mídia) usando o Synapse Pipelines para Azure Data Lake Storage.
  2. Use pools do Apache Spark para limpar e transformar conjuntos de dados sem estrutura e combiná-los com os dados estruturados de bancos de dados operacionais ou data warehouses.
  3. Use técnicas escalonáveis de aprendizado de máquina/aprendizado profundo para obter insights mais profundos desses dados usando Python, Scala ou .NET, com experiências de notebook no pool do Apache Spark.
  4. Aplique o pool do Apache Spark e o Synapse Pipelines no Azure Synapse Analytics para acessar e mover dados em escala.
  5. Consulte e gere relatórios sobre dados no Power BI.
  6. Leve os insights do pools do Apache Spark para o Azure Cosmos DB para torná-los acessíveis na Web e em aplicativos móveis.

Workflow

  • O Azure Synapse Analytics é um data warehouse de nuvem rápido, flexível e confiável que permite dimensionar, computar e armazenar de forma elástica e independente, com uma arquitetura de processamento massivamente paralela.
  • A documentação do Synapse Pipelines permite criar, programar e orquestrar seus fluxos de trabalho de ETL/ELT.
  • O armazenamento de Blobs do Azure é um armazenamento de objetos altamente escalável, fácil e econômico para qualquer tipo de dados não estruturados, como imagens, vídeos, áudio, documentos e muito mais.
  • Os Os pools do Spark do Azure Synapse Analytics são uma plataforma de análise rápida, fácil e colaborativa baseada no Apache Spark.
  • O Azure Cosmos DB é um serviço de banco de dados multimodelo globalmente distribuído. Saiba como replicar dados em qualquer número de regiões do Azure e dimensionar a produtividade independentemente do armazenamento.
  • O Link do Azure Synapse para o Azure Cosmos DB permite executar análises quase em tempo real em dados operacionais no Azure Cosmos DB, sem nenhum impacto de desempenho ou custo em sua carga de trabalho transacional, usando os dois mecanismos de análise disponíveis no espaço de trabalho do Azure Synapse: SQL Sem servidor e Pools do Spark.
  • Azure Analysis Services é uma análise de nível empresarial como um serviço que permite controlar, implantar, testar e fornecer sua solução de BI com confiança.
  • O Power BI é um pacote de ferramentas de análise de negócios que fornece insights a toda a organização. Conecte-se a centenas de fontes de dados, simplifique a preparação de dados e conduza a análise não planejada. Produza belos relatórios e, em seguida, publique-os para que sua organização consuma na Web e em dispositivos móveis.

Alternativas

  • O Link do Synapse é a solução preferencial da Microsoft para análises sobre dados do Azure Cosmos DB.

Detalhes do cenário

Transforme seus dados em insights acionáveis usando as melhores ferramentas de aprendizado de máquina. Essa solução permite combinar dados em qualquer escala e criar e implantar modelos de aprendizado de máquina personalizados em escala. Para saber como as plataformas de dados em escala empresarial são projetadas como parte de uma zona de destino empresarial, consulte a documentação zona de destino dos dados do Cloud Adoption Framework.

Possíveis casos de uso

As organizações podem acessar mais dados do que nunca. A análise avançada ajuda a tirar proveito dos insights de dados. As áreas incluem:

  • Serviço de atendimento ao consumidor.
  • Manutenção preditiva.
  • Recomendar produtos ou serviços.
  • Otimização do sistema de tudo, desde cadeias de suprimentos até operações de data center.
  • Desenvolvimento de produtos e serviços.

Considerações

Otimização de custo

A otimização de custos é a análise de maneiras de reduzir as despesas desnecessárias e melhorar a eficiência operacional. Para obter mais informações, confira Visão geral do pilar de otimização de custo.

Próximas etapas

Consulte a documentação a seguir sobre os serviços apresentados nesta arquitetura: