Detecção de fraude em tempo real no AzureReal-time fraud detection on Azure

Este cenário de exemplo é relevante para organizações que precisam analisar dados em tempo real para detectar transações fraudulentas ou outra atividade anômala.This example scenario is relevant to organizations that need to analyze data in real time to detect fraudulent transactions or other anomalous activity.

Entre os possíveis usos estão a identificação de atividades fraudulentas em cartões de crédito ou de chamadas de celular.Potential applications include identifying fraudulent credit card activity or mobile phone calls. Os sistemas tradicionais de análise online podem levar horas para transformar e analisar os dados para identificar atividade anômala.Traditional online analytical systems might take hours to transform and analyze the data to identify anomalous activity.

Usando serviços do Azure totalmente gerenciados, como hubs de eventos e Stream Analytics, as empresas podem eliminar a necessidade de gerenciar servidores individuais, reduzindo os custos e usando a experiência da Microsoft na ingestão de dados em escala de nuvem e análise em tempo real.By using fully managed Azure services such as Event Hubs and Stream Analytics, companies can eliminate the need to manage individual servers, while reducing costs and using Microsoft's expertise in cloud-scale data ingestion and real-time analytics. Este cenário aborda especificamente a detecção de atividade fraudulenta.This scenario specifically addresses the detection of fraudulent activity. Se você tiver outras necessidades de análise de dados, analise a lista de serviços do Azure Analytics disponíveis.If you have other needs for data analytics, you should review the list of available Azure Analytics services.

Este exemplo representa parte de uma estratégia e uma arquitetura de processamento de dados mais amplas.This sample represents one part of a broader data processing architecture and strategy. Outras opções para esse aspecto de uma arquitetura geral serão discutidas mais adiante neste artigo.Other options for this aspect of an overall architecture are discussed later in this article.

Casos de uso relevantesRelevant use cases

Outros casos de uso relevantes incluem:Other relevant use cases include:

  • Detectar chamadas fraudulentas em cenários de telecomunicações.Detecting fraudulent mobile-phone calls in telecommunications scenarios.
  • Identificar transações fraudulentas de cartão de crédito para instituições bancárias.Identifying fraudulent credit card transactions for banking institutions.
  • Identificar compras fraudulentas em cenários de varejo ou comércio eletrônico.Identifying fraudulent purchases in retail or e-commerce scenarios.

ArquiteturaArchitecture

Visão geral da arquitetura dos componentes do Azure de um cenário de detecção de fraudes em tempo real

Este cenário cobre os componentes de back-end de um pipeline de análise em tempo real.This scenario covers the back-end components of a real-time analytics pipeline. O fluxo de dados deste cenário ocorre da seguinte forma:Data flows through the scenario as follows:

  1. Metadados de chamadas de celular são enviados do sistema de origem para uma instância dos Hubs de Eventos do Azure.Mobile phone call metadata is sent from the source system to an Azure Event Hubs instance.
  2. Um trabalho do Stream Analytics é iniciado e recebe dados da fonte do hub de eventos.A Stream Analytics job is started, which receives data via the event hub source.
  3. O trabalho do Stream Analytics executa uma consulta predefinida para transformar o fluxo de entrada e analisá-lo com base em um algoritmo de transações fraudulentas.The Stream Analytics job runs a predefined query to transform the input stream and analyze it based on a fraudulent-transaction algorithm. Essa consulta usa uma janela em cascata para segmentar o fluxo em unidades temporais distintas.This query uses a tumbling window to segment the stream into distinct temporal units.
  4. O trabalho do Stream Analytics grava o fluxo transformado que representa chamadas fraudulentas para um coletor de saída do Armazenamentos de blobs do Azure.The Stream Analytics job writes the transformed stream representing detected fraudulent calls to an output sink in Azure Blob storage.

ComponentesComponents

  • Os Hubs de Eventos do Azure são uma plataforma de streaming em tempo real e um serviço de ingestão de eventos capaz de receber e processar milhões de eventos por segundo.Azure Event Hubs is a real-time streaming platform and event ingestion service, capable of receiving and processing millions of events per second. Os Hubs de Eventos podem processar e armazenar eventos, dados ou telemetria produzidos pelos dispositivos e software distribuídos.Event Hubs can process and store events, data, or telemetry produced by distributed software and devices. Neste cenário, os Hubs de Eventos recebem todos os metadados de chamadas telefônicas que serão analisadas em relação a atividades fraudulentas.In this scenario, Event Hubs receives all phone call metadata to be analyzed for fraudulent activity.
  • O Azure Stream Analytics é um mecanismo de processamento de eventos que permite examinar grandes volumes de fluxo de dados de dispositivos e de outras fontes de dados.Azure Stream Analytics is an event-processing engine that can analyze high volumes of data streaming from devices and other data sources. Ele também oferece suporte à extração de informações dos fluxos de dados para identificar padrões e relações.It also supports extracting information from data streams to identify patterns and relationships. Esses padrões podem disparar outras ações downstream.These patterns can trigger other downstream actions. Neste cenário, o Stream Analytics transforma o fluxo de entrada do Hub de Eventos para identificar chamadas fraudulentas.In this scenario, Stream Analytics transforms the input stream from Event Hubs to identify fraudulent calls.
  • O Armazenamento de Blobs é usado neste cenário para armazenar os resultados do trabalho do Stream Analytics.Blob storage is used in this scenario to store the results of the Stream Analytics job.

ConsideraçõesConsiderations

AlternativasAlternatives

Muitas opções de tecnologia estão disponíveis para ingestão de mensagens em tempo real, armazenamento de dados, processamento de fluxo, armazenamento de dados analíticos, análise e relatórios.Many technology choices are available for real-time message ingestion, data storage, stream processing, storage of analytical data, and analytics and reporting. Para obter uma visão geral dessas opções, seus recursos e os principais critérios de seleção, consulte arquiteturas de Big Data: processamento em tempo real no guia da arquitetura de dados do Azure.For an overview of these options, their capabilities, and key selection criteria, see Big data architectures: Real-time processing in the Azure Data Architecture Guide.

Além disso, os algoritmos mais complexos para detecção de fraude podem ser produzidos por vários serviços de aprendizado de máquina no Azure.Additionally, more complex algorithms for fraud detection can be produced by various machine learning services in Azure. Para obter uma visão geral dessas opções, confira Opções de tecnologia para aprendizado de máquina no Guia de Arquitetura de Dados do Azure.For an overview of these options, see Technology choices for machine learning in the Azure Data Architecture Guide.

DisponibilidadeAvailability

O Azure Monitor fornece interfaces de usuário unificadas para monitoramento entre os diferentes serviços do Azure.Azure Monitor provides unified user interfaces for monitoring across various Azure services. Para obter mais informações, confira Monitoramento no Microsoft Azure.For more information, see Monitoring in Microsoft Azure. Os Hubs de Eventos e o Stream Analytics estão integrados ao Azure Monitor.Event Hubs and Stream Analytics are both integrated with Azure Monitor.

EscalabilidadeScalability

Os componentes desse cenário são projetados para a ingestão de hiperescala e análise em tempo real paralela em massa.The components of this scenario are designed for hyperscale ingestion and massively parallel real-time analytics. Os Hubs de Eventos do Azure são altamente escalonáveis, capazes de receber e processar milhões de eventos por segundo com baixa latência.Azure Event Hubs is highly scalable, capable of receiving and processing millions of events per second with low latency. Os Hubs de Eventos escalam verticalmente o número de unidades de taxa de transferência automaticamente para atender às necessidades de uso.Event Hubs can automatically scale up the number of throughput units to meet usage needs. O Azure Stream Analytics é capaz de analisar grandes volumes de dados de streaming de várias fontes.Azure Stream Analytics is capable of analyzing high volumes of streaming data from many sources. Você pode escalar verticalmente o Stream Analytics, aumentando o número de unidades de streaming alocado para executar o trabalho de streaming.You can scale up Stream Analytics by increasing the number of streaming units allocated to execute your streaming job.

Para obter orientação geral sobre como criar soluções escalonáveis, consulte a lista de verificação de eficiência de desempenho no centro de arquitetura do Azure.For general guidance on designing scalable solutions, see the performance efficiency checklist in the Azure Architecture Center.

SegurançaSecurity

Os Hubs de Eventos do Azure protegem dados por meio de um modelo de autenticação e segurança com base em uma combinação de tokens SAS (Assinatura de Acesso Compartilhado) e editores de eventos.Azure Event Hubs secures data through an authentication and security model based on a combination of Shared Access Signature (SAS) tokens and event publishers. Um editor de eventos define um ponto de extremidade virtual para um hub de eventos.An event publisher defines a virtual endpoint for an event hub. O editor só pode ser usado para enviar mensagens a um hub de eventos.The publisher can only be used to send messages to an event hub. Não é possível receber mensagens de um editor.It is not possible to receive messages from a publisher.

Para obter diretrizes gerais sobre como projetar soluções seguras, consulte a documentação de segurança do Azure.For general guidance on designing secure solutions, see the Azure Security Documentation.

ResiliênciaResiliency

Para obter diretrizes gerais sobre como criar soluções resilientes, consulte projetando aplicativos confiáveis do Azure.For general guidance on designing resilient solutions, see Designing reliable Azure applications.

Implantar o cenárioDeploy the scenario

Para implantar este cenário, você pode seguir este tutorial passo a passo que demonstra como implantar manualmente cada componente do cenário.To deploy this scenario, you can follow this step-by-step tutorial demonstrating how to manually deploy each component of the scenario. O tutorial também fornece um aplicativo de cliente .NET para gerar metadados de chamada telefônica de exemplo e enviar esses dados para uma instância de hub de eventos.This tutorial also provides a .NET client application to generate sample phone call metadata and send that data to an event hub instance.

PreçosPricing

Para explorar o custo de executar esse cenário, todos os serviços são pré-configurados na calculadora de custos.To explore the cost of running this scenario, all of the services are pre-configured in the cost calculator. Para ver como o preço seria alterado em seu caso de uso específico, altere as variáveis apropriadas de acordo com o volume de dados esperado.To see how the pricing would change for your particular use case, change the appropriate variables to match your expected data volume.

Fornecemos três perfis de custo de exemplo com base na quantidade de tráfego que você espera receber:We have provided three sample cost profiles based on amount of traffic you expect to get:

  • Pequeno: processa um milhão de eventos por meio de uma unidade de streaming padrão por mês.Small: process one million events through one standard streaming unit per month.
  • Médio: processa 100 milhões de eventos por meio de cinco unidades de streaming padrão por mês.Medium: process 100M events through five standard streaming units per month.
  • Grande: processa 999 milhões de eventos por meio de 20 unidades de streaming padrão por mês.Large: process 999 million events through 20 standard streaming units per month.

Cenários de detecção de fraude mais complexos podem se beneficiar de um modelo de aprendizado de máquina.More complex fraud detection scenarios can benefit from a machine learning model. Para cenários criados usando o Machine Learning Server, confira Detecção de fraude usando o Machine Learning Server.For scenarios built using Machine Learning Server, see Fraud detection using Machine Learning Server. Para outros modelos de solução usando o Machine Learning Server, confira Cenários de ciência de dados e modelos de solução.For other solution templates using Machine Learning Server, see Data science scenarios and solution templates.