データの民主化Data democratization

多くの企業は、自社のデータセンター内にデータ ウェアハウスを保持し、ビジネスのさまざまな部分でデータを分析し、意思決定を行えるようにしています。Many companies keep data warehouses in their datacenters to help different parts of their business analyze data and make decisions. 営業、マーケティング、財務部門は、標準のレポートとダッシュボードを作成するのに、これらのシステムに大きく依存しています。Sales, marketing, and finance departments rely heavily on these systems in order to produce standard reports and dashboards. また、企業はビジネス アナリストを採用して、データ マート内のデータに対してアドホック クエリや分析も実行しています。Companies also employ business analysts to perform ad hoc querying and analysis of data in data marts. これらのデータ マートでは、セルフサービス ビジネス インテリジェンス ツールを使用して、多次元分析が実行されています。These data marts use self-service business intelligence tools to perform multidimensional analysis.

データ イノベーションや最新のデータ資産によってサポートされているビジネスでは、IT 利害関係者からデータ プロフェッショナルまで、さまざまな共同作成者に権限を与えることができます。A business that's supported by data innovation and a modern data estate can empower a broad range of contributors, from an IT stakeholder to a data professional and beyond. 彼らは "単一の真の情報源" としばしば呼ばれる集中管理されたデータのこのリポジトリに対してアクションを実行することができます。They can take action on this repository of centralized data, which is often referred to as "the single source of truth."

Azure Synapse Analytics は、シームレスなコラボレーションと分析時間の短縮を提供する唯一のサービスです。Azure Synapse Analytics is a single service for seamless collaboration and accelerated time-to-insight. このサービスをより詳細に理解するには、まず、一般的なデータ資産に関係するさまざまな役割とスキルを検討します。To understand this service in more detail, first consider the various roles and skills involved in a typical data estate:

データ ウェアハウス: "データベース管理者" は、ワークロードのインテリジェントな最適化とデータの自動的なセキュリティ保護を行いながら、データ レイクとデータ ウェアハウスの管理をサポートします。Data warehousing: database admins support the management of data lakes and data warehouses, while intelligently optimizing workloads and automatically securing data.

データ統合: "データ エンジニア" は、コーディング不要の環境を使用して、複数のソースおよび種類のデータに容易に接続します。Data integration: data engineers use a code-free environment to easily connect multiple sources and types of data.

ビッグ データと機械学習: "データ サイエンティスト" は、任意の言語 (T-SQL、Python、Scala、.NET、SparkSQL など) で作業しながら、概念実証を迅速に構築し、必要に応じてリソースをプロビジョニングします。Big data and machine learning: data scientists build proofs of concept rapidly and provision resources as needed, while working in the language of their choice (for example, T-SQL, Python, Scala, .NET, or Spark SQL).

管理とセキュリティ:"IT 担当者" は、データの保護と管理を効率化し、プライバシー要件を適用し、クラウドおよびハイブリッド構成へのアクセスをセキュリティで保護します。Management and security: IT pros protect and manage data more efficiently, enforce privacy requirements, and secure access to cloud and hybrid configurations.

ビジネス インテリジェンス: "ビジネス アナリスト" は、データセットに安全にアクセスし、ダッシュボードを構築し、組織の内外とデータを共有します。Business intelligence: business analysts securely access datasets, build dashboards, and share data within and outside their organization.

次の図は、従来のデータ ウェアハウス アーキテクチャの例を示しています。The following diagram shows an example of a classic data warehouse architecture. 既知の構造化データがコア トランザクション処理システムから抽出され、ステージング領域にコピーされます。Known structured data is extracted from core transaction processing systems and copied into a staging area. そこから、クリーニングされ、変換され、データ ウェアハウス内の運用テーブルに統合されます。From there, it's cleaned, transformed, and integrated into production tables in a data warehouse. ここには、数年分の履歴トランザクション データが段階的に蓄積されることがよくあります。It's often the case that several years of historical transaction data are incrementally built up here. これにより、売上、顧客の購入行動、および顧客のセグメンテーションの時間の経過による変化を把握するために必要なデータが提供されます。This provides the data needed to understand changes in sales, customer purchasing behavior, and customer segmentation over time. また、意思決定に役立つ年次財務報告や分析も提供されます。It also provides yearly financial reporting and analysis to help with decision making.

そこからデータのサブセットがデータ マートに抽出され、特定のビジネス プロセスに関連付けられているアクティビティが分析されます。From there, subsets of data are extracted into data marts to analyze activity associated with a specific business process. これにより、ビジネスの特定の部分での意思決定がサポートされます。This supports decision making in a specific part of the business.

従来のデータ ウェアハウスの図。

業務を効率的に実行するには、前に説明したさまざまなスキルとロールに対するすべての種類のデータが必要です。For a business to run efficiently, it needs all types of data for the different skills and roles described earlier. データ サイエンティストが機械学習モデルを構築するためのクレンジングされた生データが必要です。You need raw data that has been cleansed for data scientists to build machine-learning models. データ ウェアハウスには、ビジネス アプリケーションとダッシュボードに信頼性の高いパフォーマンスを提供するためのクリーンで構造化されたデータが必要です。You need cleaned and structured data for a data warehouse to provide reliable performance to business applications and dashboards. 最も重要なのは、生データからの分析情報の獲得を数日ではなく数分で実現できる必要があることです。Most importantly, you need to be able to go from raw data to insights in minutes, not days.

Azure Synapse Analytics には、Power BI を備えたネイティブの組み込みビジネス インテリジェンス ツールがあります。Azure Synapse Analytics has a native, built-in business intelligence tool with Power BI. これにより、1 つのインターフェイス内で 1 つのサービスを使用することによって、生データから数分で分析情報を提供するダッシュボードにアクセスできるようになります。This fully enables you to go from raw data to a dashboard serving insights in minutes, by using one service within one single interface.