Azure Synapse を使用した分析のエンドツーエンド

Azure Synapse Analytics

Azure Cosmos DB

Azure Data Factory

Azure Databricks

Azure Event Hubs

この記事で説明するソリューションでは、さまざまな Azure サービスを組み合わせて、さまざまなソース (構造化、半構造化、非構造化、ストリーミング) のデータと分析情報の取り込み、格納、処理、エンリッチ、提供を行います。

アーキテクチャ

"このアーキテクチャの Visio ファイルをダウンロードします。 "

注意

このアーキテクチャの対象となるサービスは、大規模な Azure サービスファミリのサブセットにすぎません。この設計に含まれていない他のサービスや機能を使用しても、同様の結果を得ることができます。
分析ユースケースに固有のビジネス要件によっては、この設計では考慮されていないさまざまなサービスや機能を使用することが必要になる場合もあります。

データフロー

このアーキテクチャの対象となる分析のユースケースは、ダイアグラムの左側にあるさまざまなデータソースによって示されています。このソリューションでは、データは次のようにボトムアップで送られます。

注意

以降のセクションでは、データのライフサイクルのさまざまなステージを通じて Azure Data Lake をデータのホームとして使用します。 Azure Data Lake は、次のようなさまざまなレイヤーとコンテナーで構成されます。

生レイヤーは、ソースシステムからのデータのランディング領域です。名前が示すように、このレイヤー内のデータは生の、フィルター処理もクリーンもされていないフォームです。
ライフサイクルの次のステージでは、データがエンリッチレイヤーに移動します。このレイヤーでは、データがクリーンされ、フィルター処理され、場合によっては変換されます。
その後データはキュレーションレイヤーに移動します。このレイヤーでは、コンシューマー対応のデータが保守されます。

Azure Data Lake のレイヤーとコンテナーおよびそれらの用途の完全レビューについては、「データレイクのゾーンとコンテナー」のドキュメントを参照してください。

Azure データサービス、Azure Cosmos DB を使ったクラウドネイティブな HTAP と Dataverse

Process

Azure Synapse Link for Azure Cosmos DB と Azure Synapse Link for Dataverse を使用すると、Azure Synapse ワークスペース (SQL サーバーレスと Spark プール) から利用できる分析エンジンを使用して、オペレーショナルおよびビジネスアプリケーションデータに対して凖リアルタイムの分析を実行できます。
Azure Synapse Link for Azure Cosmos DB を使う場合は、SQL サーバーレスクエリか Spark プールノートブックのいずれかを使います。 Azure Cosmos DB 分析ストアにアクセスし、凖リアルタイムのオペレーショナルデータのデータセットを、データレイクやデータウェアハウスのデータと結合することができます。
Azure Synapse Link for Dataverse を使用する場合は、SQL サーバーレスクエリまたは Spark プールノートブックのいずれかを使用します。選択した Dataverse テーブルにアクセスし、凖リアルタイムのビジネスアプリケーションデータのデータセットを、データレイクまたはデータウェアハウスからのデータと結合することができます。

ストア

SQL サーバーレスクエリから結果として得られるデータセットは、データレイクに保持できます。 Spark ノートブックを使用している場合は、結果のデータセットをデータレイクまたはデータウェアハウス (SQL プール) に保持できます。

Serve(サービス)

データを視覚化し探索するために、関連データを Azure Synapse SQL プールまたはデータレイクからPower BI データセットに読み込みます。 Power BI モデルではセマンティックモデルが実装され、ビジネスデータとリレーションシップの分析が簡略化されます。ビジネスアナリストが Power BI レポートとダッシュボードを使用してデータを分析し、ビジネスの分析情報を引き出します。
データは、Azure Data Share を使用して、他の部署や信頼できる外部のパートナーと安全に共有することもできます。データコンシューマーは、使用するデータ形式と、共有データセットを処理するために最適なコンピューティングエンジンを自由に選択できます。
Synapse ワークスペースに格納されている構造化データと非構造化データを使用して、ナレッジマイニングソリューションを構築し、AI を使用して、Office ドキュメント、PDF、画像、オーディオ、フォーム、Web ページなど、さまざまなドキュメントの種類と形式に関する貴重なビジネス分析情報を明らかにすることもできます。

リレーショナルデータベース

取り込み

Azure Synapse パイプラインを使用して、オンプレミスとクラウドの両方のさまざまなデータベースからデータをプルします。パイプラインは、定義済みのスケジュールに基づいて、またはイベントに対する応答としてトリガーできます。あるいは、REST API を介して明示的に呼び出すこともできます。

ストア

生データレイクレイヤーでは、作成するレイヤー、各レイヤーで使用するフォルダー構造体、分析シナリオごとに使用するファイル形式に関するベストプラクティスに従って、データレイクを整理します。
Azure Synapse パイプラインから、データコピーアクティビティを使用して、リレーショナルデータベースから Azure Data Lake Store Gen 2 データレイクの生レイヤーにコピーされたデータをステージングします。データは区切りテキスト形式で保存することも、Parquet ファイルとして圧縮して保存することもできます。

Process

データフロー、SQL サーバーレスクエリ、または Spark ノートブックのいずれかを使用して、データセットを検証し、変換し、データレイク内で生レイヤーからエンリッチレイヤーを経由してキュレーションレイヤーに移動します。
1. データ変換の一部として、標準の T-SQL を使用して SQL プールから、または Spark ノートブックから、マシントレーニングモデルを呼び出すことができます。これらの ML モデルを使用して、データセットをエンリッチし、さらにビジネスの分析情報を生成することができます。これらの機械学習モデルは、Azure Cognitive Services または Azure ML のカスタム ML モデルから使用することができます。

Serve(サービス)

データレイクのキュレーションレイヤーから最終的なデータセットを直接提供するか、データコピーアクティビティを使用し、高速インジェスト用の COPY コマンドを使って最終的なデータセットを SQL プールテーブルに取り込むことができます。
データを視覚化するために、関連データを Azure Synapse SQL プールまたはデータレイクから Power BI データセットに読み込みます。 Power BI モデルではセマンティックモデルが実装され、ビジネスデータとリレーションシップの分析が簡略化されます。ビジネスアナリストが Power BI レポートとダッシュボードを使用してデータを分析し、ビジネスの分析情報を引き出します。
データは、Azure Data Share を使用して、他の部署や信頼できる外部のパートナーと安全に共有することもできます。データコンシューマーは、使用するデータ形式と、共有データセットを処理するために最適なコンピューティングエンジンを自由に選択できます。
Synapse ワークスペースに格納されている構造化データと非構造化データを使用して、ナレッジマイニングソリューションを構築し、AI を使用して、Office ドキュメント、PDF、画像、オーディオ、フォーム、Web ページなど、さまざまなドキュメントの種類と形式に関する貴重なビジネス分析情報を明らかにすることもできます。

半構造化データソース

取り込み

Azure Synapse パイプラインを使用して、オンプレミスとクラウドの両方のさまざまな半構造化データソースからデータをプルします。次に例を示します。
- CSV ファイルや JSON ファイルを含むファイルベースのソースからデータを取り込む。
- Azure Cosmos DB や MongoDB などの SQL 以外のデータベースに接続する。
- パイプラインのデータソースとして機能する SaaS アプリケーションによって提供される REST API を呼び出す。

ストア

生データレイクレイヤーでは、作成するレイヤー、各レイヤーで使用するフォルダー構造体、分析シナリオごとに使用するファイル形式に関するベストプラクティスに従って、データレイクを整理します。
Azure Synapse パイプラインから、データコピーアクティビティを使用して、半構造化データソースから Azure Data Lake Store Gen 2 データレイクの生レイヤーにコピーされたデータをステージングします。データソースから取得した元の形式を保持したままデータを保存します。

Process

バッチ/マイクロバッチパイプラインの場合は、データフロー、SQL サーバーレスクエリ、または Spark ノートブックのいずれかを使用して、データセットの検証、変換、ご自身のデータレイク内のキュレーションレイヤーへの移動を行います。 SQL サーバーレスクエリでは、基になる CSV、Parquet、または JSON の各ファイルが外部テーブルとして公開されるので、それらに対して T-SQL を使用してクエリを実行できます。
1. データ変換の一部として、標準の T-SQL を使用して SQL プールからまたは Spark ノートブックから機械学習モデルを呼び出すことができます。これらの ML モデルを使用して、データセットをエンリッチし、さらにビジネスの分析情報を生成することができます。これらの機械学習モデルは、Azure Cognitive Services または Azure ML のカスタム ML モデルから使用することができます。
凖リアルタイムのテレメトリと時系列分析のシナリオでは、データエクスプローラープールを使用して、複数のデータソース間でログと IoT イベントデータを簡単に取り込み、統合、関連付けるることができます。 Data Explorer プールを使用して、Kusto クエリ (KQL) を使用して、時系列分析、地理空間のクラスタリング、そして機械学習エンリッチメントを実行できます。

Serve(サービス)

データレイクのキュレーションレイヤーから最終的なデータセットを直接提供するか、データコピーアクティビティを使用し、高速インジェスト用の COPY コマンドを使って最終的なデータセットを SQL プールテーブルに取り込むことができます。
データを視覚化するために、関連データを Azure Synapse SQL プール、データエクスプローラープール、またはデータレイクから Power BI データセットに読み込みます。 Power BI モデルではセマンティックモデルが実装され、ビジネスデータとリレーションシップの分析が簡略化されます。ビジネスアナリストが Power BI レポートとダッシュボードを使用してデータを分析し、ビジネスの分析情報を引き出します。
データは、Azure Data Share を使用して、他の部署や信頼できる外部のパートナーと安全に共有することもできます。データコンシューマーは、使用するデータ形式と、共有データセットを処理するために最適なコンピューティングエンジンを自由に選択できます。
Synapse ワークスペースに格納されている構造化データと非構造化データを使用して、ナレッジマイニングソリューションを構築し、AI を使用して、Office ドキュメント、PDF、画像、オーディオ、フォーム、Web ページなど、さまざまなドキュメントの種類と形式に関する貴重なビジネス分析情報を明らかにすることもできます。

非構造化データソース

取り込み

Azure Synapse パイプラインを使用して、オンプレミスとクラウドの両方のさまざまな非構造化データソースからデータをプルします。次に例を示します。
- ソースファイルを含むファイルベースのソースから、ビデオ、画像、音声、またはフリーテキストを取り込みます。
- パイプラインのデータソースとして機能する SaaS アプリケーションによって提供される REST API を呼び出す。

ストア

生データレイクレイヤーでは、作成するレイヤー、各レイヤーで使用するフォルダー構造体、分析シナリオごとに使用するファイル形式に関するベストプラクティスに従って、データレイクを整理します。
Azure Synapse パイプラインから、データコピーアクティビティを使用して、非構造化データソースから Azure Data Lake Store Gen 2 データレイクの生レイヤーにコピーされたデータをステージングします。データソースから取得した元の形式を保持したままデータを保存します。

Process

Spark ノートブックを使用して、データセットを検証し、変換し、エンリッチし、データレイク内で生レイヤーからエンリッチレイヤーを経由してキュレーションレイヤーに移動します。
1. データ変換の一部として、標準の T-SQL を使用して SQL プールからまたは Spark ノートブックから機械学習モデルを呼び出すことができます。これらの ML モデルを使用して、データセットをエンリッチし、さらにビジネスの分析情報を生成することができます。これらの機械学習モデルは、Azure Cognitive Services または Azure ML のカスタム ML モデルから使用することができます。

Serve(サービス)

データレイクのキュレーションレイヤーから最終的なデータセットを直接提供するか、データコピーアクティビティを使用し、高速インジェスト用の COPY コマンドを使って最終的なデータセットをデータウェアハウステーブルに取り込むことができます。
データを視覚化するために、関連データを Azure Synapse SQL プールまたはデータレイクから Power BI データセットに読み込みます。 Power BI モデルではセマンティックモデルが実装され、ビジネスデータとリレーションシップの分析が簡略化されます。
ビジネスアナリストが Power BI レポートとダッシュボードを使用してデータを分析し、ビジネスの分析情報を引き出します。
データは、Azure Data Share を使用して、他の部署や信頼できる外部のパートナーと安全に共有することもできます。データコンシューマーは、使用するデータ形式と、共有データセットを処理するために最適なコンピューティングエンジンを自由に選択できます。
Synapse ワークスペースに格納されている構造化データと非構造化データを使用して、ナレッジマイニングソリューションを構築し、AI を使用して、Office ドキュメント、PDF、画像、オーディオ、フォーム、Web ページなど、さまざまなドキュメントの種類と形式に関する貴重なビジネス分析情報を明らかにすることもできます。

ストリーム

取り込み

Azure Event Hubs または Azure IoT Hubs を使用して、クライアントアプリケーションまたは IoT デバイスによって生成されるデータストリームを取り込みます。その後、Event Hubs または IoT Hub によって、受信した一連のイベントを保持するストリーミングデータが取り込まれ、保存されます。そうすると、コンシューマーは Event Hubs または IoT Hub エンドポイントに接続し、処理するメッセージを取得できます。

ストア

生データレイクレイヤーでは、作成するレイヤー、各レイヤーで使用するフォルダー構造体、分析シナリオごとに使用するファイル形式に関するベストプラクティスに従って、データレイクを整理します。
Azure Data Lake Store Gen 2 データレイクの生レイヤーにイベントのコピーを保存するように、Event Hubs Capture または IoT Hub Storage Endpoints を構成します。この機能では、ラムダアーキテクチャパターンの "コールドパス" が実装され、前述の半構造化データソースのパターンに従い、SQL サーバーレスクエリや Spark ノートブックを使用して、データレイクに保存されているストリームデータに対して履歴および傾向の分析を実行できます。

Process

リアルタイムの分析情報の場合、Stream Analytics ジョブを使用して、Lambda アーキテクチャパターンの "ホットパス" を実装し、転送中のストリームデータから分析情報を引き出します。 Event Hubs または IoT Hub から送信されるデータストリームに対する 1 つ以上の入力、その入力データストリームを処理する 1 つのクエリ、およびクエリ結果の送信先となる 1 つの Power BI 出力を定義します。
1. Stream Analytics を使用したデータ処理の一部として、機械学習モデルを呼び出してストリームデータセットをエンリッチし、生成された予測に基づいてビジネス上の意思決定を促進できます。これらの機械学習モデルは、Azure Cognitive Services からでも Azure Machine Learning のカスタム ML モデルからでも使用できます。
その他の Stream Analytics ジョブ出力を使用して、今後の分析ユースケースのために処理済みのイベントを Azure Synapse SQL プールまたはデータエクスプローラープールに送信します。
凖リアルタイムのテレメトリと時系列の分析シナリオでは、データエクスプローラープールを使用して、Event Hubs または IoT Hubs から直接 IoT イベントを簡単に取り込みます。 Data Explorer プールを使用すると、Kusto クエリ (KQL) を使用して、時系列分析、地理空間のクラスタリング、そして機械学習エンリッチメントを実行できます。

Serve(サービス)

その後、ビジネスアナリストがPower BI のリアルタイムデータセットとダッシュボード機能を使用して、Stream Analytics クエリによって生成された急速に変化する分析情報を視覚化します。
データは、Azure Data Share を使用して、他の部署や信頼できる外部のパートナーと安全に共有することもできます。データコンシューマーは、使用するデータ形式と、共有データセットを処理するために最適なコンピューティングエンジンを自由に選択できます。
Synapse ワークスペースに格納されている構造化データと非構造化データを使用して、ナレッジマイニングソリューションを構築し、AI を使用して、Office ドキュメント、PDF、画像、オーディオ、フォーム、Web ページなど、さまざまなドキュメントの種類や形式に関する貴重なビジネスの分析情報を明らかにすることもできます。

コンポーネント

アーキテクチャでは次の Azure サービスが使用されています。

代替

上述のアーキテクチャでは、Azure Synapse パイプラインがデータパイプラインオーケストレーションを担当します。 Azure Data Factory パイプラインでも、この記事で説明されているのと同じ機能が提供されます。
Azure Databricks も、データレイク上の構造化および非構造化データを直接処理するために使用されるコンピューティングエンジンとして使用できます。
上記のアーキテクチャでは、Azure Stream Analytics はストリーミングデータの処理を担当するサービスです。 Azure Synapse Spark プールと Azure Databricks を使用してノートブックを実行することにより、同じ役割を果たすこともできます。
Azure HDInsight Kafka クラスターを使用してストリーミングデータを取り込み、大規模なストリーミングワークロードで必要とされる適切なレベルのパフォーマンスとスケーラビリティを提供することもできます。
また、Azure Functions を使用して、Azure Synapse パイプラインから Azure Cognitive Services または Azure Machine Learning のカスタム ML モデルを呼び出すこともできます。
他の代替手段の比較については、以下をご覧ください。

シナリオの詳細

このサンプルシナリオでは、Azure Synapse Analytics を Azure Data Services の広範なファミリと使用して、組織で最も一般的なデータの課題を処理できる最新のデータプラットフォームを構築する方法を示します。

考えられるユースケース

このアプローチは、以下の目的に使うこともできます。

データ製品アーキテクチャを確立します。これは、構造化データ用のデータウェアハウスと、半構造化および非構造化データ用のデータレイクで構成されます。一元化された環境用に 1 つのデータ製品をデプロイするか、Data Mesh などの分散環境用に複数のデータ製品をデプロイするかを選択できます。詳細については、「データ管理とデータランディングゾーン」を参照してください。
ビッグデータ処理テクノロジを使用して、リレーショナルデータソースを他の非構造化データセットと統合する。
セマンティックモデリングと強力な視覚化ツールを使用してデータ分析を簡単にする。
組織内または信頼された外部パートナーとの間でデータセットを共有する。
ナレッジマイニングソリューションを実装して、画像、PDF、ドキュメントなどに隠されている貴重なビジネス情報を抽出します。

Recommendations

検出とガバナンス

データガバナンスは、大規模なエンタープライズ環境に共通の課題です。ビジネスアナリストは、ビジネス上の問題を解決するのに役立つデータ資産を発見し、理解できる必要があります。他方、最高データ責任者は、ビジネスデータのプライバシーとセキュリティに関する分析情報を必要としています。

Microsoft Purview

Microsoft Purview は、組織のデータ全体の状況を対象とした、データ資産に対するデータ検出と分析情報、データ分類、そして秘密度のために使用します。
Microsoft Purview は、データセットの意味と、組織全体でそれらがどのように使用されるべきかに関するセマンティクスをユーザーが理解する上で必要となる特定のビジネス用語を載せたビジネス用語集を管理するのに役立ちます。
すべてのデータソースを登録し、それらをメタデータのセキュリティ境界としても機能するコレクションに整理することができます。
定期スキャンを設定して、組織内のデータ資産に関する関連メタデータを自動的にカタログ化し、更新することができます。 Microsoft Purview では、Azure Data Factory や Azure Synapse のパイプラインの情報に基づいて、データ系列情報を自動的に追加することもできます。
データ分類とデータの秘密度ラベルは、定期スキャン時に適用される事前構成済みルールまたはカスタムルールに基づいて、データ資産に自動的に追加できます。
データガバナンスの専門家は、Microsoft Purview によって生成されるレポートや分析情報を使用して、データ全体を管理し、セキュリティやプライバシーの問題から組織を保護することができます。

プラットフォームサービス

お客様の Azure ソリューションの質を向上するため、Azure Well-Architected Framework で優れたアーキテクチャの 5 つの柱 (コストの最適化、オペレーショナルエクセレンス、パフォーマンス効率、信頼性、およびセキュリティ) として定義されている推奨事項とガイドラインに従ってください。

これらの推奨事項に従うにあたり、以下のサービスを設計の一部として検討する必要があります。

Microsoft Entra ID: Azure ワークロード全体に対する ID サービス、シングルサインオン、多要素認証を提供します。
Azure Cost Management: Azure ワークロードに対する財務ガバナンス。
Azure Key Vault: セキュリティで保護された資格情報と証明書の管理。たとえば、Azure Synapse パイプライン、Azure Synapse Spark プール、および Azure ML では、データストアに安全にアクセスするために使用する資格情報と証明書を Azure Key Vault から取得できます。
Azure Monitor: Azure リソースのテレメトリ情報を収集、分析し、それに基づいて対応することにより、問題を事前に特定し、パフォーマンスと信頼性を最大化します。
Microsoft Defender for Cloud: Azure ワークロードのセキュリティ体制を強化、監視します。
Azure DevOps と GitHub: DevOps プラクティスを実装して、Azure Synapse と Azure ML のワークロード開発とデプロイパイプラインに自動化とコンプライアンスを適用します。
Azure Policy: リソースの整合性、規制コンプライアンス、セキュリティ、コスト、管理のための組織の標準とガバナンスを実装します。

考慮事項

以降の考慮事項には、ワークロードの品質向上に使用できる一連の基本原則である Azure "Well-Architected Framework" の要素が組み込まれています。詳細については、「Microsoft Azure Well-Architected Framework」を参照してください。

このアーキテクチャのテクノロジが選ばれたのは、それぞれが、組織内で最も一般的なデータの課題に対処する上で必要な機能を提供しているためです。これらのサービスはスケーラビリティと可用性の要件を満たしながら、コスト管理にも役立ちます。このアーキテクチャの対象となるサービスは、大規模な Azure サービスファミリのサブセットにすぎません。同様の結果を得るには、この設計の対象になっていない他のサービスや機能を使用します。

お客様の分析ユースケースに固有のビジネス要件によっては、この設計では考慮されていないさまざまなサービスや機能を使用することが必要になる場合もあります。

同様のアーキテクチャは、ワークロードの開発とテストを行うことができる運用前環境にも実装できます。コスト効果の高い運用前環境を実現するため、お客様のワークロードに固有の要件と各サービスの機能をご検討ください。

コスト最適化

コストの最適化とは、不要な費用を削減し、運用効率を向上させる方法を検討することです。詳しくは、コスト最適化の柱の概要に関する記事をご覧ください。

一般的に、コストを見積もるには、Azure 料金計算ツールを使用します。アーキテクチャに含まれる各サービスの最適な価格レベルと全体的なコストの合計は、処理および格納されるデータの量と、期待される許容可能なパフォーマンスレベルによって異なります。各サービスの価格の詳細については、以下のガイドを参照してください。

Azure Synapse Analytics のサーバーレスアーキテクチャを使用すると、コンピューティングおよびストレージのレベルを個別にスケーリングすることができます。コンピューティングリソースは使用量に基づいて課金されるため、オンデマンドでそれらのリソースをスケーリングまたは一時停止できます。ストレージリソースはテラバイト単位で課金されるため、データを取り込んだ分だけコストが増加します。
Azure Data Lake Gen 2 は、格納データの量と、データの読み取りと書き込みを行うトランザクション数に基づいて課金されます。
Azure Event Hubs および Azure IoT Hubs は、メッセージストリームを処理するために必要なコンピューティングリソースの量に基づいて課金されます。
Azure Machine Learningは、機械学習モデルのトレーニングとデプロイに使用されるコンピューティングリソースの量に基づいて課金されます。
Cognitive Services は、そのサービス API に対して実行する呼び出しの数に基づいて課金されます。
Microsoft Purview は、カタログ内のデータ資産数と、それらをスキャンするために必要なコンピューティング能力の量に基づいて料金が決まります。
Azure Stream Analytics は、ストリームクエリの処理に必要なコンピューティング能力の量に基づいて課金されます。
Power BI には、要件に応じたさまざまな製品オプションがあります。 Power BI Embedded では、Power BI の機能をアプリケーションに埋め込むための Azure ベースのオプションが提供されます。 Power BI Embedded インスタンスは上記の料金サンプルに含まれています。
Azure Cosmos DB は、使用するデータベースに必要なストレージおよびコンピューティングリソースの量に基づいて料金が決まります。

このシナリオのデプロイ

このデプロイアクセラレータを使用すると、参照アーキテクチャ全体を実装するか、分析のユースケースに必要なワークロードを選択できます。また、パブリックエンドポイント経由でサービスにアクセスできるのか、プライベートエンドポイント経由でのみアクセスできるのかを選択することもできます。

Azure Portal
Azure CLI

Azure portal を使用する参照をデプロイするには、次のボタンを使用します。

次のコマンドを実行して、パブリックエンドポイントを使用して参照アーキテクチャ全体をデプロイします。 [Try it](試す) ボタンをクリックして、埋め込みシェルを使用します。

az deployment group create --resource-group azsynapse-e2e \
    --template-uri https://raw.githubusercontent.com/Azure/azure-synapse-analytics-end2end/main/Deploy/AzureAnalyticsE2E.json \
    --parameters networkIsolationMode=default synapseSqlAdminPassword=use-complex-password-here

次のコマンドを実行して、プライベートエンドポイントを使用して参照アーキテクチャ全体をデプロイします。 [Try it](試す) ボタンをクリックして、埋め込みシェルを使用します。

az deployment group create --resource-group azsynapse-e2e \
    --template-uri https://raw.githubusercontent.com/Azure/azure-synapse-analytics-end2end/main/Deploy/AzureAnalyticsE2E.json \
    --parameters networkIsolationMode=vNet synapseSqlAdminPassword=use-complex-password-here

詳細と追加のデプロイオプションについては、このソリューションの定義に使用されるドキュメントとコードを含む「デプロイアクセラレータ GitHub リポジトリ」を参照してください。

共同作成者

この記事は、Microsoft によって更新および保守されています。当初の寄稿者は以下のとおりです。

プリンシパル作成者:

Fabio Braga | プリンシパル MTC テクニカルアーキテクト

パブリックでない LinkedIn プロファイルを表示するには、LinkedIn にサインインします。

次のステップ

Azure のスケーラブルな分析環境のために Azure データ管理と分析のシナリオで定義されているガイドラインを確認します。
このリファレンスアーキテクチャに関連するサービスのより詳細なトレーニングコンテンツとラボについては、Microsoft Learn のデータエンジニアラーニングパスを参照してください。
ドキュメントを確認し、GitHub から利用可能なデプロイアクセラレータを使用して参照アーキテクチャをデプロイします。

Azure Synapse を使用した分析のエンド ツー エンド

アーキテクチャ

データフロー

Azure データ サービス、Azure Cosmos DB を使ったクラウド ネイティブな HTAP と Dataverse

Process

ストア

Serve(サービス)

リレーショナル データベース

取り込み

ストア

Process

Serve(サービス)

半構造化データ ソース

取り込み

ストア

Process

Serve(サービス)

非構造化データ ソース

取り込み

ストア

Process

Serve(サービス)

ストリーム

取り込み

ストア

Process

Serve(サービス)

コンポーネント

代替

シナリオの詳細

考えられるユース ケース

Recommendations

検出とガバナンス

Microsoft Purview

プラットフォーム サービス

考慮事項

コスト最適化

このシナリオのデプロイ

共同作成者

次のステップ

関連リソース

フィードバック

フィードバック

その他のリソース

Azure Synapse を使用した分析のエンドツーエンド

Azure データサービス、Azure Cosmos DB を使ったクラウドネイティブな HTAP と Dataverse

リレーショナルデータベース

半構造化データソース

非構造化データソース

考えられるユースケース

プラットフォームサービス