Azure Synapse Analytics のチート シートでは、サービスの基本的な概念と重要なコマンドについて説明します。The Azure Synapse Analytics cheat sheet will guide you through the basic concepts of the service and important commands. この記事は、新しい学習者と、Azure Synapse の重要なトピックのハイライトを希望する学習者の両方に役立ちます。This article is helpful for both new learners and those who want highlights of the essential Azure Synapse topics.


Synapse アーキテクチャSynapse Architecture


名詞と動詞Nouns and verbs 実行内容What it does
Synapse ワークスペース (プレビュー)Synapse Workspace (preview) Azure でクラウドベースのエンタープライズ分析を行うための、セキュリティ保護可能なコラボレーション境界。A securable collaboration boundary for doing cloud-based enterprise analytics in Azure. ワークスペースは、特定のリージョンにデプロイされ、関連付けられた ADLS Gen2 アカウントと (一時データを格納するための) ファイル システムを持ちます。A workspace is deployed in a specific region and has an associated ADLS Gen2 account and file system (for storing temporary data). ワークスペースは、リソース グループに属します。A workspace is under a resource group.
Synapse SQLSynapse SQL プールまたはオンデマンド機能を使用して分析を実行します。Run analytics with pools or with on-demand capabilities.
SQL プールSQL pool 対応するデータベースをワークスペースにデプロイできる、0 対 N の SQL プロビジョニング済みのリソース。0-to-N SQL provisioned resources with their corresponding databases can be deployed in a workspace. 各 SQL プールには、データベースが関連付けられています。Each SQL pool has an associated database. SQL プールは、手動または自動でスケーリング、一時停止、または再開できます。A SQL pool can be scaled, paused and resumed manually or automatically. SQL プールは、100 DWU から最大 30,000 DWU までスケーリングできます。A SQL pool can scale from 100 DWU up to 30,000 DWU.
SQL オンデマンド (プレビュー)SQL on-demand (preview) データ レイク内のデータに対して T-SQL クエリを実行できる、大規模データ用に構築された分散データ処理システム。Distributed data processing system built for large-scale data that lets you run T-SQL queries over data in data lake. サーバーレスであるため、インフラストラクチャを管理する必要はありません。It is serverless so you don't need to manage infrastructure.
Apache SparkApache Spark Spark プールで使用される Spark ランタイム。Spark run-time used in a Spark pool. 現在サポートされているバージョンは、Python 3.6.1、Scala 2.11.12、Apache Spark 0.5 向け .NET サポート、および Delta Lake 0.3 を使用する Spark 2.4 です。The current version supported is Spark 2.4 with Python 3.6.1, Scala 2.11.12, .NET support for Apache Spark 0.5 and Delta Lake 0.3.
Apache Spark プール (プレビュー)Apache Spark pool (preview) 対応するデータベースをワークスペースにデプロイできる、0 対 N の Spark プロビジョニング済みのリソース。0-to-N Spark provisioned resources with their corresponding databases can be deployed in a workspace. Spark プールは、自動で一時停止、再開、およびスケーリングできます。A Spark pool can be auto-paused, resumed, and scaled.
Spark アプリケーションSpark application ドライバー プロセスと Executor プロセスのセットで構成されます。It consists of a driver process and a set of executor processes. Spark アプリケーションは Spark プールで実行されます。A Spark application runs on a Spark pool.
Spark セッションSpark session Spark アプリケーションの統合エントリ ポイント。Unified entry point of a spark application. これにより、Spark のさまざまな機能との対話、および少数のコンストラクトとの対話が可能になります。It provides a way to interact with Spark's various functionalities and with a lesser number of constructs. ノートブックを実行するには、セッションを作成する必要があります。To run a notebook, a session needs to be created. セッションは、特定のサイズの特定の数の Executor で実行するように構成できます。A session can be configured to run on a specific number of executors of a specific size. ノートブック セッションの既定の構成では、2 つの中規模の Executor で実行されます。The default configuration for a notebook session is is to run on 2 medium-sized executors.
SQL 要求SQL Request SQL プールまたは SQL オンデマンドを介して実行されるクエリなどの操作。Operation such as a query run through SQL pool or SQL on-demand.
データの統合Data Integration さまざまなソース間でデータを取り込み、ワークスペース内またはワークスペース外で実行されるアクティビティを調整する機能を提供します。Gives the capability to ingest data between various sources and orchestrate activities running within a workspace or outside a workspace.
アイテムArtifacts ユーザーがデータ ソースの管理、開発、調整、および視覚化を行うために必要なすべてのオブジェクトをカプセル化する概念。Concept that encapsulates all objects necessary for a user to manage data sources, develop, orchestrate, and visualize.
ノートブックNotebook Scala、PySpark、C#、および SparkSQL をサポートする、インタラクティブかつリアクティブなデータ サイエンスおよびエンジニアリング インターフェイス。Interactive and reactive Data Science and Engineering interface supporting Scala, PySpark, C#, and SparkSQL.
Spark ジョブ定義Spark job definition コードとその依存関係を含むアセンブリ jar を使用して Spark ジョブを送信するためのインターフェイス。Interface to submit a Spark job by with assembly jar containing the code and its dependencies.
データ フローData Flow ビッグ データの変換を行うために、コーディングを必要としない、完全に視覚的なエクスペリエンスを提供します。Provides a fully visual experience with no coding required to do big data transformation. すべての最適化と実行は、サーバーレス方式で処理されます。All optimization and execution are handled in a serverless fashion.
SQL スクリプトSQL script ファイルに保存された SQL コマンドのセット。Set of SQL commands saved in a file. 1 つの SQL スクリプトに 1 つまたは複数の SQL ステートメントを含めることができます。A SQL script can contain one or more SQL statements. SQL プールまたは SQL オンデマンドを介して SQL 要求を実行するために使用できます。It can be used to run SQL requests through SQL pool or SQL on-demand.
パイプラインPipeline 1 つのタスクを連携して実行するアクティビティの論理的なグループ。Logical grouping of activities that perform a task together.
アクティビティActivity データのコピー、ノートブックや SQL スクリプトの実行など、データに対して実行するアクションを定義します。Defines actions to perform on data such as copying data, running a Notebook or a SQL script.
トリガーTrigger パイプラインを実行します。Executes a pipeline. 手動または自動で実行できます (スケジュール、タンブリング ウィンドウ、またはイベントベース)。It can be run manually or automatically (schedule, tumbling window or event-based).
リンクされたサービスLinked service ワークスペースが外部リソースに接続するために必要な接続情報を定義する接続文字列。Connection strings that define the connection information needed for the workspace to connect to external resources.
データセットDataset アクティビティで入力および出力として使用されるデータを単にポイントまたは参照する、データの名前付きビュー。Named view of data that simply points or references the data to be used in an activity as input and output. リンクされたサービスに属します。It belongs to a Linked Service.

