Řešení a migrace Azure synapse Analytics pro TeradataAzure Synapse Analytics solutions and migration for Teradata

Mnoho organizací je připraveno provést krok přesunu náročné úlohy datového skladu, jako je například údržba infrastruktury a vývoj platforem, do poskytovatele cloudu.Many organizations are ready to take the step of shifting expensive data warehouse tasks like infrastructure maintenance and platform development to a cloud provider. Organizace teď chtějí využívat inovativní Cloud, infrastrukturu jako službu a platformu jako nabídky služeb v novějších prostředích, jako je Azure.Organizations are now looking to take advantage of innovative cloud, infrastructure as a service, and platform as a service offerings in newer environments like Azure.

Azure synapse Analytics je bezlimitní analytická služba, která přináší dohromady podnikové datové sklady a analýzu velkých objemů dat.Azure Synapse Analytics is a limitless analytics service that brings together enterprise data warehousing and big data analytics. Poskytuje vám volnost při dotazování na data na základě vašich podmínek pomocí serveru nebo prostředků zřízených na vyžádání bez serveru.It gives you the freedom to query data on your terms at scale by using either serverless on-demand or provisioned resources. Přečtěte si, co je potřeba naplánovat při migraci starší verze systému Teradata do Azure synapse.Learn what to plan for as you migrate a legacy Teradata system to Azure Synapse.

I když je Teradata a Azure synapse podobné jako v tom, že se jedná o databáze SQL, které jsou navržené tak, aby používaly výkonné techniky paralelního zpracování pro zajištění vysokého výkonu dotazů u velkých objemů dat, mají některé základní rozdíly:Although Teradata and Azure Synapse are similar in that they're both SQL databases that are designed to use massively parallel processing techniques to achieve high query performance on large data volumes, they have some basic differences:

  • Starší verze systémů Teradata jsou nainstalovány místně a využívají proprietární hardware.Legacy Teradata systems are installed on-premises, and they use proprietary hardware. Služba Azure synapse je založená na cloudu a využívá výpočetní prostředky a prostředky úložiště Azure.Azure Synapse is cloud-based and uses Azure compute and storage resources.
  • Upgrade konfigurace Teradata je hlavní úlohou, která zahrnuje další fyzický hardware a potenciálně dlouhou konfiguraci nebo výpisu paměti nebo jejich vystavení a opětovné načtení databáze.Upgrading a Teradata configuration is a major task that involves extra physical hardware and a potentially lengthy database reconfiguration or dump and reload. Ve službě Azure synapse jsou výpočetní prostředky a prostředky úložiště oddělené, takže můžete snadno škálovat směrem nahoru nebo dolů pomocí elastické škálovatelnosti Azure.In Azure Synapse, compute and storage resources are separate, so you can easily scale up or down independently by using the elastic scalability of Azure.
  • Bez fyzického systému na podporu můžete službu Azure synapse pozastavit nebo změnit její velikost podle potřeby a snížit tak využití prostředků a náklady.Without a physical system to support, you can pause or resize Azure Synapse as needed to reduce resource utilization and cost. V Azure máte přístup k globálně dostupnému, vysoce bezpečnému a škálovatelnému cloudovém prostředí, které zahrnuje Azure synapse v ekosystému podpůrných nástrojů a schopností.In Azure, you have access to a globally available, highly secure, and scalable cloud environment that includes Azure Synapse in an ecosystem of supporting tools and capabilities.

V tomto článku se podíváme na migraci schématu s cílem získat ekvivalentní nebo vyšší výkon migrovaného datového skladu Teradata a tržiště dat v Azure synapse.In this article, we look at schema migration, with an objective of obtaining equivalent or increased performance of your migrated Teradata data warehouse and data marts on Azure Synapse. Zvažujeme obavy, které platí konkrétně pro migraci z existujícího prostředí Teradata.We consider concerns that apply specifically to migrating from an existing Teradata environment.

V rámci vysoké úrovně proces migrace zahrnuje kroky uvedené v následující tabulce:At a high level, the migration process includes the steps that are listed in the following table:

PřípravaPreparation MigraceMigration Po migraciPost-migration
  • Definovat obor: co chceme migrovat?Define scope: What do we want to migrate?
  • Sestavte inventář dat a procesů, které chcete migrovat.Build an inventory of data and processes to migrate.
  • Definujte libovolné změny datového modelu.Define any data model changes.
  • Identifikujte nejlepší funkce a nástroje pro Azure a třetí strany, které se mají použít.Identify the best Azure and third-party tools and features to use.
  • Vyškolit pracovníky na nové platformě na začátkuTrain staff early on the new platform.
  • Nastavte cílovou platformu Azure.Set up the Azure target platform.
  • Začněte malým a jednoduchým.Start small and simple.
  • Automatizujte, pokud je to možné.Automate where possible.
  • Pomocí integrovaných nástrojů a funkcí Azure můžete snížit úsilí při migraci.Use Azure built-in tools and features to reduce the migration effort.
  • Migruje metadata pro tabulky a zobrazení.Migrate metadata for tables and views.
  • Migrujte relevantní historická data.Migrate relevant historical data.
  • Migrujte nebo refaktorujte uložené procedury a obchodní procesy.Migrate or refactor stored procedures and business processes.
  • Migrujte nebo refaktorujte přírůstkové zátěžové procesy ETL/ELT.Migrate or refactor ETL/ELT incremental load processes.
  • Sledujte a zdokumentujte všechny fáze procesu migrace.Monitor and document all stages of the migration process.
  • Využijte zkušenosti získané při vytváření šablony pro budoucí migrace.Use experience gained to build a template for future migrations.
  • V případě potřeby datový model, s využitím výkonu a škálovatelnosti nové platformy.Reengineer the data model, if necessary, by using the new platform's performance and scalability.
  • Testování aplikací a dotazovacích nástrojů.Test applications and query tools.
  • Srovnávací testy a optimalizace výkonu dotazů.Benchmark and optimize query performance.
  • Když migrujete z starší verze prostředí Teradata do Azure synapse, navíc k obecnější tématu, které jsou popsány v dokumentaci Teradata, je nutné vzít v úvahu některé konkrétní faktory.When you migrate from a legacy Teradata environment to Azure Synapse, in addition to the more general subjects that are described in the Teradata documentation, you must consider some specific factors.

    Úlohy prvotní migraceInitial migration workload

    Starší verze prostředí Teradata se obvykle postupně rozvíjejí, aby zahrnovaly více oblastí předmětu a smíšené úlohy.Legacy Teradata environments typically evolve over time to encompass multiple subject areas and mixed workloads. Když se rozhodujete, kde začít na počátečním projektu migrace, je vhodné zvolit oblast, která:When you're deciding where to start on an initial migration project, it makes sense to choose an area that:

    • Prokáže životaschopnost migrace do Azure synapse tím, že rychle doručí výhody nového prostředí.Proves the viability of migrating to Azure Synapse by quickly delivering the benefits of the new environment.
    • Umožňuje interním technickým pracovníkům získat zkušenosti s novými procesy a nástroji, aby je mohli používat k migraci dalších oblastí.Allows in-house technical staff to gain experience with new processes and tools so that they can use them to migrate other areas.
    • Vytvoří šablonu založenou na aktuálních nástrojích a procesech pro použití v dalších migracích ze zdrojového prostředí Teradata.Creates a template based on the current tools and processes to use in additional migrations from the source Teradata environment.

    Dobrým kandidátem na počáteční migraci z prostředí Teradata je ten, který implementuje úlohu Power BI/analýzy namísto úlohy OLTP.A good candidate for an initial migration from a Teradata environment is one that implements a Power BI/analytics workload rather than an OLTP workload. Zatížení by mělo mít datový model, který se dá migrovat s minimálními úpravami, jako je například hvězda nebo Snowflake.The workload should have a data model that can be migrated with minimal modifications, such as a star or snowflake schema.

    Pro velikost je důležité, aby datový svazek, který migrujete při počátečním cvičení, byl dostatečně velký, aby předvedl možnosti a výhody prostředí Azure synapse s krátkou dobou předvedením hodnoty.For size, it's important that the data volume you migrate in the initial exercise is large enough to demonstrate the capabilities and benefits of the Azure Synapse environment with a short time to demonstrate value. Velikost, která obvykle splňuje požadavky, je v rozsahu od 1 do 10 terabajtů (TB).The size that typically meets the requirements is in the range of 1 to 10 terabytes (TB).

    Přístup k počátečnímu projektu migrace, který minimalizuje čas a dobu realizace, je omezit rozsah migrace na tržiště dat.An approach for the initial migration project that minimizes risk and implementation time is to confine the scope of the migration to data marts. V Teradata je dobrým příkladem část databáze OLAP datového skladu Teradata.In Teradata, a good example is the OLAP database part of a Teradata data warehouse. Tento přístup je dobrým výchozím bodem, protože omezuje rozsah migrace a často se dá dosáhnout na krátkou časovou osu.This approach is a good starting point because it limits the scope of the migration, and it often can be achieved on a short timescale.

    Počáteční migrace rozsahu dat tržiště jenom neřeší širší otázky, jako je třeba migrace ETL a historických dat.An initial migration scope of data marts only doesn't address broader concerns like how to migrate ETL and historical data. Tyto oblasti je nutné adresovat v pozdějších fázích a zpětně naplnit vrstvu migrovaných datových tržiště s daty a procesy, které jsou nutné k jejich sestavení.You must address these areas in later phases and backfill the migrated data mart layer with the data and processes that are required to build them.

    Přístup k metodě zvednutí a posunutí vs. fázeLift-and-shift approach vs. phased approach

    Bez ohledu na to, jaké ovladače a rozsah zvolíte pro migraci, můžete vybrat ze dvou obecných typů migrace:Regardless of the drivers and scope you choose for your migration, you can choose from two general types of migrations:

    • Přístup k metodě zvednutí a posunutí: V tomto přístupu se stávající datový model, jako je třeba schéma hvězdičky, migruje beze změny na novou platformu Azure synapse.Lift-and-shift approach: In this approach, the existing data model, such as a star schema, is migrated unchanged to the new Azure Synapse platform. Důraz je na minimalizaci rizika a čase potřebného k migraci tím, že zkracuje práci potřebnou k dosažení výhod přechodu do cloudového prostředí Azure.The emphasis is on minimizing risk and the time it takes to migrate by reducing the work that's required to achieve the benefits of moving to the Azure cloud environment.

      Tento přístup je vhodný pro existující prostředí Teradata, ve kterých je možné migrovat jedno datové tržiště, a pokud jsou data již v dobře navrženém schématu hvězdičky nebo Snowflake.This approach is a good fit for existing Teradata environments in which a single data mart is to be migrated and if the data is already in a well-designed star or snowflake schema. Tento přístup je dobrým výběrem, pokud máte čas a náklady na přechod na moderní cloudové prostředí.This approach is a good choice also if you have time and cost pressures to move to a more modern cloud environment.

    • Postup, který zahrnuje úpravy: Pokud se Váš starší sklad vyvinul v průběhu času, může být potřeba, abyste datový sklad revytvořili, aby se zachoval požadovaný výkon nebo aby se podporovaly nové zdroje dat, jako jsou datové proudy IoT.Phased approach that incorporates modifications: If your legacy warehouse has evolved over time, you might need to reengineer the data warehouse to maintain the required performance or to support new data sources like IoT streams. Migrace na Azure synapse pro známé výhody škálovatelného cloudového prostředí může být považována za součást procesu restrojírenství.Migrating to Azure Synapse for the well-known benefits of a scalable cloud environment might be considered part of the reengineering process. Tento proces může zahrnovat změnu základního datového modelu, jako je například přesun z modelu Inmon do trezoru dat Azure.This process might include changing the underlying data model, such as moving from an Inmon model to Azure Data Vault.

      Tento přístup doporučujeme zpočátku přesunout existující datový model do Azure.The approach we recommend is to initially move the existing data model as-is to Azure. Pak využijte výkon a flexibilitu služeb Azure, abyste mohli použít změny v systému, aniž by to ovlivnilo stávající zdrojový systém.Then, take advantage of the performance and flexibility of Azure services to apply the reengineering changes without affecting the existing source system.

    Společné umístění virtuálního počítače pro podporu migraceVirtual machine colocation to support migration

    Volitelný přístup k migraci z místního prostředí Teradata využívá výhod levného cloudového úložiště a elastické škálovatelnosti v Azure.An optional approach to migrate from an on-premises Teradata environment takes advantage of inexpensive cloud storage and elastic scalability in Azure. Nejdřív vytvoříte instanci Teradata na virtuálním počítači Azure, který se společně nachází v cílovém prostředí Azure synapse.First, you create a Teradata instance on an Azure virtual machine that's colocated with the target Azure Synapse environment. Pak použijete standardní nástroj Teradata, jako je například Parallel Transporter nebo nástroj pro replikaci dat třetí strany, jako je Qlik (dříve Attunity), abyste efektivně přesunuli podmnožinu tabulek Teradata, kterou migrujete do instance virtuálního počítače.Then, you use a standard Teradata utility like Teradata Parallel Transporter or a third-party data replication tool like Qlik Replicate (formerly by Attunity) to efficiently move the subset of Teradata tables that you're migrating to the VM instance. Všechny úlohy migrace probíhají v prostředí Azure.All migration tasks take place in the Azure environment.

    Tento přístup má několik výhod:This approach has several benefits:

    • Po počáteční replikaci dat není zdrojový systém ovlivněn ostatními úlohami migrace.After the initial replication of data, the source system isn't affected by other migration tasks.
    • V prostředí Azure jsou k dispozici známá rozhraní Teradata, nástroje a pomůcky.Familiar Teradata interfaces, tools, and utilities are available in the Azure environment.
    • Po přesunu migrace do prostředí Azure nebudete mít k dispozici žádné potenciální problémy s dostupností šířky pásma sítě mezi místním zdrojovým systémem a cílovým systémem cloudu.After the migration shifts to the Azure environment, you don't have any potential issues with network bandwidth availability between the on-premises source system and the cloud target system.
    • Nástroje, jako Azure Data Factory efektivní volání nástrojů jako Teradata Parallel Transporter pro migraci dat rychle a snadno.Tools like Azure Data Factory efficiently call utilities like Teradata Parallel Transporter to migrate data quickly and easily.
    • Proces migrace se orchestruje a ovládá výhradně v prostředí Azure.The migration process is orchestrated and controlled entirely from within the Azure environment.

    Migrace metadatMetadata migration

    Je vhodné automatizovat a orchestrovat proces migrace pomocí možností prostředí Azure.It makes sense to automate and orchestrate the migration process by using the capabilities of the Azure environment. Tento přístup minimalizuje dopad na existující prostředí Teradata, které už může běžet blízko k plné kapacitě.This approach minimizes impact on the existing Teradata environment, which might already be running close to full capacity.

    Azure Data Factory je cloudová datová integrační služba.Azure Data Factory is a cloud-based data integration service. Data Factory můžete použít k vytvoření pracovních postupů řízených daty v cloudu a orchestrovat a automatizovat přesun dat a transformaci dat.You can use Data Factory to create data-driven workflows in the cloud to orchestrate and automate data movement and data transformation. Data Factory kanály mohou ingestovat data z různorodých úložišť dat.Data Factory pipelines can ingest data from disparate datastores. Pak data zpracovávají a transformují pomocí výpočetních služeb, jako je Azure HDInsight, pro Apache Hadoop a Apache Spark, Azure Data Lake Analytics a Azure Machine Learning.Then, they process and transform the data by using compute services like Azure HDInsight for Apache Hadoop and Apache Spark, Azure Data Lake Analytics, and Azure Machine Learning.

    Začněte tím, že vytvoříte metadata se seznamem tabulek dat, které chcete migrovat, spolu se svými umístěními.Start by creating metadata that lists the data tables you want to migrate along with their locations. Pak použijte funkce Data Factory ke správě procesu migrace.Then, use Data Factory capabilities to manage the migration process.

    Rozdíly v návrhu mezi Teradata a Azure synapseDesign differences between Teradata and Azure Synapse

    Při plánování migrace ze starší verze prostředí Teradata do Azure synapse je důležité vzít v úvahu rozdíly v návrhu mezi oběma platformami.As you plan your migration from a legacy Teradata environment to Azure Synapse, it's important to consider the design differences between the two platforms.

    Více databází vs. jedna databáze a schémataMultiple databases vs. a single database and schemas

    V prostředí Teradata můžete mít více samostatných databází pro různé části celkového prostředí.In a Teradata environment, you might have multiple, separate databases for different parts of the overall environment. Můžete mít například samostatnou databázi pro příjem dat a pracovní tabulky, databázi pro základní tabulky skladu a jinou databázi pro tržiště dat (někdy označované jako sémantická vrstva).For example, you might have a separate database for data ingestion and staging tables, a database for core warehouse tables, and another database for data marts (sometimes called a semantic layer). Zpracování samostatných databází jako kanálů ETL/ELT v Azure synapse může vyžadovat implementaci spojení mezi databázemi a přesouvání dat mezi samostatnými databázemi.Processing separate databases as ETL/ELT pipelines in Azure Synapse might require implementing cross-database joins and moving data between the separate databases.

    Prostředí Azure synapse má jedinou databázi.The Azure Synapse environment has a single database. Schémata se používají k oddělení tabulek do logických samostatných skupin.Schemas are used to separate tables into logically separate groups. Pro napodobování všech samostatných databází, které migrujete z Teradata, doporučujeme použít sadu schémat v Azure synapse.We recommend that you use a set of schemas in Azure Synapse to mimic any separate databases you migrate from Teradata.

    Pokud používáte schémata v prostředí Teradata, možná budete muset použít nové zásady vytváření názvů a přesunout existující tabulky a zobrazení Teradata do nového prostředí.If you use schemas in the Teradata environment, you might need to use a new naming convention to move the existing Teradata tables and views to the new environment. Můžete například zřetězit existující názvy schématu a tabulky Teradata do nového názvu tabulky Azure synapse a pak pomocí názvů schémat v novém prostředí zachovat původní názvy samostatných databází.For example, you might concatenate the existing Teradata schema and table names into the new Azure Synapse table name, and then use schema names in the new environment to maintain the original separate database names.

    Další možností je použít zobrazení SQL nad podkladovými tabulkami k údržbě jejich logických struktur.Another option is to use SQL views over the underlying tables to maintain their logical structures. Existují některé potenciální downsides k používání zobrazení SQL:There are some potential downsides to using SQL views:

    • Zobrazení v Azure synapse jsou jen pro čtení, takže musíte v základních základních tabulkách udělat jakékoli aktualizace dat.Views in Azure Synapse are read-only, so you must make any updates to the data on the underlying base tables.
    • Pokud již existují vrstvy zobrazení, přidání další vrstvy zobrazení může mít vliv na výkon.If layers of views already exist, adding another layer of views might affect performance.

    TabulkyTables

    Když migrujete tabulky mezi různými technologiemi, fyzicky přesunete jenom nezpracovaná data a metadata, která ho popisují mezi těmito dvěma prostředími.When you migrate tables between different technologies, you physically move only raw data and the metadata that describes it between the two environments. Nemigrujete databázové prvky jako indexy ze zdrojového systému, protože nemusí být potřeba nebo se můžou v novém prostředí implementovat jinak.You don't migrate database elements like indexes from the source system because they might not be needed, or they might be implemented differently in the new environment.

    Nicméně informace o tom, kde se optimalizace výkonu, jako jsou indexy, používají ve zdrojovém prostředí, můžou být užitečným označením, kde můžete optimalizovat výkon v novém prostředí.However, understanding where performance optimizations like indexes have been used in the source environment can be a helpful indication of where you might optimize performance in the new environment. Pokud byl například ve zdrojovém prostředí Teradata vytvořen nejedinečný sekundární index, může být výhodné vytvořit neclusterovaný index v migrovaném prostředí Azure synapse nebo použít jiné techniky optimalizace výkonu, jako je například replikace tabulek, aby bylo možné vytvořit index podobný tomu.For example, if a non-unique secondary index was created in the source Teradata environment, you might conclude that it would be advantageous to create a nonclustered index in the migrated Azure Synapse environment, or that using other native performance optimization techniques like table replication might be preferable to creating a like-for-like index.

    Databáze s vysokou dostupnostíHigh availability database

    Teradata podporuje replikaci dat mezi uzly prostřednictvím FALLBACK Možnosti.Teradata supports data replication across nodes via the FALLBACK option. Řádky tabulky, které jsou fyzicky umístěny na uzlu, se replikují do jiného uzlu v rámci systému.Table rows that reside physically on a node are replicated to another node within the system. Tento přístup zaručuje, že nedojde ke ztrátě dat v případě selhání uzlu a poskytuje základ pro scénáře převzetí služeb při selhání.This approach guarantees that data isn't lost if a node fails, and it provides the basis for failover scenarios.

    Cílem architektury s vysokou dostupností v Azure SQL Database je zaručit, že databáze je v provozu až 99,99% času.The goal of the high-availability architecture in Azure SQL Database is to guarantee that your database is up and running 99.99% of the time. Nemusíte brát v úvahu, jak mohou operace údržby a výpadky ovlivnit vaše zatížení.You don't need to consider how maintenance operations and outages might affect your workload. Azure automaticky zpracovává kritické úlohy údržby, jako jsou opravy, zálohování a upgrady Windows a SQL, a neplánované události, jako je základní hardware, software nebo selhání sítě.Azure automatically handles critical servicing tasks like patching, backups, and Windows and SQL upgrades, and unplanned events like underlying hardware, software, or network failures.

    Snímky jsou vestavěnou funkcí služby, která vytváří body obnovení ve službě Azure synapse.Snapshots are a built-in feature of the service that creates restore points in Azure Synapse. Snímky poskytují automatické zálohování pro ukládání dat v Azure synapse.Snapshots provide automatic backup for data storage in Azure Synapse. Tuto možnost není nutné povolit.You don't have to enable the capability. V současné době jednotliví uživatelé nemůžou odstraňovat automatické body obnovení, které služba používá k údržbě SLA pro obnovení.Currently, individual users can't delete automatic restore points that the service uses to maintain SLAs for recovery.

    Azure synapse přebírá snímky datového skladu během dne.Azure Synapse takes snapshots of the data warehouse throughout the day. Body obnovení, které vytvoří, jsou k dispozici po dobu sedmi dnů.The restore points that it creates are available for seven days. Dobu uchování nelze změnit.The retention period can't be changed. Azure synapse podporuje dobu osmi hodin cíle bodu obnovení.Azure Synapse supports an eight-hour recovery point objective. Datový sklad v primární oblasti můžete obnovit z libovolného snímku provedeného během posledních sedmi dnů.You can restore your data warehouse in the primary region from any of the snapshots taken in the past seven days. Další uživatelsky definované možnosti jsou k dispozici, pokud vaše organizace potřebuje podrobnější zálohy.Other user-defined options are available if your organization needs more granular backups.

    Nepodporované typy tabulek TeradataUnsupported Teradata table types

    Teradata zahrnuje podporu pro speciální typy tabulek pro časové řady a dočasná data.Teradata includes support for special table types for time series and temporal data. Azure synapse přímo nepodporuje syntaxi a některé funkce pro tyto typy tabulek, ale můžete migrovat data do standardní tabulky, která má požadované typy dat a indexovat nebo rozdělit do sloupce Datum/čas.Azure Synapse doesn't directly support the syntax and some of the functions for these table types, but you can migrate the data into a standard table that has the required data types and indexing or partitioning on the date/time column.

    Teradata implementuje funkce pro dočasné dotazování pomocí přepisu dotazu pro přidání filtrů do dočasného dotazu k omezení příslušného rozsahu kalendářních dat.Teradata implements temporal query functionality by using query rewriting to add filters to a temporal query to limit the applicable date range. Použijete-li dočasné dotazy ve zdrojovém prostředí Teradata a chcete ji migrovat, je nutné přidat filtry k relevantním dočasným dotazům.If you use temporal queries in the source Teradata environment and you want to migrate it, you must add filters to the relevant temporal queries.

    Prostředí Azure zahrnuje i funkce pro komplexní analýzy dat časových řad prostřednictvím Azure Time Series Insights.The Azure environment also includes features for complex analytics on time series data at scale through Azure Time Series Insights. Time Series Insights je navržená pro aplikace pro analýzu dat IoT a může být vhodnější pro daný případ použití.Time Series Insights is designed for IoT data analysis applications, and it might be more appropriate for that use case. Další informace najdete v tématu Azure Time Series Insights.For more information, see Azure Time Series Insights.

    Mapování datových typů TeradataTeradata data type mapping

    Některé datové typy Teradata nejsou přímo podporované v Azure synapse.Some Teradata data types aren't directly supported in Azure Synapse. Následující tabulka uvádí tyto datové typy a doporučený postup pro jejich zpracování.The following table shows these data types and the recommended approach for handling them. V tabulce je typem sloupce Teradata typ, který je uložen v katalogu systému (například in DBC.ColumnsV ).In the table, the Teradata column type is the type that's stored in the system catalog (for example, in DBC.ColumnsV).

    Pomocí metadat z tabulek katalogu Teradata určete, jestli se má migrovat některý z těchto datových typů, a pak Naplánujte podporu prostředků v plánu migrace.Use the metadata from the Teradata catalog tables to determine whether any of these data types should be migrated, and then plan for supporting resources in your migration plan. Například můžete použít dotaz SQL, jako je ten v další části, a najít všechny výskyty nepodporovaných datových typů, které potřebujete adresovat.For example, you can use a SQL query like the one in the next section to find any occurrences of unsupported data types that you need to address.

    Dodavatelé třetích stran nabízejí nástroje a služby, které umožňují automatizovat migraci, včetně mapování datových typů mezi platformami.Third-party vendors offer tools and services that can automate migration, including mapping data types between platforms. Pokud již používáte nástroj ETL třetí strany, jako je Informatica nebo Talend, v prostředí Teradata, můžete použít nástroj k implementaci požadovaných transformací dat.If you already use a third-party ETL tool like Informatica or Talend in the Teradata environment, you can use the tool to implement any required data transformations.

    Rozdíly syntaxe jazyka DML (SQL data Language)SQL Data Manipulation Language (DML) syntax differences

    Měli byste si uvědomit několik rozdílů v syntaxi jazyka SQL data (DML) mezi Teradata SQL a Azure synapse:You should be aware of a few differences in SQL Data Manipulation Language (DML) syntax between Teradata SQL and Azure Synapse:

    • QUALIFY: Teradata podporuje QUALIFY operátor.QUALIFY: Teradata supports the QUALIFY operator.

      Například:For example:

      SELECT col1 FROM tab1 WHERE col1='XYZ'

      Nástroje a služby třetích stran můžou automatizovat úlohy mapování dat:Third-party tools and services can automate data-mapping tasks:

      QUALIFY ROW_NUMBER() OVER (PARTITION by col1 ORDER BY col1) = 1;

      Ve službě Azure synapse můžete stejný výsledek dosáhnout pomocí následující syntaxe:In Azure Synapse, you can achieve the same result by using the following syntax:

      SELECT * FROM (SELECT col1, ROW_NUMBER() OVER (PARTITION by col1 ORDER BY col1) rn FROM tab1 WHERE c1='XYZ' ) WHERE rn = 1;

    • Aritmetické datum: Azure synapse má operátory jako DATEADD a DATEDIFF , které můžete použít v DATE nebo DATETIME .Date arithmetic: Azure Synapse has operators like DATEADD and DATEDIFF, which you can use on DATE or DATETIME.

      Teradata podporuje přímé odčítání u dat:Teradata supports direct subtraction on dates:

      • SELECT DATE1 - DATE2 FROM ...

      • LIKE ANY syntaktickLIKE ANY syntax

        Příklad:Example:

        SELECT * FROM CUSTOMER WHERE POSTCODE LIKE ANY ('CV1%', 'CV2%', CV3%') ;.SELECT * FROM CUSTOMER WHERE POSTCODE LIKE ANY ('CV1%', 'CV2%', CV3%') ;.

        Ekvivalent v syntaxi Azure synapse je:The equivalent in Azure Synapse syntax is:

        SELECT * FROM CUSTOMER WHERE (POSTCODE LIKE 'CV1%') OR (POSTCODE LIKE 'CV2%') OR (POSTCODE LIKE 'CV3%') ;

    • V závislosti na nastavení systému nemusí být porovnávání znaků ve Teradata standardně specifické pro velká a malá písmena.Depending on system settings, character comparisons in Teradata might not be case-specific by default. V Azure synapse jsou tato porovnání vždy specifická pro velká a malá písmena.In Azure Synapse, these comparisons are always case-specific.

    Funkce, uložené procedury, triggery a sekvenceFunctions, stored procedures, triggers, and sequences

    Při migraci datového skladu z vyspělého staršího prostředí, jako je například Teradata, často potřebujete migrovat prvky jiné než jednoduché tabulky a zobrazení do nového cílového prostředí.When you migrate a data warehouse from a mature legacy environment like Teradata, often you need to migrate elements other than simple tables and views to the new target environment. Příklady netabulkových prvků v Teradata, které možná budete potřebovat k migraci na Azure synapse, jsou funkce, uložené procedury, triggery a sekvence.Examples of non-table elements in Teradata that you might need to migrate to Azure Synapse are functions, stored procedures, triggers, and sequences. Během přípravy na migraci byste měli vytvořit inventarizaci objektů, které chcete migrovat.During the preparation phase of the migration, you should create an inventory of objects to migrate. V plánu projektu Definujte metodu zpracování všech objektů a přidělte příslušné prostředky k jejich migraci.In the project plan, define the method of handling all objects and allocate the appropriate resources to migrate them.

    V prostředí Azure můžete najít služby, které nahradí funkce implementované jako funkce nebo uložené procedury v prostředí Teradata.You might find services in the Azure environment that replace the functionality implemented as functions or stored procedures in the Teradata environment. Obvykle je efektivnější používat integrované možnosti Azure místo překódování funkcí Teradata.Usually, it's more efficient to use the built-in Azure capabilities instead of recoding the Teradata functions.

    Zde jsou další informace o migraci funkcí, uložených procedur, triggerů a sekvencí:Here's more information about migrating functions, stored procedures, triggers, and sequences:

    • Funkce: Stejně jako většina databázových produktů podporuje Teradata v implementaci SQL systémové funkce a uživatelsky definované funkce.Functions: Like most database products, Teradata supports system functions and user-defined functions in a SQL implementation. Když jsou běžné systémové funkce migrovány na jinou databázovou platformu, jako je například Azure synapse, jsou obvykle k dispozici v novém prostředí a mohou být migrovány beze změny.When common system functions are migrated to another database platform like Azure Synapse, they're usually available in the new environment and can be migrated without change. Pokud má systémová funkce mírně odlišnou syntaxi v novém prostředí, obvykle můžete požadované změny automatizovat.If system functions have slightly different syntax in the new environment, you usually can automate the required changes.

      Možná budete muset Recode libovolné uživatelsky definované funkce a systémové funkce, které nemají ekvivalent v novém prostředí.You might need to recode arbitrary user-defined functions and system functions that have no equivalent in the new environment. Používejte jazyky, které jsou k dispozici v novém prostředí.Use the languages that are available in the new environment. Azure synapse používá oblíbený jazyk Transact-SQL k implementaci uživatelsky definovaných funkcí.Azure Synapse uses the popular Transact-SQL language to implement user-defined functions.

    • Uložené procedury: Ve většině moderních databázových produktech můžete ukládat procedury n databáze.Stored procedures: In most modern database products, you can store procedures n the database. Uložená procedura obvykle obsahuje příkazy SQL a některé procedurální logiky.A stored procedure typically contains SQL statements and some procedural logic. Může také vracet data nebo stav.It might also return data or a status.

      Teradata poskytuje jazyk uložených procedur pro vytváření uložených procedur.Teradata provides stored procedure language to create stored procedures. Azure synapse podporuje uložené procedury pomocí T-SQL.Azure Synapse supports stored procedures by using T-SQL. Pokud migrujete uložené procedury do Azure synapse, musíte je Recode pomocí T-SQL.If you migrate stored procedures to Azure Synapse, you must recode them by using T-SQL.

    • Aktivační události: V Azure synapse nemůžete vytvořit triggery, ale můžete implementovat triggery v Data Factory.Triggers: You can't create triggers in Azure Synapse, but you can implement triggers in Data Factory.

    • Sekvence: Sekvence Azure synapse se zpracovávají podobně jako zpracování ve službě Teradata.Sequences: Azure Synapse sequences are handled similarly to how they are handled in Teradata. Pomocí IDENTITY sloupců nebo kódu SQL vytvořte další pořadové číslo v řadě.Use IDENTITY columns or SQL code to create the next sequence number in a series.

    Metadata a extrakce datMetadata and data extraction

    Při plánování, jak extrahovat metadata a data z prostředí Teradata, vezměte v úvahu následující informace:Consider the following information when you plan how to extract metadata and data from the Teradata environment:

    • Generování jazyka DDL (Data Definition Language): Jak je popsáno výše, je možné upravit existující službu Teradata CREATE TABLE a CREATE VIEW skripty a v případě potřeby vytvořit ekvivalentní definice s upravenými datovými typy.Data Definition Language (DDL) generation: As described earlier, it's possible to edit existing Teradata CREATE TABLE and CREATE VIEW scripts to create the equivalent definitions, with modified data types, if necessary. V tomto scénáři je obvykle nutné odebrat nadbytečné klauzule specifické pro Teradata (například FALLBACK ).In this scenario, you usually must remove extra Teradata-specific clauses (for example, FALLBACK).

      Informace, které určují aktuální definici tabulky a zobrazení, jsou udržovány v tabulkách systémových katalogů.The information that specifies the current table and view definitions is maintained in system catalog tables. Systémové tabulky katalogu jsou nejlepším zdrojem informací, protože tabulky jsou pravděpodobně aktuální a jsou dokončené.System catalog tables are the best source of the information because the tables likely are up to date and complete. Dokumentace udržovaná uživatelem nemusí být synchronizovaná s definicemi aktuální tabulky.User-maintained documentation might not be in sync with current table definitions.

      K informacím můžete přistupovat pomocí zobrazení v katalogu, jako je například DBC.ColumnsV .You can access the information by using views on the catalog, such as DBC.ColumnsV. Můžete také použít zobrazení k vygenerování ekvivalentních CREATE TABLE příkazů jazyka DDL (Data Definition Language) pro ekvivalentní tabulky v Azure synapse.You also can use views to generate the equivalent CREATE TABLE Data Definition Language (DDL) statements for the equivalent tables in Azure Synapse.

      Migrace třetích stran a nástroje ETL také využívají informace katalogu k dosažení stejného výsledku.Third-party migration and ETL tools also use the catalog information to achieve the same result.

    • Extrakce datData extraction

      Migrujte nezpracovaná data z existujících tabulek Teradata pomocí standardních nástrojů Teradata BTEQ , jako jsou a FASTEXPORT .Migrate the raw data from existing Teradata tables by using standard Teradata utilities like BTEQ and FASTEXPORT. V rámci migračního cvičení je všeobecně důležité data extrahovat co nejúčinnějším způsobem.In a migration exercise, it's generally important to extract the data as efficiently as possible. Pro poslední verze Teradata doporučujeme paralelní přenos Teradata, což je nástroj, který používá více paralelních FASTEXPORT datových proudů k dosažení nejlepší propustnosti.For recent versions of Teradata, we recommend Teradata Parallel Transporter, a utility that uses multiple parallel FASTEXPORT streams to achieve the best throughput.

      Paralelní přenos Teradata můžete volat přímo z Data Factory.You can call Teradata Parallel Transporter directly from Data Factory. Pro správu procesu migrace dat doporučujeme tento přístup, ať už je instance Teradata místní nebo zkopírovaná do virtuálního počítače v prostředí Azure, jak je popsáno výše.We recommend this approach for managing the data migration process, whether the Teradata instance is on-premises or copied to a VM in the Azure environment, as described earlier.

      Formáty dat, které doporučujeme pro extrahovaná data, jsou textové soubory s oddělovači (označované také jako hodnoty oddělené čárkami), optimalizované sloupcové sloupcové soubory nebo soubory Parquet.The data formats we recommend for extracted data are delimited text files (also called comma-separated values), optimized row columnar files, or Parquet files.

    Podrobné informace o procesu migrace dat a ETL z prostředí Teradata najdete v dokumentaci ke službě Teradata.For detailed information about the process of migrating data and ETL from a Teradata environment, see the Teradata documentation.

    Doporučení pro ladění výkonuPerformance-tuning recommendations

    Tyto platformy mají několik rozdílů, které jsou v případě optimalizace.The platforms have some differences when it comes to optimization. V následujícím seznamu doporučení pro optimalizaci výkonu se zvýrazní rozdíly v implementaci na nižší úrovni mezi Teradatami a synapse Azure a alternativami pro vaši migraci:In the following list of performance-tuning recommendations, lower-level implementation differences between Teradata and Azure Synapse and alternatives for your migration are highlighted:

    • Možnosti distribuce dat: V Azure můžete nastavit metody distribuce dat pro jednotlivé tabulky.Data distribution options: In Azure, you can set the data distribution methods for individual tables. Účelem funkce je snížit množství dat, která se pohybují mezi uzly zpracování při spuštění dotazu.The purpose of the functionality is to reduce the amount of data that moves between processing nodes when a query is executed.

      U rozsáhlých spojení tabulek a rozsáhlých tabulek je hodnota hash distribuována v jedné nebo obou tabulkách (v ideálním případě i v obou) tabulkách ve sloupcích JOIN, aby bylo zajištěno, že lze provádět místní zpracování připojení, protože řádky dat, které mají být spojeny, jsou již společně umístěny na stejném uzlu pro zpracování.For large table/large table joins, hash distributing in one or both (ideally, both) tables on the join columns helps ensure that join processing can be performed locally because the data rows to be joined are already colocated on the same processing node.

      Azure synapse poskytuje další způsob, jak zajistit místní spojení pro malé tabulky a velké tabulkové spojení (často se říká tabulka dimenzí/spojení tabulek faktů v modelu schématu hvězdičky).Azure Synapse provides an additional way to achieve local joins for small table/large table joins (often called a dimension table/fact table join in a star schema model). Můžete replikovat menší tabulku napříč všemi uzly a zajistit tak, aby každá hodnota klíče JOIN pro větší tabulku měla odpovídající řádek dimenze, který je místně k dispozici.You replicate the smaller table across all nodes, thereby ensuring that any value of the join key for the larger table has a matching dimension row that's locally available. Režie replikace tabulky dimenzí je poměrně nízká, pokud tabulky nejsou velké.The overhead of replicating the dimension table is relatively low if the tables aren't large. V takovém případě je vhodnější použití výše popsaného přístupu k distribuci algoritmem hash.In this case, using the hash distribution approach described earlier is preferable.

    • Indexování dat: Azure synapse nabízí různé možnosti indexování, ale možnosti se liší v provozu a využití z možností indexování ve službě Teradata.Data indexing: Azure Synapse provides various indexing options, but the options are different in operation and usage from indexing options in Teradata. Další informace o možnostech indexování v Azure synapse najdete v tématu návrh tabulek ve fondu Azure synapse.To learn about the indexing options in Azure Synapse, see Design tables in an Azure Synapse pool.

      Stávající indexy ve zdrojovém prostředí Teradata můžou poskytovat užitečné informace o tom, jak se data používají, a poskytnout informace o kandidátských sloupcích pro indexování v prostředí Azure synapse.Existing indexes in the source Teradata environment can provide a useful indication of how data is used and provide an indication of candidate columns for indexing in the Azure Synapse environment.

    • Dělení dat: V podnikovém datovém skladu může tabulka faktů obsahovat spoustu miliard řádků dat.Data partitioning: In an enterprise data warehouse, fact tables might contain many billions of rows of data. Vytváření oddílů je způsob, jak optimalizovat údržbu a dotazování v těchto tabulkách.Partitioning is a way to optimize maintenance and querying in these tables. Rozdělení tabulek na samostatné části snižuje množství zpracovaných dat najednou.Splitting the tables into separate parts reduces the amount of data processed at one time. Vytváření oddílů pro tabulku je definováno v CREATE TABLE příkazu.Partitioning for a table is defined in the CREATE TABLE statement.

      Pro vytváření oddílů lze použít pouze jedno pole na tabulku.Only one field per table can be used for partitioning. Pole, které se používá pro často se dělení, je pole kalendářního data, protože mnoho dotazů je filtrováno podle data nebo podle rozsahu kalendářních dat.The field that's used for partitioning frequently is a date field because many queries are filtered by date or by a date range. Po počátečním načtení můžete změnit oddíly tabulky.You can change the partitioning of a table after initial load. Chcete-li změnit dělení tabulky, vytvořte tabulku znovu s novou distribucí, která používá CREATE TABLE AS SELECT příkaz.To change a table's partitioning, re-create the table with a new distribution that uses the CREATE TABLE AS SELECT statement. Podrobný popis dělení v Azure synapse najdete v tématu tabulky oddílů ve fondu Azure synapse SQL.For a detailed description of partitioning in Azure Synapse, see Partition tables in an Azure Synapse SQL pool.

    • Statistika tabulky dat: Můžete zajistit, aby statistiky o datových tabulkách byly aktuální, přidáním COLLECT STATISTICS kroku v úlohách ETL/ELT nebo povolením automatické shromažďování statistik v tabulce.Data table statistics: You can ensure that statistics about data tables are up to date by adding a COLLECT STATISTICS step in ETL/ELT jobs or by enabling automatic statistics collection on the table.

    • Základ pro načítání dat: Základem je nejúčinnější metoda, která se používá k načtení velkých objemů dat do datového skladu.PolyBase for data loading: PolyBase is the most efficient method to use to load large amounts of data into a warehouse. K načtení dat do paralelních streamů můžete použít základnu.You can use PolyBase to load data in parallel streams.

    • Třídy prostředků pro správu úloh: Azure synapse používá třídy prostředků pro správu úloh.Resource classes for workload management: Azure Synapse uses resource classes to manage workloads. Obecně velké třídy prostředků poskytují lepší výkon jednotlivých dotazů.In general, large resource classes provide better individual query performance. Menší třídy prostředků poskytují vyšší úrovně souběžnosti.Smaller resource classes give you higher levels of concurrency. Pomocí zobrazení dynamické správy můžete monitorovat využití, aby bylo zajištěno, že budou vhodné prostředky efektivně použity.You can use dynamic management views to monitor utilization to help ensure that the appropriate resources are used efficiently.

    Další krokyNext steps

    Pokud chcete získat další informace o implementaci migrace Teradata, promluvte si účet Microsoft zástupcem o místních nabídkách migrace.For more information about implementing a Teradata migration, talk with your Microsoft account representative about on-premises migration offers.