Integratieruntime beheren

Voltooid

In de Data Factory definieert een activiteit de actie die moet worden uitgevoerd. Een gekoppelde service definieert een doelgegevensarchief of een rekenservice. Een integratieruntime biedt de infrastructuur voor de activiteit en gekoppelde services.

Integration Runtime wordt verwezen door de gekoppelde service of activiteit en biedt de rekenomgeving waarin de activiteit wordt uitgevoerd of wordt verzonden. Op deze manier kan de activiteit optimaal worden uitgevoerd in de regio die het dichtst mogelijk bij het doelgegevensarchief of de rekenservice ligt, terwijl wordt voldaan aan vereisten rondom beveiliging en naleving.

Kortom, de Integration Runtime (IR) is de rekeninfrastructuur die wordt gebruikt door Azure Data Factory. Het biedt de volgende mogelijkheden voor gegevensintegratie in verschillende netwerkomgevingen, waaronder:

  • Gegevensstroom: voer een Gegevensstroom uit in een beheerde Azure-rekenomgeving.
  • Gegevensverplaatsing: Gegevens kopiëren tussen gegevensarchieven in openbare netwerken en gegevensarchieven in een particulier netwerk (on-premises of virtueel particulier netwerk). Deze optie biedt ondersteuning voor ingebouwde connectors, indelingsconversie, kolomtoewijzing en hoogwaardige en schaalbare gegevensoverdracht.
  • Activiteitsverzending: verzend en bewaak transformatieactiviteiten die worden uitgevoerd op verschillende rekenservices, zoals Azure Databricks, Azure HDInsight, Azure Machine Learning, Azure SQL Database, SQL Server en meer.
  • SSIS-pakketuitvoering: systeemeigen SSIS-pakketten (SQL Server Integration Services) uitvoeren in een beheerde Azure-rekenomgeving.

Wanneer een Azure Data Factory-exemplaar wordt gemaakt, wordt er een standaard-Integration Runtime-omgeving gemaakt die ondersteuning biedt voor bewerkingen in cloudgegevensarchieven en rekenservices in het openbare netwerk. Dit kan worden weergegeven wanneer de integratieruntime is ingesteld op Automatisch oplossen

Typen Integration Runtime

Data Factory biedt drie typen Integration Runtime. Kies het type dat het beste aansluit op de mogelijkheden voor de gegevensintegratie en de behoeften op het gebied van de netwerkomgeving. Deze drie typen zijn:

  • Azure
  • Zelfgehost
  • Azure-SSIS

U kunt de instelling Integration Runtime expliciet definiëren in de eigenschap ConnectVia , als dit niet is gedefinieerd, wordt de standaard Integration Runtime gebruikt met de eigenschap ingesteld op Automatisch oplossen.

De volgende tabel beschrijft de mogelijkheden en de netwerkondersteuning voor de drie typen Integration Runtime:

IR-type Openbaar netwerk Privénetwerk
Azure Gegevensstroom Gegevensstroom
Gegevensverplaatsing Gegevensverplaatsing
Activiteitsverzending Activiteitsverzending
Zelfgehost Gegevensverplaatsing Gegevensverplaatsing
Verzending van de activiteit Verzending van de activiteit
Azure-SSIS Uitvoering van SSIS-pakket Uitvoering van SSIS-pakket

Bepalen welke Integration Runtime moet worden gebruikt

Er zijn verschillende factoren die van invloed zijn op de Integration Runtime die u gaat gebruiken. Hier volgt een handleiding waarmee u de juiste IR kunt selecteren

Kopieeractiviteit

Voor de Copy-activiteit zijn gekoppelde bron- en sinkservices vereist om de richting van de gegevensstroom te definiëren. De volgende logica wordt gebruikt om te bepalen welk exemplaar van Integration Runtime wordt gebruikt voor het uitvoeren van de kopieeractiviteit:

  • Kopiëren tussen twee gegevensbronnen in de cloud: : wanneer zowel de gekoppelde bronservices als de sinkservices Azure IR gebruiken, gebruikt ADF de regionale Azure IR die u hebt opgegeven of wordt automatisch een locatie van Azure bepaald als u ervoor kiest de IR voor automatisch oplossen (standaardwaarde) te gebruiken, zoals beschreven in de sectie Locatie van Integration Runtime.

  • Kopiëren tussen een gegevensbron in de cloud en een gegevensbron in een privénetwerk: als de gekoppelde bron- of sinkservice verwijst naar een zelf-hostende IR, wordt de kopieerbewerking uitgevoerd op die zelf-hostende Integration Runtime.

  • Kopiëren tussen twee gegevensbronnen in een particulier netwerk: zowel de gekoppelde bron- als sinkservice moet verwijzen naar hetzelfde exemplaar van integration runtime en die Integration Runtime wordt gebruikt om de kopieeractiviteit uit te voeren.

Activiteit Lookup en GetMetadata

De activiteit Lookup en GetMetadata wordt uitgevoerd voor de integratieruntime die is gekoppeld aan de service die aan de gegevensopslag is gekoppeld.

Transformatieactiviteit

Elke transformatieactiviteit heeft een gekoppelde doelrekenservice die naar een Integration Runtime verwijst. Vanuit dit exemplaar van de Integration Runtime wordt de transformatieactiviteit verzonden.

Gegevensstroom activiteit

Gegevensstroom activiteit wordt uitgevoerd op de integratieruntime die eraan is gekoppeld.