Zarządzanie środowiskami Integration Runtime

Ukończone

W usłudze Data Factory działanie definiuje akcję do wykonania. Połączona usługa definiuje docelowy magazyn danych lub usługę obliczeniową. Środowisko Integration Runtime zapewnia infrastrukturę dla działania i połączonych usług.

Integration Runtime się do połączonej usługi lub działania i udostępnia środowisko obliczeniowe, w którym działanie jest uruchamiane lub z którego jest wysyłane. Dzięki temu działanie można wykonać w regionie najbliższym docelowemu magazynowi danych lub usłudze obliczeniowej, w sposób najbardziej wydajny, jednocześnie spełniając wymagania dotyczące zabezpieczeń i zgodności.

Krótko mówiąc, Integration Runtime (IR) to infrastruktura obliczeniowa używana przez Azure Data Factory. Zapewnia ona następujące możliwości integracji danych w różnych środowiskach sieciowych, w tym:

  • Data Flow: Wykonaj polecenie Flow danych w zarządzanym środowisku obliczeniowym platformy Azure.
  • Ruch danych: kopiowanie danych między magazynami danych w sieci publicznej i magazynami danych w sieci prywatnej (lokalnej lub wirtualnej sieci prywatnej). Zapewnia obsługę wbudowanych łączników, konwersji formatów i mapowania kolumn oraz wydajne i skalowalne przenoszenie danych.
  • Wysyłanie działania: wysyłanie i monitorowanie działań przekształcania uruchomionych w różnych usługach obliczeniowych, takich jak Azure Databricks, Azure HDInsight, Azure Machine Learning, Azure SQL Database, SQL Server i inne.
  • Wykonanie pakietów SSIS: natywne wykonywanie pakietów SQL Server Integration Services (SSIS) w zarządzanym środowisku obliczeniowym platformy Azure.

Przy każdym Azure Data Factory tworzone jest domyślne Integration Runtime, które obsługuje operacje na magazynach danych w chmurze i usługach obliczeniowych w sieci publicznej. Można to wyświetlić, gdy środowisko Integration Runtime jest ustawione na automatyczne rozwiązywanie

Typy infrastruktury Integration Runtime

Usługa Data Factory oferuje trzy typy infrastruktury Integration Runtime. Należy wybrać typ najlepiej odpowiadający poszukiwanym możliwościom integracji danych i potrzebom środowiska sieciowego. Te trzy typy to:

  • Azure
  • Samodzielny hosting
  • Azure-SSIS

Możesz jawnie zdefiniować ustawienie Integration Runtime we właściwości connectVia, jeśli nie zostało to zdefiniowane, wówczas domyślny Integration Runtime jest używany z właściwością ustawioną na Auto-Resolve.

W poniższej tabeli opisano możliwości i obsługę sieci dla każdego typu infrastruktury Integration Runtime:

Typ IR Sieć publiczna Sieć prywatna
Azure Data Flow Data movement Activity dispatch (Wysyłanie działania podczas ruchu danych)
Samodzielny hosting Wysyłanie działania w przypadku przemieszczenia danych Wysyłanie działania w przypadku przemieszczenia danych
Azure-SSIS Wykonanie pakietu SSIS Wykonanie pakietu SSIS

Określanie, którego środowiska Integration Runtime użyć

Istnieje szereg czynników, które mają wpływ na Integration Runtime, których będziesz używać. Poniżej przedstawiono przewodnik, który pomoże Ci wybrać odpowiednie ir ir

Działanie kopiowania

W działanie Kopiuj źródła i ujścia połączone usługi definiują kierunek przepływu danych. Poniższa logika jest stosowana do określenia, które wystąpienie środowiska IR jest używane do wykonania kopii:

  • Kopiowanie między dwoma źródłami danych w chmurze: jeśli zarówno połączona usługa źródła, jak i ujścia używają środowiska IR Azure, usługa ADF użyje regionalnego środowiska IR Azure (jeśli zostało określone) lub automatycznie określi lokalizację środowiska IR Azure, jeśli wybrano opcję automatycznego określania środowiska IR, co jest ustawieniem domyślnym. Opisano to w sekcji Lokalizacja środowiska Integration Runtime.

  • Kopiowanie między źródłem danych w chmurze i źródłem danych w sieci prywatnej: jeśli połączona usługa źródła lub ujścia wskazuje środowisko IR (Self-hosted), działanie kopiowania jest wykonywane w tym środowisku IT (Self-hosted).

  • Kopiowanie między dwoma źródłami danych w sieci prywatnej: połączona usługa źródłowa i ujścia musi wskazać to samo wystąpienie środowiska Integration Runtime, a to środowisko Integration Runtime jest używane do wykonania działania kopiowania.

Działanie wyszukiwania i uzyskiwania metadanych

Działanie wyszukiwania i uzyskiwania metadanych jest wykonywane w środowisku Integration Runtime skojarzonym z połączoną usługą magazynu danych.

Działanie przekształcania

Każde działanie przekształcania zawiera docelową obliczeniową usługę połączoną, która wskazuje infrastrukturę Integration Runtime. To wystąpienie infrastruktury Integration Runtime jest miejscem, z którego wysyłane jest działanie przekształcania.

Działanie Flow danych

Działanie Flow danych jest wykonywane w skojarzonym z nim środowisku Integration Runtime.