Szybki start: ładowanie zbiorcze przy użyciu Synapse Studio

Ładowanie danych jest łatwe za pomocą kreatora ładowania zbiorczego w Synapse Studio. Synapse Studio to funkcja usługi Azure Synapse Analytics. Kreator ładowania zbiorczego przeprowadzi Cię przez proces tworzenia skryptu T-SQL za pomocą instrukcji COPY w celu zbiorczego ładowania danych do dedykowanej puli SQL.

Punkty wejścia do kreatora ładowania zbiorczego

Dane można ładować zbiorczo, klikając prawym przyciskiem myszy następujący obszar w Synapse Studio: plik lub folder z konta usługi Azure Storage dołączonego do obszaru roboczego.

Screenshot that shows right-clicking a file or folder from a storage account.

Wymagania wstępne

  • Kreator generuje instrukcję COPY, która używa przekazywania Azure Active Directory (Azure AD) na potrzeby uwierzytelniania. Użytkownik Azure AD musi mieć dostęp do obszaru roboczego z co najmniej rolą współautora danych obiektu blob Storage dla konta Azure Data Lake Storage Gen2.

  • Jeśli tworzysz nową tabelę do załadowania, musisz mieć wymagane uprawnienia do używania instrukcji COPY i Tworzenie tabeli.

  • Połączona usługa skojarzona z kontem Data Lake Storage Gen2 musi mieć dostęp do pliku lub folderu do załadowania. Jeśli na przykład mechanizm uwierzytelniania połączonej usługi jest tożsamością zarządzaną, tożsamość zarządzana obszaru roboczego musi mieć co najmniej Storage uprawnienia czytelnika danych obiektu blob na koncie magazynu.

  • Jeśli sieć wirtualna jest włączona w obszarze roboczym, upewnij się, że zintegrowane środowisko uruchomieniowe skojarzone z połączonymi usługami konta Data Lake Storage Gen2 dla danych źródłowych i lokalizacji pliku błędów ma włączoną interaktywną funkcję tworzenia. Tworzenie interakcyjne jest wymagane do wykrywania autoschemy, wyświetlania podglądu zawartości pliku źródłowego i przeglądania Data Lake Storage Gen2 kont magazynu w kreatorze.

Kroki

  1. Na panelu Lokalizacja magazynu źródłowego wybierz konto magazynu i plik lub folder, z którego się ładujesz. Kreator automatycznie próbuje wykryć pliki Parquet i rozdzielane pliki tekstowe (CSV), w tym mapowanie pól źródłowych z pliku na odpowiednie docelowe typy danych SQL.

    Screenshot that shows selecting a source location.

  2. Wybierz ustawienia formatu pliku, w tym ustawienia błędu, jeśli podczas procesu ładowania zbiorczego są odrzucane wiersze. Możesz również wybrać pozycję Podgląd danych , aby zobaczyć, jak instrukcja COPY przeanalizuje plik, aby ułatwić skonfigurowanie ustawień formatu pliku. Wybierz pozycję Podgląd danych za każdym razem, gdy zmieniasz ustawienie formatu pliku, aby zobaczyć, jak instrukcja COPY przeanalizuje plik przy użyciu zaktualizowanego ustawienia.

    Screenshot that shows previewing data.

    Uwaga

    • Kreator ładowania zbiorczego nie obsługuje wyświetlania podglądu danych z terminatorami pól wieloznacznych. Po określeniu terminatora pola wieloznakowego kreator wyświetli podgląd danych w jednej kolumnie.
    • Po wybraniu opcji Wywnioskuj nazwy kolumn kreator ładowania zbiorczego przeanalizuje nazwy kolumn z pierwszego wiersza określonego przez pole Pierwszy wiersz . Kreator ładowania zbiorczego FIRSTROW automatycznie zwiększa wartość instrukcji COPY przez 1, aby zignorować ten wiersz nagłówka.
    • Określanie terminatorów wierszy z wieloma znakami jest obsługiwane w instrukcji COPY. Jednak kreator ładowania zbiorczego nie obsługuje go i zgłosi błąd.
  3. Wybierz dedykowaną pulę SQL, której używasz do załadowania, w tym informacje o tym, czy obciążenie będzie dotyczyć istniejącej tabeli, czy nowej tabeli. Screenshot that shows selecting a target location.

  4. Wybierz pozycję Konfiguruj mapowanie kolumn, aby upewnić się, że masz odpowiednie mapowanie kolumn. Nazwy kolumn notatek zostaną wykryte automatycznie po włączeniu wywnioskowanych nazw kolumn. W przypadku nowych tabel konfigurowanie mapowania kolumn ma kluczowe znaczenie dla aktualizowania typów danych kolumn docelowych.

    Screenshot that shows configuring column mapping.

  5. Wybierz pozycję Otwórz skrypt. Skrypt T-SQL jest generowany przy użyciu instrukcji COPY w celu załadowania z magazynu data lake. Screenshot that shows opening the SQL script.

Następne kroki

  • Zapoznaj się z artykułem dotyczącym instrukcji COPY , aby uzyskać więcej informacji na temat możliwości kopiowania.
  • Zapoznaj się z artykułem omówienie ładowania danych , aby uzyskać informacje na temat korzystania z procesu wyodrębniania, przekształcania i ładowania (ETL).