Szybki start: tworzenie zestawu umiejętności w witrynie Azure Portal

Z tego przewodnika Szybki start dowiesz się, jak zestaw umiejętności w usłudze Azure AI Search dodaje optyczne rozpoznawanie znaków (OCR), analizę obrazów, wykrywanie języka, tłumaczenie tekstu i rozpoznawanie jednostek w celu generowania zawartości z możliwością wyszukiwania w indeksie wyszukiwania.

Możesz uruchomić kreatora importu danych w witrynie Azure Portal, aby zastosować umiejętności, które tworzą i przekształcają zawartość tekstową podczas indeksowania. Dane wejściowe to dane pierwotne, zwykle obiekty blob w usłudze Azure Storage. Dane wyjściowe to indeks z możliwością wyszukiwania zawierający tekst obrazu wygenerowany przez sztuczną inteligencję, podpis i jednostki. Wygenerowana zawartość jest wysyłana do zapytań w portalu przy użyciu Eksploratora wyszukiwania.

Aby przygotować, należy utworzyć kilka zasobów i przekazać przykładowe pliki przed uruchomieniem kreatora.

Wymagania wstępne

Przed rozpoczęciem należy spełnić następujące wymagania wstępne:

Uwaga

W tym przewodniku Szybki start używane są usługi Azure AI na potrzeby przekształceń sztucznej inteligencji. Ponieważ obciążenie jest tak małe, usługi azure AI są zakulisowe, aby bezpłatnie przetwarzać do 20 transakcji. To ćwiczenie można wykonać bez konieczności tworzenia zasobu wielosłużeniowego usługi Azure AI.

Konfigurowanie danych

W poniższych krokach skonfiguruj kontener obiektów blob w usłudze Azure Storage do przechowywania heterogenicznych plików zawartości.

  1. Pobierz przykładowe dane składające się z małego zestawu plików różnych typów.

  2. Zaloguj się w witrynie Azure Portal przy użyciu danych konta Azure.

  3. Utwórz konto usługi Azure Storage lub znajdź istniejące konto.

    • Wybierz ten sam region co usługa Azure AI Search, aby uniknąć opłat za przepustowość.

    • Wybierz wartość StorageV2 (ogólnego przeznaczenia w wersji 2).

  4. W witrynie Azure Portal otwórz stronę usługi Azure Storage i utwórz kontener. Możesz użyć domyślnego poziomu dostępu.

  5. W obszarze Kontener wybierz pozycję Przekaż , aby przekazać przykładowe pliki. Zwróć uwagę, że masz szeroką gamę typów zawartości, w tym obrazy i pliki aplikacji, które nie można przeszukiwać pełnotekstowego w ich formatach natywnych.

    Screenshot of source files in Azure Blob Storage.

Teraz możesz przejść do kreatora Importuj dane.

Uruchamianie kreatora importowania danych

  1. Zaloguj się w witrynie Azure Portal przy użyciu danych konta Azure.

  2. Znajdź usługę wyszukiwania i na stronie Przegląd wybierz pozycję Importuj dane na pasku poleceń, aby utworzyć zawartość z możliwością wyszukiwania w czterech krokach.

    Screenshot of the Import data command.

Krok 1. Tworzenie źródła danych

  1. W Połączenie danych wybierz pozycję Azure Blob Storage.

  2. Wybierz istniejące połączenie z kontem magazynu i wybierz utworzony kontener. Podaj nazwę źródła danych i użyj wartości domyślnych dla pozostałych ustawień.

    Screenshot of the data source definition page.

    Przejdź do następnej strony.

Jeśli zostanie wyświetlony komunikat "Błąd podczas wykrywania schematu indeksu ze źródła danych", indeksator obsługujący kreatora nie może nawiązać połączenia ze źródłem danych. Najprawdopodobniej źródło danych ma zabezpieczenia. Wypróbuj następujące rozwiązania, a następnie uruchom ponownie kreatora.

Funkcja zabezpieczeń Rozwiązanie
Zasób wymaga, aby role platformy Azure lub jego klucze dostępu zostały wyłączone Połączenie jako zaufana usługa lub nawiązywanie połączenia przy użyciu tożsamości zarządzanej
Zasób znajduje się za zaporą ip Tworzenie reguły ruchu przychodzącego dla wyszukiwania i witryny Azure Portal
Zasób wymaga połączenia prywatnego punktu końcowego Połączenie za pośrednictwem prywatnego punktu końcowego

Krok 2. Dodawanie umiejętności poznawczych

Następnie skonfiguruj wzbogacanie sztucznej inteligencji w celu wywoływania rozpoznawania znaków OCR, analizy obrazów i przetwarzania języka naturalnego.

  1. W tym przewodniku Szybki start używamy bezpłatnego zasobu usług Azure AI. Przykładowe dane składają się z 14 plików, więc bezpłatne przydzielanie 20 transakcji w usługach azure AI jest wystarczające na potrzeby tego przewodnika Szybki start.

    Screenshot of the Attach Azure AI services tab.

  2. Rozwiń węzeł Dodaj wzbogacania i wybierz sześć opcji.

    Włącz funkcję OCR, aby dodać umiejętności analizy obrazów do strony kreatora.

    Wybierz pozycję Rozpoznawanie jednostek (osoby, organizacje, lokalizacje) i umiejętności analizy obrazów (tagi, podpis).

    Screenshot of the skillset definition page.

    Przejdź do następnej strony.

Krok 3. Konfigurowanie indeksu

Indeks zawiera zawartość z możliwością wyszukiwania, a kreator importu danych zazwyczaj może utworzyć schemat przez próbkowanie źródła danych. W tym kroku przejrzyj wygenerowany schemat i potencjalnie popraw wszystkie ustawienia.

W przypadku tego przewodnika Szybki start kreator wykonuje dobrą pracę, ustawiając rozsądne wartości domyślne:

  • Pola domyślne są oparte na właściwościach metadanych istniejących obiektów blob oraz nowych polach dla danych wyjściowych wzbogacania (na przykład people, , organizations). locations Typy danych są wnioskowane z metadanych i próbkowania danych.

  • Domyślny klucz dokumentu jest metadata_storage_path (wybrany, ponieważ pole zawiera unikatowe wartości).

  • Atrybuty domyślne są możliwe do pobrania i można wyszukiwać. Funkcja wyszukiwania umożliwia wyszukiwanie pełnotekstowe w polu. Pobieranie oznacza, że wartości pól mogą być zwracane w wynikach. W kreatorze przyjęto założenie, że chcesz, aby te pola oferowały możliwości pobierania i wyszukiwania, ponieważ zostały utworzone za pośrednictwem zestawu umiejętności. Wybierz pozycję Filtrowalne , jeśli chcesz użyć pól w wyrażeniu filtru.

    Screenshot of the index definition page.

Oznaczanie pola jako Możliwe do pobrania nie oznacza, że pole musi być obecne w wynikach wyszukiwania. Kompozycję wyników wyszukiwania można kontrolować przy użyciu parametru zapytania select , aby określić pola do uwzględnienia.

Przejdź do następnej strony.

Krok 4. Konfigurowanie indeksatora

Indeksator kieruje procesem indeksowania. Określa on nazwę źródła danych, docelowy indeks oraz częstotliwość wykonywania. Kreator importu danych tworzy kilka obiektów, w tym indeksator, który można zresetować i uruchomić wielokrotnie.

  1. Na stronie Indeksator zaakceptuj nazwę domyślną i wybierz pozycję Raz.

    Screenshot of the indexer definition page.

  2. Wybierz pozycję Prześlij , aby utworzyć i jednocześnie uruchomić indeksator.

Monitoruj stan

Wybierz pozycję Indeksatory w okienku nawigacji po lewej stronie, aby monitorować stan, a następnie wybierz indeksator. Indeksowanie oparte na umiejętnościach trwa dłużej niż indeksowanie oparte na tekście, zwłaszcza OCR i analiza obrazów.

Screenshot of the indexer status page.

Aby wyświetlić szczegółowe informacje o stanie wykonania, wybierz pozycję Powodzenie (lub Niepowodzenie), aby wyświetlić szczegóły wykonania.

W tym pokazie jest kilka ostrzeżeń: "Could not execute skill because one or more skill input was invalid." informuje o tym, że plik PNG w źródle danych nie dostarcza tekstu wejściowego do rozpoznawania jednostek. To ostrzeżenie występuje, ponieważ nadrzędna umiejętność rozpoznawania OCR nie rozpoznała żadnego tekstu na obrazie i w związku z tym nie mogła dostarczyć danych wejściowych tekstu do umiejętności rozpoznawania jednostek podrzędnych.

Ostrzeżenia są typowe w wykonywaniu zestawu umiejętności. Gdy zapoznasz się ze sposobem iteracji umiejętności na danych, możesz zacząć zauważać wzorce i uczyć się, które ostrzeżenia są bezpieczne do ignorowania.

Zapytanie w Eksploratorze wyszukiwania

Po utworzeniu indeksu użyj Eksploratora wyszukiwania, aby zwrócić wyniki.

  1. Po lewej stronie wybierz pozycję Indeksy , a następnie wybierz indeks. Eksplorator wyszukiwania znajduje się na pierwszej karcie.

  2. Wprowadź ciąg wyszukiwania, aby wykonać zapytanie względem indeksu, np. satya nadella. Pasek wyszukiwania akceptuje słowa kluczowe, frazy ujęte w cudzysłów i operatory ("Satya Nadella" +"Bill Gates" +"Steve Ballmer").

Wyniki są zwracane jako pełny kod JSON, który może być trudny do odczytania, szczególnie w dużych dokumentach. Oto kilka wskazówek dotyczących wyszukiwania w tym narzędziu:

  • Przejdź do widoku JSON, aby określić parametry, które kształtuje wyniki.

  • Dodaj select , aby ograniczyć pola w wynikach.

  • Dodaj count , aby wyświetlić liczbę dopasowań.

  • Użyj klawiszy CTRL-F, aby wyszukać określone właściwości lub terminy w formacie JSON.

    Screenshot of the Search explorer page.

Oto niektóre dane JSON, które można wkleić do widoku:

{
"search": "\"Satya Nadella\" +\"Bill Gates\" +\"Steve Ballmer\"",
"count": true,
"select": "content, people"
}

Napiwek

W ciągach zapytania jest rozróżniana wielkość liter, więc jeśli zostanie wyświetlony komunikat "nieznane pole", sprawdź pola lub definicję indeksu (JSON), aby zweryfikować nazwę i wielkość liter.

Wnioski

Udało Ci się utworzyć swój pierwszy zestaw umiejętności i poznać podstawowe kroki indeksowania opartego na umiejętnościach.

Niektóre kluczowe pojęcia, które mamy nadzieję, że zostały wybrane, obejmują zależności. Zestaw umiejętności jest powiązany z indeksatorem, a indeksatory to platforma Azure i specyficzne dla źródła. Mimo że ten przewodnik Szybki start korzysta z usługi Azure Blob Storage, możliwe są inne źródła danych platformy Azure. Aby uzyskać więcej informacji, zobacz Indeksatory w usłudze Azure AI Search.

Innym ważnym pojęciem jest to, że umiejętności działają nad typami zawartości, a podczas pracy z heterogeniczną zawartością niektóre dane wejściowe są pomijane. Ponadto duże pliki lub pola mogą przekraczać limity indeksatora warstwy usługi. Normalne jest, aby zobaczyć ostrzeżenia, gdy wystąpią te zdarzenia.

Dane wyjściowe są kierowane do indeksu wyszukiwania i istnieje mapowanie między parami name-value utworzonymi podczas indeksowania i poszczególnych pól w indeksie. Wewnętrznie kreator konfiguruje drzewo wzbogacania i definiuje zestaw umiejętności, ustanawiając kolejność operacji i ogólny przepływ. Te kroki są ukryte w kreatorze, ale po rozpoczęciu pisania kodu te pojęcia stają się ważne.

Na koniec wiesz już, że można zweryfikować zawartość, wykonując zapytanie względem indeksu. W końcu usługa Azure AI Search udostępnia indeks z możliwością wyszukiwania, który można wykonywać zapytania przy użyciu prostej lub w pełni rozszerzonej składni zapytań. Indeks zawierający wzbogacone pola jest taki sam, jak każdy inny. Jeśli chcesz uwzględnić standardowe lub niestandardowe analizatory, profile oceniania, synonimy, nawigację aspektową, wyszukiwanie geograficzne lub dowolną inną funkcję usługi Azure AI Search, z pewnością możesz to zrobić.

Czyszczenie zasobów

Jeśli pracujesz w ramach własnej subskrypcji, dobrym pomysłem po zakończeniu projektu jest sprawdzenie, czy dalej potrzebujesz utworzonych zasobów. Uruchomione zasoby mogą generować koszty. Zasoby możesz usuwać pojedynczo lub jako grupę zasobów, usuwając cały zestaw zasobów.

Zasoby można znaleźć w portalu i zarządzać nimi, korzystając z linku Wszystkie zasoby lub Grupy zasobów w okienku nawigacji po lewej stronie.

Jeśli używasz bezpłatnej usługi, pamiętaj, że masz ograniczenie do trzech indeksów, indeksatorów i źródeł danych. Możesz usunąć poszczególne elementy w portalu, aby pozostać w limicie.

Następne kroki

Zestawy umiejętności można tworzyć przy użyciu portalu, zestawu SDK platformy .NET lub interfejsu API REST. Aby uzyskać dalszą wiedzę, wypróbuj interfejs API REST przy użyciu klienta REST i więcej przykładowych danych.