Usługa Azure OpenAI na danych

Artykuł
04/08/2024

Skorzystaj z tego artykułu, aby dowiedzieć się więcej o usłudze Azure OpenAI On Your Data, co ułatwia deweloperom szybkie łączenie, pozyskiwanie i uziemianie danych przedsiębiorstwa w celu szybkiego tworzenia spersonalizowanych copilots (wersja zapoznawcza). Zwiększa zrozumienie użytkownika, przyspiesza wykonywanie zadań, poprawia wydajność operacyjną i ułatwia podejmowanie decyzji.

Co to jest usługa Azure OpenAI na danych

Usługa Azure OpenAI On Your Data umożliwia uruchamianie zaawansowanych modeli sztucznej inteligencji, takich jak GPT-35-Turbo i GPT-4, na własnych danych przedsiębiorstwa bez konieczności trenowania lub dostosowywania modeli. Możesz rozmawiać na bieżąco z danymi i analizować je z większą dokładnością. Możesz określić źródła, aby obsługiwać odpowiedzi na podstawie najnowszych informacji dostępnych w wyznaczonych źródłach danych. Dostęp do usługi Azure OpenAI On Your Data można uzyskać przy użyciu interfejsu API REST za pośrednictwem zestawu SDK lub interfejsu internetowego w narzędziu Azure OpenAI Studio. Możesz również utworzyć aplikację internetową, która łączy się z danymi, aby włączyć ulepszone rozwiązanie do czatu lub wdrożyć ją bezpośrednio jako copilot w programie Copilot Studio (wersja zapoznawcza).

Rozpocznij

Aby rozpocząć pracę, połącz źródło danych przy użyciu programu Azure OpenAI Studio i zacznij zadawać pytania i rozmawiać na swoich danych.

Uwaga

Aby rozpocząć, musisz już zatwierdzić dostęp do usługi Azure OpenAI i wdrożyć zasób usługi Azure OpenAI Service w obsługiwanym regionie z modelami gpt-35-turbo lub gpt-4.

Kontrola dostępu oparta na rolach (RBAC) platformy Azure do dodawania źródeł danych

Aby w pełni używać usługi Azure OpenAI Na danych, musisz ustawić co najmniej jedną rolę RBAC platformy Azure. Aby uzyskać więcej informacji, zobacz Bezpieczne używanie usługi Azure OpenAI na danych.

Formaty danych i typy plików

Usługa Azure OpenAI On Your Data obsługuje następujące typy plików:

.txt
.md
.html
.docx
.pptx
.pdf

Istnieje limit przekazywania i istnieją pewne zastrzeżenia dotyczące struktury dokumentów i sposobu, w jaki może to mieć wpływ na jakość odpowiedzi z modelu:

Jeśli konwertujesz dane z nieobsługiwanego formatu na obsługiwany format, zoptymalizuj jakość odpowiedzi modelu, zapewniając konwersję:
- Nie prowadzi do znacznej utraty danych.
- Nie dodaje nieoczekiwanego szumu do danych.
Jeśli pliki mają specjalne formatowanie, takie jak tabele i kolumny lub punkty punktorowe, przygotuj dane za pomocą skryptu przygotowywania danych dostępnego w usłudze GitHub.
W przypadku dokumentów i zestawów danych z długim tekstem należy użyć dostępnego skryptu przygotowywania danych. Skrypt fragmentuje dane, aby odpowiedzi modelu były dokładniejsze. Ten skrypt obsługuje również zeskanowane pliki PDF i obrazy.

Obsługiwane źródła danych

Aby przekazać dane, musisz nawiązać połączenie ze źródłem danych. Jeśli chcesz używać danych do rozmowy z modelem usługi Azure OpenAI, dane są podzielone na indeks wyszukiwania, dzięki czemu odpowiednie dane można znaleźć na podstawie zapytań użytkowników.

Zintegrowana baza danych wektorów w usłudze Azure Cosmos DB for MongoDB oparta na rdzeniach wirtualnych natywnie obsługuje integrację z usługą Azure OpenAI On Your Data.

W przypadku niektórych źródeł danych, takich jak przekazywanie plików z komputera lokalnego (wersja zapoznawcza) lub dane zawarte na koncie magazynu obiektów blob (wersja zapoznawcza), jest używana usługa Azure AI Search. Po wybraniu następujących źródeł danych dane są pozyskiwane do indeksu usługi Azure AI Search.

Napiwek

Jeśli używasz usługi Azure Cosmos DB (z wyjątkiem interfejsu API opartego na rdzeniach wirtualnych dla bazy danych MongoDB), możesz kwalifikować się do oferty Azure AI Advantage, która zapewnia równowartość do 6000 USD w środkach na przepływność usługi Azure Cosmos DB.

Źródło danych	opis
Azure AI Search	Użyj istniejącego indeksu usługi Azure AI Search z usługą Azure OpenAI Na danych.
Azure Cosmos DB	Interfejs API usługi Azure Cosmos DB dla bazy danych Postgres i interfejs API oparty na rdzeniach wirtualnych dla bazy danych MongoDB oferuje natywnie zintegrowane indeksowanie wektorów; dlatego nie wymagają usługi Azure AI Search. Jednak jego inne interfejsy API wymagają indeksowania wektorów usługi Azure AI Search. Usługa Azure Cosmos DB dla natywnie zintegrowanej bazy danych wektorów NoSQL debiutuje w połowie 2024 roku.
Przekazywanie plików (wersja zapoznawcza)	Przekaż pliki z komputera lokalnego do przechowywania w bazie danych usługi Azure Blob Storage i pozyskane do usługi Azure AI Search.
Adres URL/adres internetowy (wersja zapoznawcza)	Zawartość internetowa z adresów URL jest przechowywana w usłudze Azure Blob Storage.
Azure Blob Storage (wersja zapoznawcza)	Przekazywanie plików z usługi Azure Blob Storage do pozyskiwania do indeksu usługi Azure AI Search.

Wymagania wstępne

Konto usługi Azure Cosmos DB dla bazy danych MongoDB oparte na rdzeniach wirtualnych
Wdrożony model osadzania

Ograniczenia

Obsługiwana jest tylko oparta na rdzeniach wirtualnych usługa Azure Cosmos DB dla bazy danych MongoDB.
Typ wyszukiwania jest ograniczony do zintegrowanej bazy danych wektorowej w usłudze Azure Cosmos DB dla bazy danych MongoDB z modelem osadzania usługi Azure OpenAI.
Ta implementacja działa najlepiej w przypadku danych nieustrukturyzowanych i przestrzennych.

Przygotowywanie danych

Użyj skryptu udostępnionego w usłudze GitHub , aby przygotować dane.

Mapowanie pól indeksu

Po dodaniu źródła danych usługi Azure Cosmos DB dla bazy danych MongoDB opartej na rdzeniach wirtualnych można określić pola danych, aby prawidłowo mapować dane na potrzeby pobierania.

Dane zawartości (wymagane): co najmniej jedno podane pole, które ma być używane do uziemienia modelu na danych. W przypadku wielu pól rozdziel wartości przecinkami bez spacji.
Nazwa pliku/tytuł/adres URL: służy do wyświetlania dodatkowych informacji podczas odwołowywania się do dokumentu w czacie.
Pola wektorowe (wymagane): wybierz pole w bazie danych zawierające wektory.

Warto rozważyć użycie indeksu usługi Azure AI Search, jeśli chcesz:

Dostosuj proces tworzenia indeksu.
Użyj ponownie indeksu utworzonego wcześniej przez pozyskiwanie danych z innych źródeł danych.

Uwaga

Aby użyć istniejącego indeksu, musi mieć co najmniej jedno pole z możliwością wyszukiwania.

Typy wyszukiwania

Usługa Azure OpenAI On Your Data udostępnia następujące typy wyszukiwania, których można użyć podczas dodawania źródła danych.

Wyszukiwanie słów kluczowych
Wyszukiwanie semantyczne
Wyszukiwanie wektorowe przy użyciu modeli osadzania Ada, dostępne w wybranych regionach

Aby włączyć wyszukiwanie wektorowe, potrzebny jest istniejący model osadzania wdrożony w zasobie usługi Azure OpenAI. Wybierz wdrożenie osadzania podczas łączenia danych, a następnie wybierz jeden z typów wyszukiwania wektorów w obszarze Zarządzanie danymi. Jeśli używasz usługi Azure AI Search jako źródła danych, upewnij się, że w indeksie znajduje się kolumna wektorowa.

Jeśli używasz własnego indeksu , możesz dostosować mapowanie pól podczas dodawania źródła danych w celu zdefiniowania pól, które będą mapowane podczas odpowiadania na pytania. Aby dostosować mapowanie pól, wybierz pozycję Użyj mapowania pól niestandardowych na stronie Źródło danych podczas dodawania źródła danych.

Ważne

Wyszukiwanie semantyczne podlega dodatkowym cenom. Aby włączyć wyszukiwanie semantyczne lub wyszukiwanie wektorów, musisz wybrać jednostkę SKU Podstawowa lub nowsza jednostka SKU . Aby uzyskać więcej informacji, zobacz różnice w warstwie cenowej i limity usług.
Aby poprawić jakość pobierania informacji i odpowiedzi modelu, zalecamy włączenie semantycznego wyszukiwania następujących języków źródła danych: angielski, francuski, hiszpański, portugalski, włoski, niemiecki, chiński (Zh), japoński, koreański, rosyjski i arabski.

Opcja wyszukiwania	Typ pobierania	Dodatkowe ceny?	Świadczenia
Słowa kluczowego	Wyszukiwanie wg słów kluczowych	Brak dodatkowych cen.	Wykonuje szybkie i elastyczne analizowanie zapytań i dopasowywanie w polach z możliwością wyszukiwania, przy użyciu terminów lub fraz w dowolnym obsługiwanym języku z operatorami lub bez nich.
Semantyczne	Wyszukiwanie semantyczne	Dodatkowe ceny użycia wyszukiwania semantycznego.	Poprawia precyzję i istotność wyników wyszukiwania przy użyciu usługi reranker (z modelami sztucznej inteligencji), aby zrozumieć semantyczne znaczenie terminów zapytań i dokumentów zwracanych przez początkowy rangą wyszukiwania
Wektor	Wyszukiwanie wektorowe	Dodatkowe ceny na koncie usługi Azure OpenAI z wywoływania modelu osadzania.	Umożliwia znajdowanie dokumentów, które są podobne do danych wejściowych danego zapytania na podstawie wektorowych osadzania zawartości.
hybryda (wektor + słowo kluczowe)	Hybryda wyszukiwania wektorów i wyszukiwania słów kluczowych	Dodatkowe ceny na koncie usługi Azure OpenAI z wywoływania modelu osadzania.	Wykonuje wyszukiwanie podobieństwa w polach wektorów przy użyciu osadzania wektorów, a także obsługuje elastyczne analizowanie zapytań i wyszukiwanie pełnotekstowe w polach alfanumerycznych przy użyciu zapytań terminowych.
hybrydowe (wektor + słowo kluczowe) + semantyka	Hybryda wyszukiwania wektorowego, wyszukiwania semantycznego i wyszukiwania słów kluczowych.	Dodatkowe ceny na koncie usługi Azure OpenAI z wywoływania modelu osadzania oraz dodatkowe ceny użycia wyszukiwania semantycznego.	Używa osadzania wektorów, interpretacji języka i elastycznego analizowania zapytań, aby tworzyć zaawansowane środowiska wyszukiwania i generujące aplikacje sztucznej inteligencji, które mogą obsługiwać złożone i zróżnicowane scenariusze pobierania informacji.

Wyszukiwanie inteligentne

Usługa Azure OpenAI On Your Data ma włączone inteligentne wyszukiwanie danych. Wyszukiwanie semantyczne jest domyślnie włączone, jeśli zarówno wyszukiwanie semantyczne, jak i wyszukiwanie słów kluczowych. W przypadku osadzania modeli inteligentne wyszukiwanie jest domyślnie włączone do wyszukiwania hybrydowego i semantycznego.

Kontrola dostępu na poziomie dokumentu

Uwaga

Kontrola dostępu na poziomie dokumentu jest obsługiwana podczas wybierania usługi Azure AI Search jako źródła danych.

Usługa Azure OpenAI On Your Data umożliwia ograniczenie dokumentów, które mogą być używane w odpowiedziach dla różnych użytkowników z filtrami zabezpieczeń usługi Azure AI Search. Po włączeniu dostępu na poziomie dokumentu wyniki wyszukiwania zwracane z usługi Azure AI Search i używane do generowania odpowiedzi są przycinane na podstawie członkostwa w grupie Microsoft Entra użytkownika. Aby uzyskać więcej informacji, możesz włączyć dostęp na poziomie dokumentu tylko w istniejących indeksach usługi Azure AI Search. Aby uzyskać więcej informacji, zobacz Bezpieczne używanie usługi Azure OpenAI na danych.

Mapowanie pól indeksu

Jeśli używasz własnego indeksu, zostanie wyświetlony monit w narzędziu Azure OpenAI Studio, aby zdefiniować pola, które mają być mapowane na potrzeby odpowiadania na pytania podczas dodawania źródła danych. Możesz podać wiele pól dla danych zawartości i powinny zawierać wszystkie pola, które mają tekst odnoszący się do twojego przypadku użycia.

W tym przykładzie pola mapowane na dane zawartości i Tytuł zawierają informacje do modelu w celu udzielenia odpowiedzi na pytania. Tytuł jest również używany do tekstu cytatu tytułowego. Pole mapowane na nazwę pliku generuje nazwy cytatów w odpowiedzi.

Poprawne mapowanie tych pól pomaga upewnić się, że model ma lepszą jakość odpowiedzi i cytatów. Dodatkowo można go skonfigurować w interfejsie API przy użyciu parametru fieldsMapping .

Jeśli chcesz zaimplementować dodatkowe kryteria oparte na wartości na potrzeby wykonywania zapytań, możesz skonfigurować filtr wyszukiwania przy użyciu parametru filter w interfejsie API REST.

Jak dane są pozyskiwane do wyszukiwania w usłudze Azure AI

Dane są pozyskiwane do wyszukiwania w usłudze Azure AI przy użyciu następującego procesu:

Zasoby pozyskiwania są tworzone w zasobach usługi Azure AI Search i na koncie usługi Azure Storage. Obecnie te zasoby to: indeksatory, indeksy, źródła danych, niestandardowa umiejętność w zasobie wyszukiwania i kontener (później nazywany kontenerem fragmentów) na koncie usługi Azure Storage. Możesz określić wejściowy kontener usługi Azure Storage przy użyciu programu Azure OpenAI Studio lub interfejsu API pozyskiwania (wersja zapoznawcza).
Dane są odczytywane z kontenera wejściowego, zawartość jest otwierana i podzielona na małe fragmenty z maksymalnie 1024 tokenami. Jeśli wyszukiwanie wektorów jest włączone, usługa oblicza wektor reprezentujący osadzanie na każdym kawałku. Dane wyjściowe tego kroku (nazywane "wstępnie przetworzonymi" lub "fragmentowanymi" danymi) są przechowywane w kontenerze fragmentów utworzonym w poprzednim kroku.
Wstępnie przetworzone dane są ładowane z kontenera fragmentów i indeksowane w indeksie usługi Azure AI Search.

Możesz użyć usługi Azure Blob Storage jako źródła danych, jeśli chcesz nawiązać połączenie z istniejącą usługą Azure Blob Storage i używać plików przechowywanych w kontenerach.

Planowanie automatycznych odświeżeń indeksów

Uwaga

Automatyczne odświeżanie indeksów jest obsługiwane tylko w przypadku usługi Azure Blob Storage.
Jeśli dokument zostanie usunięty z wejściowego kontenera obiektów blob, odpowiednie rekordy indeksu fragmentów nie zostaną usunięte przez zaplanowane odświeżanie.

Aby zapewnić aktualność indeksu usługi Azure AI Search przy użyciu najnowszych danych, możesz zaplanować automatyczne odświeżanie indeksu zamiast ręcznie aktualizować je za każdym razem, gdy dane są aktualizowane. Automatyczne odświeżanie indeksu jest dostępne tylko w przypadku wybrania usługi Azure Blob Storage jako źródła danych. Aby włączyć automatyczne odświeżanie indeksu:

Dodawanie źródła danych przy użyciu programu Azure OpenAI Studio.
W obszarze Wybierz lub dodaj źródło danych wybierz harmonogram indeksatora i wybierz cykl odświeżania, który chcesz zastosować.

Po ustawieniu pozyskiwania danych na wartość inną niż raz indeksatory usługi Azure AI Search zostaną utworzone z harmonogramem równoważnym z 0.5 * the cadence specified. Oznacza to, że w określonym tempie indeksatory będą ściągać, ponownie przetwarzać i indeksowania dokumentów, które zostały dodane lub zmodyfikowane z kontenera magazynu. Ten proces gwarantuje, że zaktualizowane dane są wstępnie przetwarzane i indeksowane w końcowym indeksie w żądanym tempie automatycznie. Aby zaktualizować dane, musisz przekazać tylko dodatkowe dokumenty z witryny Azure Portal. W portalu wybierz pozycję Kontenery kont>magazynu. Wybierz nazwę oryginalnego kontenera, a następnie pozycję Przekaż. Indeks automatycznie pobiera pliki po zaplanowanym okresie odświeżania. Zasoby pośrednie utworzone w zasobie usługi Azure AI Search nie zostaną wyczyszczone po pozyskaniu, aby umożliwić wykonywanie przyszłych przebiegów. Te zasoby to:

{Index Name}-index
{Index Name}-indexer
{Index Name}-indexer-chunk
{Index Name}-datasource
{Index Name}-skillset

Aby zmodyfikować harmonogram, możesz użyć witryny Azure Portal.

Otwieranie strony zasobu wyszukiwania w witrynie Azure Portal
Wybierz pozycję Indeksatory w okienku po lewej stronie
Wykonaj następujące kroki dla dwóch indeksatorów, które mają nazwę indeksu jako prefiks.
1. Wybierz indeksator, aby go otworzyć. Następnie wybierz kartę ustawienia .
2. Zaktualizuj harmonogram do żądanej kadencji z "Harmonogram" lub określ niestandardowy cykl z "Interwał (w minutach)"
3. Wybierz pozycję Zapisz.

Jak dane są pozyskiwane do wyszukiwania w usłudze Azure AI

Dane są pozyskiwane do wyszukiwania w usłudze Azure AI przy użyciu następującego procesu:

Zasoby pozyskiwania są tworzone w zasobach usługi Azure AI Search i na koncie usługi Azure Storage. Obecnie te zasoby to: indeksatory, indeksy, źródła danych, niestandardowa umiejętność w zasobie wyszukiwania i kontener (później nazywany kontenerem fragmentów) na koncie usługi Azure Storage. Możesz określić wejściowy kontener usługi Azure Storage przy użyciu programu Azure OpenAI Studio lub interfejsu API pozyskiwania (wersja zapoznawcza).
Dane są odczytywane z kontenera wejściowego, zawartość jest otwierana i podzielona na małe fragmenty z maksymalnie 1024 tokenami. Jeśli wyszukiwanie wektorów jest włączone, usługa oblicza wektor reprezentujący osadzanie na każdym kawałku. Dane wyjściowe tego kroku (nazywane "wstępnie przetworzonymi" lub "fragmentowanymi" danymi) są przechowywane w kontenerze fragmentów utworzonym w poprzednim kroku.
Wstępnie przetworzone dane są ładowane z kontenera fragmentów i indeksowane w indeksie usługi Azure AI Search.

Możesz wkleić adresy URL, a usługa będzie przechowywać zawartość strony internetowej, używając jej podczas generowania odpowiedzi z modelu. Zawartość w adresach URL/adresach sieci Web, których używasz, musi mieć następującą charakterystykę do prawidłowego pozyskiwania:

Publiczna witryna internetowa, taka jak Używanie danych z usługą Azure OpenAI Service — Azure OpenAI | Microsoft Learn. Nie można dodać adresu URL/adresu internetowego z kontrolą dostępu, na przykład z hasłem.
Witryna internetowa HTTPS.
Rozmiar zawartości w każdym adresie URL jest mniejszy niż 5 MB.
Witrynę internetową można pobrać jako jeden z obsługiwanych typów plików.
Obsługiwana jest tylko jedna warstwa zagnieżdżonych łączy. Na stronie internetowej zostanie pobranych tylko 20 łączy.

Po dodaniu adresu URL/adresu internetowego do pozyskiwania danych strony internetowe z adresu URL są pobierane i zapisywane w usłudze Azure Blob Storage z nazwą kontenera: webpage-<index name>. Każdy adres URL zostanie zapisany w innym kontenerze w ramach konta. Następnie pliki są indeksowane do indeksu usługi Azure AI Search, który jest używany do pobierania podczas rozmowy z modelem.

Możesz nawiązać połączenie z bazą danych wektorów Elasticsearch i porozmawiać z danymi.

Wymagania wstępne

Baza danych Elasticsearch
Model osadzania. Można:
- Używanie istniejącego modelu osadzania usługi Azure OpenAI text-embedding-ada-002 lub
- Korzystanie z własnego modelu osadzania hostowanego w usłudze Elasticsearch.
Przygotuj dane przy użyciu notesu języka Python dostępnego w usłudze GitHub.

Żądanie dostępu

Korzystanie ze źródła danych Elasticsearch to funkcja w wersji zapoznawczej, która podlega warunkom usługi Ograniczony dostęp w warunkach specyficznych dla usługi dla usług Azure AI. Musisz wypełnić i przesłać formularz żądania, aby zażądać dostępu do źródła danych Elasticsearch. Formularz żąda informacji o firmie i scenariuszu, dla którego planujesz używać źródła danych Elasticsearch. Po przesłaniu formularza zespół usług azure AI sprawdzi go i wyśle Ci wiadomość e-mail z decyzją w ciągu 10 dni roboczych.

Połączenie elasticsearch do usługi Azure OpenAI na danych

Skonfiguruj aplikację Elasticsearch i uzyskaj informacje o połączeniu.

Musisz wprowadzić punkt końcowy elasticsearch i zakodowany klucz interfejsu API, aby nawiązać połączenie z bazą danych Elasticsearch. Następnie kliknij pozycję Weryfikuj połączenie.
Wybierz indeks, z którym chcesz nawiązać połączenie.
(opcjonalnie) użyj niestandardowego mapowania pól.

Mapowanie pól można dostosować podczas dodawania źródła danych, aby zdefiniować pola, które będą mapowane podczas odpowiadania na pytania, lub użyć wartości domyślnych.
Wybierz typ wyszukiwania. Usługa Azure OpenAI On Your Data udostępnia następujące typy wyszukiwania, których można użyć podczas dodawania źródła danych.
Kontynuuj przeglądanie wyświetlanych ekranów i wybierz pozycję Zapisz i zamknij.

Typy wyszukiwania

Usługa Azure OpenAI On Your Data udostępnia następujące typy wyszukiwania, których można użyć podczas dodawania źródła danych.

Aby włączyć wyszukiwanie wektorowe, potrzebny jest istniejący model osadzania wdrożony w zasobie usługi Azure OpenAI lub hostowany w usłudze Elasticsearch. Wybierz wdrożenie osadzania podczas łączenia danych, a następnie wybierz jeden z typów wyszukiwania wektorów w obszarze Zarządzanie danymi.

Opcja wyszukiwania	Typ pobierania	Dodatkowe ceny?	Świadczenia
Słowa kluczowego	Wyszukiwanie wg słów kluczowych	Brak dodatkowych cen.	Wykonuje szybkie i elastyczne analizowanie zapytań i dopasowywanie w polach z możliwością wyszukiwania, przy użyciu terminów lub fraz w dowolnym obsługiwanym języku z operatorami lub bez nich.
Wektor	Wyszukiwanie wektorowe	Dodatkowe ceny na koncie usługi Azure OpenAI z wywoływania modelu osadzania.	Umożliwia znajdowanie dokumentów, które są podobne do danych wejściowych danego zapytania na podstawie wektorowych osadzania zawartości.

Mapowanie pól indeksu

Mapowanie pól można dostosować podczas dodawania źródła danych w celu zdefiniowania pól, które będą mapowane podczas odpowiadania na pytania. Aby dostosować mapowanie pól, wybierz pozycję Użyj mapowania pól niestandardowych na stronie Źródło danych podczas dodawania źródła danych. Możesz podać wiele pól dla danych zawartości i powinny zawierać wszystkie pola, które mają tekst odnoszący się do twojego przypadku użycia.

Poprawne mapowanie tych pól pomaga upewnić się, że model ma lepszą jakość odpowiedzi i cytatów. Można to dodatkowo skonfigurować w interfejsie API przy użyciu parametru fields_mapping .

Używanie usługi Elasticsearch jako źródła danych za pośrednictwem interfejsu API

Oprócz korzystania z baz danych Elasticsearch w programie Azure OpenAI Studio można również użyć bazy danych Elasticsearch przy użyciu interfejsu API.

Wdrażanie w aplikacji copilot (wersja zapoznawcza) lub aplikacji internetowej

Po połączeniu usługi Azure OpenAI z danymi możesz wdrożyć je przy użyciu przycisku Wdróż w programie Azure OpenAI Studio.

Dzięki temu można wdrożyć autonomiczną aplikację internetową dla Ciebie i użytkowników w celu interakcji z modelami czatów przy użyciu graficznego interfejsu użytkownika. Aby uzyskać więcej informacji, zobacz Korzystanie z aplikacji internetowej Azure OpenAI.

Możesz również wdrożyć aplikację copilot w programie Copilot Studio (wersja zapoznawcza) bezpośrednio z poziomu programu Azure OpenAI Studio, co umożliwia przenoszenie środowisk konwersacyjnych do różnych kanałów, takich jak: Microsoft Teams, witryny internetowe, dynamics 365 i inne kanały usługi Azure Bot Service. Dzierżawa używana w usłudze Azure OpenAI i Copilot Studio (wersja zapoznawcza) powinna być taka sama. Aby uzyskać więcej informacji, zobacz Use a connection to Azure OpenAI On Your Data (Używanie połączenia z usługą Azure OpenAI w danych).

Uwaga

Wdrażanie w copilot w copilot Studio (wersja zapoznawcza) jest dostępne tylko w regionach USA.

Bezpieczne używanie usługi Azure OpenAI na danych

Usługi Azure OpenAI On Your Data można bezpiecznie używać, chroniąc dane i zasoby za pomocą kontroli dostępu opartej na rolach, sieciach wirtualnych i prywatnych punktach końcowych firmy Microsoft. Można również ograniczyć dokumenty, które mogą być używane w odpowiedziach dla różnych użytkowników z filtrami zabezpieczeń usługi Azure AI Search. Zobacz Bezpieczne używanie usługi Azure OpenAI na danych.

Najlepsze rozwiązania

Skorzystaj z poniższych sekcji, aby dowiedzieć się, jak poprawić jakość odpowiedzi udzielanych przez model.

Parametr pozyskiwania

Gdy dane są pozyskiwane do usługi Azure AI Search, możesz zmodyfikować następujące dodatkowe ustawienia w programie Studio lub interfejsie API pozyskiwania.

Rozmiar fragmentu (wersja zapoznawcza)

Usługa Azure OpenAI On Your Data przetwarza dokumenty, dzieląc je na fragmenty przed ich pozyskiwaniem. Rozmiar fragmentu jest maksymalnym rozmiarem pod względem liczby tokenów dowolnego fragmentu w indeksie wyszukiwania. Rozmiar fragmentu i liczba pobranych dokumentów razem kontrolują, ile informacji (tokenów) jest uwzględnionych w wierszu polecenia wysłanego do modelu. Ogólnie rzecz biorąc, rozmiar fragmentu pomnożony przez liczbę pobranych dokumentów jest całkowitą liczbą tokenów wysyłanych do modelu.

Ustawianie rozmiaru fragmentu dla przypadku użycia

Domyślny rozmiar fragmentu to 1024 tokeny. Jednak biorąc pod uwagę unikatowość danych, można znaleźć inny rozmiar fragmentu (np. 256, 512 lub 1536 tokenów).

Dostosowanie rozmiaru fragmentu może zwiększyć wydajność czatbota. Podczas znajdowania optymalnego rozmiaru fragmentu wymagana jest próba i błąd, zacznij od rozważenia charakteru zestawu danych. Mniejszy rozmiar fragmentu jest ogólnie lepszy w przypadku zestawów danych z bezpośrednimi faktami i mniejszym kontekstem, podczas gdy większy rozmiar fragmentu może być korzystny dla bardziej kontekstowych informacji, choć może to mieć wpływ na wydajność pobierania.

Mały rozmiar fragmentu, taki jak 256, produkuje bardziej szczegółowe fragmenty. Ten rozmiar oznacza również, że model będzie wykorzystywać mniej tokenów do generowania danych wyjściowych (chyba że liczba pobranych dokumentów jest bardzo wysoka), potencjalnie kosztując mniej. Mniejsze fragmenty oznaczają również, że model nie musi przetwarzać i interpretować długich sekcji tekstu, zmniejszając szum i rozpraszanie uwagi. Ten stopień szczegółowości i fokus stanowią jednak potencjalny problem. Ważne informacje mogą nie być jednymi z najważniejszych pobranych fragmentów, zwłaszcza jeśli liczba pobranych dokumentów jest ustawiona na niską wartość, na przykład 3.

Napiwek

Należy pamiętać, że zmiana rozmiaru fragmentu wymaga ponownego pozyskiwania dokumentów, dlatego warto najpierw dostosować parametry środowiska uruchomieniowego, takie jak ścisłość i liczba pobranych dokumentów. Rozważ zmianę rozmiaru fragmentu, jeśli nadal nie otrzymujesz żądanych wyników:

Jeśli napotykasz dużą liczbę odpowiedzi, takich jak "Nie wiem" na pytania z odpowiedziami, które powinny znajdować się w dokumentach, rozważ zmniejszenie rozmiaru fragmentu do 256 lub 512, aby zwiększyć stopień szczegółowości.
Jeśli czatbot udostępnia poprawne szczegóły, ale brakuje innych, co staje się widoczne w cytatach, zwiększenie rozmiaru fragmentu do 1536 może pomóc w przechwyceniu bardziej kontekstowych informacji.

Parametry środowiska uruchomieniowego

Następujące dodatkowe ustawienia można zmodyfikować w sekcji Parametry danych w programie Azure OpenAI Studio i interfejsie API. Nie musisz ponownie pozyskiwać danych podczas aktualizowania tych parametrów.

Nazwa parametru	opis
Ograniczanie odpowiedzi na dane	Ta flaga umożliwia skonfigurowanie podejścia czatbota do obsługi zapytań niepowiązanych ze źródłem danych lub gdy dokumenty wyszukiwania nie są wystarczające dla pełnej odpowiedzi. Gdy to ustawienie jest wyłączone, model uzupełnia swoje odpowiedzi własną wiedzą oprócz dokumentów. Po włączeniu tego ustawienia model próbuje polegać tylko na dokumentach na potrzeby odpowiedzi. Jest `inScope` to parametr w interfejsie API i domyślnie ustawiony na wartość true.
Pobrane dokumenty	Ten parametr jest liczbą całkowitą, którą można ustawić na 3, 5, 10 lub 20, i kontroluje liczbę fragmentów dokumentów dostarczonych do dużego modelu językowego na potrzeby formułowania ostatecznej odpowiedzi. Domyślnie jest ustawiona wartość 5. Proces wyszukiwania może być hałaśliwy, a czasami ze względu na fragmentowanie istotne informacje mogą być rozłożone na wiele fragmentów w indeksie wyszukiwania. Wybranie numeru top-K, na przykład 5, gwarantuje, że model może wyodrębnić odpowiednie informacje, pomimo istotnych ograniczeń wyszukiwania i fragmentowania. Jednak zwiększenie zbyt dużej liczby może potencjalnie rozpraszać model. Ponadto maksymalna liczba dokumentów, które mogą być skutecznie używane, zależy od wersji modelu, ponieważ każdy z nich ma inny rozmiar kontekstu i pojemność do obsługi dokumentów. Jeśli okaże się, że brakuje ważnego kontekstu odpowiedzi, spróbuj zwiększyć ten parametr. Jest `topNDocuments` to parametr w interfejsie API i jest domyślnie 5.
Ścisłość	Określa agresywność systemu w filtrowaniu dokumentów wyszukiwania na podstawie ich wyników podobieństwa. System wysyła zapytania do usługi Azure Search lub innych magazynów dokumentów, a następnie decyduje, które dokumenty mają być zapewniane dużym modelom językowym, na przykład ChatGPT. Filtrowanie nieistotnych dokumentów może znacznie zwiększyć wydajność kompleksowego czatbota. Niektóre dokumenty są wykluczone z wyników top-K, jeśli mają wyniki niskiej podobieństwa przed przekazaniem ich do modelu. Jest to kontrolowane przez wartość całkowitą z zakresu od 1 do 5. Ustawienie tej wartości na 1 oznacza, że system będzie minimalnie filtrować dokumenty na podstawie podobieństwa wyszukiwania do zapytania użytkownika. Z drugiej strony ustawienie 5 wskazuje, że system będzie agresywnie filtrować dokumenty, stosując bardzo wysoki próg podobieństwa. Jeśli okaże się, że czatbot pomija istotne informacje, obniż ścisłość filtru (ustaw wartość bliżej 1), aby uwzględnić więcej dokumentów. Z drugiej strony, jeśli nieistotne dokumenty rozpraszają odpowiedzi, zwiększ próg (ustaw wartość bliżej 5). Jest `strictness` to parametr w interfejsie API i domyślnie ustawiony na 3.

Nie cytowane odwołania

Model może zwracać "TYPE":"UNCITED_REFERENCE" zamiast "TYPE":CONTENT interfejsu API dla dokumentów pobranych ze źródła danych, ale nie uwzględnianych w cytatie. Może to być przydatne do debugowania i można kontrolować to zachowanie, modyfikując ścisłe ipobrane parametry środowiska uruchomieniowego dokumentów opisane powyżej.

Komunikat systemowy

Możesz zdefiniować komunikat systemowy, aby kierować odpowiedzią modelu podczas korzystania z usługi Azure OpenAI On Your Data. Ten komunikat umożliwia dostosowanie odpowiedzi na podstawie wzorca rozszerzonej generacji (RAG) pobierania używanego przez usługę Azure OpenAI On Your Data. Komunikat systemowy jest używany oprócz wewnętrznego monitu podstawowego w celu zapewnienia środowiska. Aby to umożliwić, obcinamy komunikat systemowy po określonej liczbie tokenów , aby upewnić się, że model może odpowiedzieć na pytania przy użyciu danych. Jeśli definiujesz dodatkowe zachowanie na podstawie domyślnego środowiska, upewnij się, że monit systemowy jest szczegółowy i wyjaśnia dokładne oczekiwane dostosowanie.

Po wybraniu pozycji Dodaj zestaw danych możesz użyć sekcji Komunikat systemowy w narzędziu Azure OpenAI Studio lub roleInformationparametru w interfejsie API.

Potencjalne wzorce użycia

Definiowanie roli

Możesz zdefiniować rolę, która ma być asystentem. Jeśli na przykład tworzysz bota pomocy technicznej, możesz dodać "Jesteś asystentem pomocy technicznej ekspertów, który pomaga użytkownikom rozwiązywać nowe problemy".

Definiowanie typu pobieranych danych

Możesz również dodać charakter danych, które udostępniasz asystentowi.

Zdefiniuj temat lub zakres zestawu danych, taki jak "raport finansowy", "dokument akademicki" lub "raport o zdarzeniu". Na przykład w przypadku pomocy technicznej możesz dodać "Odpowiadasz na zapytania przy użyciu informacji z podobnych zdarzeń w pobranych dokumentach".
Jeśli dane mają pewne cechy, możesz dodać te szczegóły do komunikatu systemowego. Jeśli na przykład dokumenty znajdują się w języku japońskim, możesz dodać "Pobierz japońskie dokumenty i należy je uważnie przeczytać w języku japońskim i odpowiedzieć w języku japońskim".
Jeśli dokumenty zawierają dane ustrukturyzowane, takie jak tabele z raportu finansowego, możesz również dodać ten fakt do monitu systemowego. Jeśli na przykład dane zawierają tabele, możesz dodać "Dane są podane w postaci tabel odnoszących się do wyników finansowych i należy przeczytać wiersz tabeli według wiersza, aby wykonać obliczenia, aby odpowiedzieć na pytania użytkownika".

Definiowanie stylu danych wyjściowych

Możesz również zmienić dane wyjściowe modelu, definiując komunikat systemowy. Jeśli na przykład chcesz upewnić się, że asystent odpowiedzi jest w języku francuskim, możesz dodać monit, taki jak "Jesteś asystentem sztucznej inteligencji, który pomaga użytkownikom, którzy rozumieją francuskie informacje. Pytania użytkownika mogą być w języku angielskim lub francuskim. Dokładnie przeczytaj pobrane dokumenty i odpowiedz na nie w języku francuskim. Przetłumacz wiedzę z dokumentów na francuski, aby upewnić się, że wszystkie odpowiedzi są w języku francuskim."

Potwierdzanie zachowania krytycznego

Usługa Azure OpenAI On Your Data działa, wysyłając instrukcje do dużego modelu językowego w postaci monitów o udzielenie odpowiedzi na zapytania użytkowników przy użyciu danych. Jeśli istnieje pewne zachowanie, które ma kluczowe znaczenie dla aplikacji, możesz powtórzyć zachowanie w komunikacie systemowym, aby zwiększyć jego dokładność. Aby na przykład pokierować modelem tylko na odpowiedź z dokumentów, możesz dodać "Odpowiedz tylko przy użyciu pobranych dokumentów i bez korzystania z twojej wiedzy. Wygeneruj cytaty, aby pobrać dokumenty dla każdego oświadczenia w odpowiedzi. Jeśli nie można odpowiedzieć na pytanie użytkownika przy użyciu pobranych dokumentów, wyjaśnij uzasadnienie, dlaczego dokumenty są istotne dla zapytań użytkowników. W każdym razie nie odpowiadaj na własną wiedzę".

Monity inżynieryjne

Istnieje wiele wskazówek w zakresie monitowania inżynieryjnego, które można spróbować poprawić dane wyjściowe. Jednym z przykładów jest monitowanie o łańcuch myśli, w którym można dodać "Pomyślmy krok po kroku o informacjach w pobranych dokumentach, aby odpowiedzieć na zapytania użytkowników. Wyodrębnij odpowiednią wiedzę do zapytań użytkowników z dokumentów krok po kroku i wydziel odpowiedź od wyodrębnionych informacji z odpowiednich dokumentów."

Uwaga

Komunikat systemowy służy do modyfikowania sposobu odpowiadania asystenta GPT na pytanie użytkownika na podstawie pobranej dokumentacji. Nie ma to wpływu na proces pobierania. Jeśli chcesz podać instrukcje dotyczące procesu pobierania, lepiej uwzględnić je w pytaniach. Komunikat systemowy jest tylko wskazówkami. Model może nie być zgodny z każdą określoną instrukcją, ponieważ został zagruntowany pewnymi zachowaniami, takimi jak obiektywność, i unikając kontrowersyjnych stwierdzeń. Może wystąpić nieoczekiwane zachowanie, jeśli komunikat systemowy jest sprzeczny z tymi zachowaniami.

Maksymalna odpowiedź

Ustaw limit liczby tokenów na odpowiedź modelu. Górny limit dla usługi Azure OpenAI na danych wynosi 1500. Jest to odpowiednik ustawienia parametru max_tokens w interfejsie API.

Ograniczanie odpowiedzi na dane

Ta opcja zachęca model do reagowania tylko na dane i jest domyślnie wybierany. Jeśli usuniesz zaznaczenie tej opcji, model może bardziej łatwo zastosować swoją wewnętrzną wiedzę, aby odpowiedzieć. Określ prawidłowy wybór na podstawie przypadku użycia i scenariusza.

Interakcja z modelem

Skorzystaj z poniższych rozwiązań, aby uzyskać najlepsze wyniki podczas rozmowy z modelem.

Historia konwersacji

Przed rozpoczęciem nowej konwersacji (lub zadawaniem pytania, które nie jest związane z poprzednimi), wyczyść historię czatów.
Uzyskanie różnych odpowiedzi na to samo pytanie między pierwszym kolei konwersacyjnym a kolejnymi zakrętami może być oczekiwane, ponieważ historia konwersacji zmienia bieżący stan modelu. Jeśli otrzymasz nieprawidłowe odpowiedzi, zgłoś ją jako usterkę jakości.

Odpowiedź modelu

Jeśli nie masz zadowolenia z odpowiedzi modelu na konkretne pytanie, spróbuj użyć pytania bardziej szczegółowego lub bardziej ogólnego, aby zobaczyć, jak model odpowiada, i odpowiednio przeprojektuj pytanie.
Pokazano, że tworzenie łańcuchów myślowych monitów było skuteczne w uzyskaniu modelu w celu wygenerowania żądanych danych wyjściowych dla złożonych pytań/zadań.

Długość pytania

Unikaj zadawania długich pytań i podziel je na wiele pytań, jeśli to możliwe. Modele GPT mają limity liczby tokenów, które mogą zaakceptować. Limity tokenów są liczone w kierunku: pytanie użytkownika, komunikat systemowy, pobrane dokumenty wyszukiwania (fragmenty), monity wewnętrzne, historia konwersacji (jeśli istnieje) i odpowiedź. Jeśli pytanie przekroczy limit tokenu, zostanie obcięte.

Obsługa wielu języków

Obecnie wyszukiwanie słów kluczowych i wyszukiwanie semantyczne w usłudze Azure OpenAI On Your Data obsługuje zapytania w tym samym języku co dane w indeksie. Jeśli na przykład dane są w języku japońskim, zapytania wejściowe również muszą znajdować się w języku japońskim. W przypadku pobierania dokumentów międzyjęzycznych zalecamy utworzenie indeksu z włączonym wyszukiwaniem wektorowym.
Aby poprawić jakość pobierania informacji i odpowiedzi modelu, zalecamy włączenie semantycznego wyszukiwania następujących języków: angielski, francuski, hiszpański, portugalski, włoski, niemiecki, chiński (Zh), japoński, koreański, rosyjski, arabski
Zalecamy użycie komunikatu systemowego w celu poinformowania modelu, że dane są w innym języku. Na przykład:
*"*Jesteś asystentem sztucznej inteligencji zaprojektowanym w celu ułatwienia użytkownikom wyodrębniania informacji z pobranych dokumentów japońskich. Przed sformułowaniem odpowiedzi należy dokładnie zapoznać się z japońskimi dokumentami. Zapytanie użytkownika będzie znajdować się w języku japońskim i musisz odpowiedź również w języku japońskim".
Jeśli masz dokumenty w wielu językach, zalecamy utworzenie nowego indeksu dla każdego języka i połączenie ich oddzielnie z usługą Azure OpenAI.

Dane przesyłane strumieniowo

Żądanie przesyłania strumieniowego można wysłać przy użyciu parametru stream , co umożliwia wysyłanie i odbieranie danych przyrostowo bez oczekiwania na całą odpowiedź interfejsu API. Może to poprawić wydajność i środowisko użytkownika, szczególnie w przypadku dużych lub dynamicznych danych.

{
    "stream": true,
    "dataSources": [
        {
            "type": "AzureCognitiveSearch",
            "parameters": {
                "endpoint": "'$AZURE_AI_SEARCH_ENDPOINT'",
                "key": "'$AZURE_AI_SEARCH_API_KEY'",
                "indexName": "'$AZURE_AI_SEARCH_INDEX'"
            }
        }
    ],
    "messages": [
        {
            "role": "user",
            "content": "What are the differences between Azure Machine Learning and Azure AI services?"
        }
    ]
}

Historia konwersacji w celu uzyskania lepszych wyników

Podczas rozmowy z modelem udostępnienie historii czatu pomoże modelowi zwrócić wyniki o wyższej jakości. Nie musisz uwzględniać context właściwości komunikatów asystenta w żądaniach interfejsu API w celu uzyskania lepszej jakości odpowiedzi. Zobacz dokumentację referencyjną interfejsu API, aby zapoznać się z przykładami.

Wywoływanie funkcji

Niektóre modele usługi Azure OpenAI umożliwiają definiowanie narzędzi i tool_choice parametrów w celu włączenia wywoływania funkcji. Funkcję wywołującą można skonfigurować za pomocą interfejsu API/chat/completions REST. Jeśli zarówno źródła danych, jak tools i znajdują się w żądaniu, zostaną zastosowane następujące zasady.

Jeśli tool_choice parametr to none, narzędzia są ignorowane, a tylko źródła danych są używane do generowania odpowiedzi.
W przeciwnym razie, jeśli tool_choice nie zostanie określony lub określony jako auto lub obiekt, źródła danych zostaną zignorowane, a odpowiedź będzie zawierać wybraną nazwę funkcji i argumenty, jeśli istnieją. Nawet jeśli model nie zdecyduje się na wybranie żadnej funkcji, źródła danych są nadal ignorowane.

Jeśli powyższe zasady nie spełniają Twoich potrzeb, rozważ inne opcje, na przykład: przepływ monitu lub interfejs API Asystentów.

Szacowanie użycia tokenu dla usługi Azure OpenAI na danych

Usługa Azure OpenAI On Your Data Retrieval Augmented Generation (RAG) wykorzystująca zarówno usługę wyszukiwania (taką jak azure AI Search) i generację (modele Azure OpenAI), aby umożliwić użytkownikom uzyskanie odpowiedzi na pytania na podstawie podanych danych.

W ramach tego potoku RAG istnieją trzy kroki na wysokim poziomie:

Przeformatuj zapytanie użytkownika na listę intencji wyszukiwania. Jest to wykonywane przez wywołanie modelu z monitem zawierającym instrukcje, pytanie użytkownika i historię konwersacji. Wywołajmy ten monit o intencję.
Dla każdej intencji wiele fragmentów dokumentu jest pobieranych z usługi wyszukiwania. Po odfiltrowaniu nieistotnych fragmentów na podstawie określonego przez użytkownika progu ścisłej i ponownego korbowania/agregowania fragmentów na podstawie logiki wewnętrznej wybierana jest określona przez użytkownika liczba fragmentów dokumentu.
Te fragmenty dokumentu wraz z pytaniem użytkownika, historią konwersacji, informacjami o roli i instrukcjami są wysyłane do modelu w celu wygenerowania ostatecznej odpowiedzi modelu. Wywołajmy to w wierszu polecenia generowania.

W sumie do modelu są wykonywane dwa wywołania:

Do przetwarzania intencji: szacowanie tokenu dla monitu o intencję obejmuje te dla pytania użytkownika, historii konwersacji i instrukcje wysyłane do modelu na potrzeby generowania intencji.
W przypadku generowania odpowiedzi: oszacowanie tokenu dla monitu generowania zawiera te dotyczące pytania użytkownika, historii konwersacji, pobranej listy fragmentów dokumentów, informacji o rolach i instrukcji wysłanych do niego na potrzeby generowania.

Model wygenerował tokeny wyjściowe (zarówno intencje, jak i odpowiedź) muszą być brane pod uwagę w celu oszacowania łącznego tokenu. Sumowanie wszystkich czterech kolumn poniżej daje średnie tokeny całkowite używane do generowania odpowiedzi.

Model	Liczba tokenów monitu generacji	Liczba tokenów monitu intencji	Liczba tokenów odpowiedzi	Liczba tokenów intencji
gpt-35-turbo-16k	4297	1366	111	25
gpt-4-0613	3997	1385	118	18
gpt-4-1106-preview	4538	811	119	27
gpt-35-turbo-1106	4854	1372	110	26

Powyższe liczby są oparte na testowaniu zestawu danych z:

Konwersacje z 191 r.
250 pytań
10 średnich tokenów na pytanie
4 konwersacje zamienia się średnio na konwersację

I następujące parametry.

Ustawienie	Wartość
Liczba pobranych dokumentów	5
Ścisłość	3
Rozmiar fragmentu	1024
Czy ograniczyć odpowiedzi na pozyskane dane?	Prawda

Te oszacowania będą się różnić w zależności od wartości ustawionych dla powyższych parametrów. Jeśli na przykład liczba pobranych dokumentów jest ustawiona na 10, a wartość ścisłej wynosi 1, liczba tokenów wzrośnie. Jeśli zwrócone odpowiedzi nie są ograniczone do pozyskanych danych, istnieje mniej instrukcji podanych dla modelu, a liczba tokenów spadnie.

Szacunki zależą również od charakteru zadawanych dokumentów i pytań. Jeśli na przykład pytania są otwarte, odpowiedzi mogą być dłuższe. Podobnie dłuższy komunikat systemowy przyczyni się do dłuższego monitu, który zużywa więcej tokenów, a jeśli historia konwersacji będzie długa, monit będzie dłuższy.

Model	Maksymalna liczba tokenów dla komunikatu systemowego	Maksymalna liczba tokenów dla odpowiedzi modelu
GPT-35-0301	400	1500
GPT-35-0613-16K	1000	3200
GPT-4-0613-8K	400	1500
GPT-4-0613-32K	2000	6400

W powyższej tabeli przedstawiono maksymalną liczbę tokenów, które mogą być używane dla komunikatu systemowego i odpowiedzi modelu. Ponadto następujące elementy używają również tokenów:

Meta monit: jeśli ograniczysz odpowiedzi z modelu do zawartości danych uziemienia (inScope=True w interfejsie API), maksymalna liczba tokenów jest wyższa. W przeciwnym razie (na przykład jeśli inScope=False) wartość maksymalna jest niższa. Ta liczba jest zmienna w zależności od długości tokenu pytania użytkownika i historii konwersacji. To oszacowanie obejmuje monit podstawowy i monit o ponowne zapisywanie zapytań w celu pobrania.
Pytanie użytkownika i historia: zmienna, ale ograniczona do 2000 tokenów.
Pobrane dokumenty (fragmenty): liczba tokenów używanych przez pobrane fragmenty dokumentu zależy od wielu czynników. Górna granica jest liczbą pobranych fragmentów dokumentu pomnożonych przez rozmiar fragmentu. Zostanie on jednak obcięty na podstawie tokenów dostępnych tokenów dla określonego modelu używanego po zliczaniu pozostałych pól.

20% dostępnych tokenów jest zarezerwowanych dla odpowiedzi modelu. Pozostałe 80% dostępnych tokenów obejmuje meta monit, pytanie użytkownika i historię konwersacji oraz komunikat systemowy. Pozostały budżet tokenu jest używany przez fragmenty pobranego dokumentu.

Aby obliczyć liczbę tokenów używanych przez dane wejściowe (na przykład pytanie, komunikat systemowy/informacje o roli), użyj poniższego przykładu kodu.

import tiktoken

class TokenEstimator(object):

    GPT2_TOKENIZER = tiktoken.get_encoding("gpt2")

    def estimate_tokens(self, text: str) -> int:
        return len(self.GPT2_TOKENIZER.encode(text))
      
token_output = TokenEstimator.estimate_tokens(input_text)

Rozwiązywanie problemów

Aby rozwiązać problemy z nieudanymi operacjami, zawsze należy zwrócić uwagę na błędy lub ostrzeżenia określone w odpowiedzi interfejsu API lub w narzędziu Azure OpenAI Studio. Poniżej przedstawiono niektóre typowe błędy i ostrzeżenia:

Zadania pozyskiwania nie powiodły się

Problemy z ograniczeniami przydziału

Nie można utworzyć indeksu o nazwie X w usłudze Y. Przekroczono limit przydziału indeksu dla tej usługi. Najpierw należy usunąć nieużywane indeksy, dodać opóźnienie między żądaniami tworzenia indeksu lub uaktualnić usługę, aby uzyskać wyższe limity.

Przekroczono limit przydziału indeksatora standardowego X dla tej usługi. Obecnie masz indeksatory standardowe X. Najpierw należy usunąć nieużywane indeksatory, zmienić indeksator "executionMode" lub uaktualnić usługę, aby uzyskać wyższe limity.

Rozwiązanie:

Uaktualnij do wyższej warstwy cenowej lub usuń nieużywane zasoby.

Problemy z limitem czasu przetwarzania wstępnego

Nie można wykonać umiejętności, ponieważ żądanie internetowego interfejsu API nie powiodło się

Nie można wykonać umiejętności, ponieważ odpowiedź umiejętności internetowego interfejsu API jest nieprawidłowa

Rozwiązanie:

Podziel dokumenty wejściowe na mniejsze dokumenty i spróbuj ponownie.

Problemy z uprawnieniami

To żądanie nie jest autoryzowane do wykonania tej operacji

Rozwiązanie:

Oznacza to, że konto magazynu nie jest dostępne z podanymi poświadczeniami. W takim przypadku przejrzyj poświadczenia konta magazynu przekazane do interfejsu API i upewnij się, że konto magazynu nie jest ukryte za prywatnym punktem końcowym (jeśli prywatny punkt końcowy nie jest skonfigurowany dla tego zasobu).

Błędy 503 podczas wysyłania zapytań za pomocą usługi Azure AI Search

Każdy komunikat użytkownika może tłumaczyć się na wiele zapytań wyszukiwania, z których wszystkie są wysyłane do zasobu wyszukiwania równolegle. Może to spowodować zachowanie ograniczania przepustowości, gdy liczba replik wyszukiwania i partycji jest niska. Maksymalna liczba zapytań na sekundę, które może obsługiwać pojedyncza partycja i pojedyncza replika, może nie być wystarczająca. W takim przypadku rozważ zwiększenie liczby replik i partycji lub dodanie logiki uśpienia/ponawiania prób w aplikacji. Aby uzyskać więcej informacji, zobacz dokumentację usługi Azure AI Search.

Obsługa regionalnej dostępności i modelu

Możesz użyć usługi Azure OpenAI on Your Data z zasobem usługi Azure OpenAI w następujących regionach:

Australia Wschodnia
Brazylia Południowa
Kanada Wschodnia
East US
Wschodnie stany USA 2
Francja Środkowa
Japonia Wschodnia
Północno-środkowe stany USA
Norwegia Wschodnia
Północna Republika Południowej Afryki
South Central US
Indie Południowe
Szwecja Środkowa
Szwajcaria Północna
Południowe Zjednoczone Królestwo
West Europe
Zachodnie stany USA

Obsługiwane modele

gpt-4 (0314)
gpt-4 (0613)
gpt-4 (0125)
gpt-4-32k (0314)
gpt-4-32k (0613)
gpt-4 (1106-preview)
gpt-35-turbo-16k (0613)
gpt-35-turbo (1106)

Jeśli zasób usługi Azure OpenAI znajduje się w innym regionie, nie będzie można używać usługi Azure OpenAI On Your Data.

Usługa Azure OpenAI na danych

Co to jest usługa Azure OpenAI na danych

Rozpocznij

Kontrola dostępu oparta na rolach (RBAC) platformy Azure do dodawania źródeł danych

Formaty danych i typy plików

Obsługiwane źródła danych

Wymagania wstępne

Ograniczenia

Przygotowywanie danych

Mapowanie pól indeksu

Wdrażanie w aplikacji copilot (wersja zapoznawcza) lub aplikacji internetowej

Bezpieczne używanie usługi Azure OpenAI na danych

Najlepsze rozwiązania

Parametr pozyskiwania

Rozmiar fragmentu (wersja zapoznawcza)

Ustawianie rozmiaru fragmentu dla przypadku użycia

Parametry środowiska uruchomieniowego

Nie cytowane odwołania

Komunikat systemowy

Potencjalne wzorce użycia

Maksymalna odpowiedź

Ograniczanie odpowiedzi na dane

Interakcja z modelem

Dane przesyłane strumieniowo

Historia konwersacji w celu uzyskania lepszych wyników

Wywoływanie funkcji

Szacowanie użycia tokenu dla usługi Azure OpenAI na danych

Rozwiązywanie problemów

Zadania pozyskiwania nie powiodły się

Błędy 503 podczas wysyłania zapytań za pomocą usługi Azure AI Search

Obsługa regionalnej dostępności i modelu

Obsługiwane modele

Następne kroki

Dodatkowe zasoby