Co nowego w usłudze Azure OpenAI Service

Artykuł
05/13/2024

Ten artykuł zawiera podsumowanie najnowszych wersji i najważniejszych aktualizacji dokumentacji dla usługi Azure OpenAI.

Maj 2024 r.

Model GPT-4o w wersji zapoznawczej dostępny na potrzeby wczesnego dostępu

GPT-4o ("o is for "omni") to najnowszy model w wersji zapoznawczej firmy OpenAI uruchomiony 13 maja 2024 r.

GPT-4o integruje tekst i obrazy w jednym modelu, umożliwiając mu obsługę wielu typów danych jednocześnie. Takie wielomodalne podejście zwiększa dokładność i szybkość reakcji w interakcjach komputerów ludzkich.
GPT-4o pasuje do GPT-4 Turbo w języku angielskim i zadaniach kodowania, oferując lepszą wydajność w językach innych niż angielski i w zadaniach przetwarzania obrazów, ustawiając nowe testy porównawcze dla możliwości sztucznej inteligencji.

Aby rozpocząć testowanie modelu dzisiaj, zobacz plac zabaw z wczesnym dostępem do usługi Azure OpenAI Studio.

Ogólna dostępność modelu GPT-4 Turbo

Najnowsza wersja GA GPT-4 Turbo to:

gpt-4Wersja:turbo-2024-04-09

Jest to zamiennik następujących modeli w wersji zapoznawczej:

gpt-4Wersja:1106-Preview
gpt-4Wersja:0125-Preview
gpt-4Wersja:vision-preview

Różnice między modelami OpenAI i Azure OpenAI GPT-4 Turbo GA

Wersja najnowszego 0409 modelu turbo openAI obsługuje tryb JSON i funkcję wywołującą wszystkie żądania wnioskowania.
Wersja najnowszej wersji turbo-2024-04-09 usługi Azure OpenAI obecnie nie obsługuje korzystania z trybu JSON i wywoływania funkcji podczas wprowadzania żądań wnioskowania przy użyciu danych wejściowych obrazu (vision). Żądania wejściowe oparte na tekście (żądania bez image_url obrazów wbudowanych i wbudowanych) obsługują tryb JSON i wywoływanie funkcji.

Różnice w porównaniu z interfejsem gpt-4 vision-preview

Integracja funkcji przetwarzania obrazów specyficznych dla sztucznej inteligencji platformy Azure z funkcją GPT-4 Turbo z usługą Vision nie jest obsługiwana w przypadku wersji gpt-4:turbo-2024-04-09. Obejmuje to optyczne rozpoznawanie znaków (OCR), uziemanie obiektów, monity wideo i ulepszoną obsługę danych za pomocą obrazów.

Dostępność zarządzana zaaprowizowana przez GPT-4 Turbo

gpt-4Wersja:turbo-2024-04-09 jest dostępna zarówno dla wdrożeń standardowych, jak i aprowizowania. Obecnie aprowizowana wersja tego modelu nie obsługuje żądań wnioskowania obrazów/obrazów. Aprowidowane wdrożenia tego modelu akceptują tylko wprowadzanie tekstu. Wdrożenia modelu w warstwie Standardowa akceptują żądania wnioskowania tekstu i obrazu/obrazów.

Dostępność w regionach

Aby uzyskać informacje na temat dostępności regionalnej modelu, zapoznaj się z macierzą modeli dla wdrożeń standardowych i aprowizowania.

Wdrażanie GPT-4 Turbo z usługą Vision GA

Aby wdrożyć model ga z poziomu interfejsu użytkownika programu Studio, wybierz GPT-4 pozycję, a następnie wybierz turbo-2024-04-09 wersję z menu rozwijanego. Domyślny limit przydziału gpt-4-turbo-2024-04-09 dla modelu będzie taki sam jak bieżący limit przydziału dla GPT-4-Turbo. Zobacz regionalne limity przydziału.

Kwiecień 2024 r.

Dostrajanie jest teraz obsługiwane w dwóch nowych regionach Wschodnie stany USA 2 i Szwajcaria Zachodnia

Dostrajanie jest teraz dostępne z obsługą:

Wschodnie stany USA 2

gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Szwajcaria Zachodnia

babbage-002
davinci-002
gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Sprawdź stronę modeli, aby uzyskać najnowsze informacje na temat dostępności modelu i obsługi dostrajania w każdym regionie.

Przykłady trenowania czatu wieloetkowego

Dostrajanie obsługuje teraz przykłady trenowania czatów wieloestrojowych.

GPT-4 (0125) jest dostępny dla usługi Azure OpenAI On Your Data

Teraz możesz użyć modelu GPT-4 (0125) w dostępnych regionach za pomocą usługi Azure OpenAI On Your Data.

Marzec 2024 r.

Monitorowanie zagrożeń i Sejf ty w usłudze Azure OpenAI Studio

Usługa Azure OpenAI Studio udostępnia teraz pulpit nawigacyjny Ryzyka i Sejf ty dla każdego wdrożenia, które korzystają z konfiguracji filtru zawartości. Służy do sprawdzania wyników działania filtrowania. Następnie możesz dostosować konfigurację filtru, aby lepiej zaspokoić potrzeby biznesowe i spełnić zasady odpowiedzialnej sztucznej inteligencji.

Korzystanie z monitorowania zagrożeń i Sejf ty

Aktualizacje danych w usłudze Azure OpenAI

Teraz możesz nawiązać połączenie z bazą danych wektorów Elasticsearch, która będzie używana z usługą Azure OpenAI Na danych.
Parametr rozmiaru fragmentu można użyć podczas pozyskiwania danych, aby ustawić maksymalną liczbę tokenów dowolnego fragmentu danych w indeksie.

Interfejs API ogólnie dostępnej wersji 2024-02-01

Jest to najnowsza wersja interfejsu API ogólnie dostępnego i jest zamiennikiem poprzedniej 2023-05-15 wersji ogólnie dostępnej. W tej wersji dodano obsługę najnowszych funkcji ga usługi Azure OpenAI, takich jak Whisper, DALLE-3, dostrajanie, na danych itp.

Funkcje, które są nadal dostępne w wersji zapoznawczej, takie jak Asystenci, zamiana tekstu na mowę (TTS), pewne na źródłach danych, nadal wymagają wersji zapoznawczej interfejsu API. Aby uzyskać więcej informacji, zapoznaj się z naszym przewodnikiem cyklu życia wersji interfejsu API.

Szept — ogólna dostępność

Model szeptu mowy do tekstu jest teraz ogólnie dostępny zarówno dla architektury REST, jak i języka Python. Zestawy SDK biblioteki klienta są obecnie nadal dostępne w publicznej wersji zapoznawczej.

Wypróbuj szept, postępując zgodnie z przewodnikiem Szybki start.

Ogólna dostępność języka DALL-E 3

Model generowania obrazów DALL-E 3 jest teraz ogólnie dostępny zarówno dla architektury REST, jak i języka Python. Zestawy SDK biblioteki klienta są obecnie nadal dostępne w publicznej wersji zapoznawczej.

Wypróbuj platformę DALL-E 3, korzystając z przewodnika Szybki start.

Nowe regionalne wsparcie dla daLL-E 3

Teraz możesz uzyskać dostęp do języka DALL-E 3 za pomocą zasobu usługi Azure OpenAI w East US regionie lub AustraliaEast platformy Azure, a także .SwedenCentral

Wycofywanie i wycofywanie modeli

Dodaliśmy stronę do śledzenia wycofywania i wycofywania modeli w usłudze Azure OpenAI Service. Ta strona zawiera informacje o modelach, które są obecnie dostępne, przestarzałe i wycofane.

Interfejs API 2024-03-01-preview wydany

2024-03-01-preview Ma wszystkie te same funkcje co 2024-02-15-preview i dodaje dwa nowe parametry do osadzania:

encoding_format Umożliwia określenie formatu generowania osadzeń w elemecie floatlub base64. Wartość domyślna to float.
dimensions Umożliwia ustawienie liczby osadzonych danych wyjściowych. Ten parametr jest obsługiwany tylko w przypadku modeli osadzania nowej generacji trzeciej generacji: text-embedding-3-large, text-embedding-3-small. Zazwyczaj większe osadzanie jest droższe z perspektywy zasobów obliczeniowych, pamięci i magazynu. Możliwość dostosowania liczby wymiarów umożliwia większą kontrolę nad ogólnym kosztem i wydajnością. Parametr dimensions nie jest obsługiwany we wszystkich wersjach biblioteki języka Python OpenAI 1.x, aby skorzystać z tego parametru, zalecamy uaktualnienie do najnowszej wersji: pip install openai --upgrade.

Jeśli obecnie używasz wersji zapoznawczej interfejsu API do korzystania z najnowszych funkcji, zalecamy zapoznanie się z artykułem dotyczącym cyklu życia wersji interfejsu API, aby śledzić, jak długo będzie obsługiwana bieżąca wersja interfejsu API.

Aktualizacja do planów uaktualniania GPT-4-1106-Preview

Uaktualnienie gpt-4 wdrożenia wersji 1106-Preview do gpt-4 wersji 0125-Preview zaplanowanej na 8 marca 2024 r. nie jest już planowane. gpt-4 Wdrożenia wersji 1106-Preview i 0125-Preview ustawione na wartość "Automatyczna aktualizacja do wartości domyślnej" i "Uaktualnienie po wygaśnięciu" rozpocznie się uaktualnianie po wydaniu stabilnej wersji modelu.

Aby uzyskać więcej informacji na temat procesu uaktualniania, zapoznaj się ze stroną modeli.

Luty 2024 r.

Dostępny model GPT-3.5-turbo-0125

Ten model ma różne ulepszenia, w tym większą dokładność odpowiedzi w żądanych formatach i poprawkę dla usterki, która spowodowała problem z kodowaniem tekstu w przypadku wywołań funkcji języka innego niż angielski.

Aby uzyskać informacje na temat dostępności regionalnej i uaktualnień modelu, zapoznaj się ze stroną modeli.

Dostępne modele osadzania trzeciej generacji

text-embedding-3-large
text-embedding-3-small

Podczas testowania raporty OpenAI zarówno duże, jak i małe modele osadzania trzeciej generacji oferują lepszą średnią wydajność pobierania w wielu językach z testem porównawczym MIRACL , zachowując jednocześnie lepszą wydajność dla zadań angielskich z testem porównawczym MTEB niż model osadzania tekstu drugiej generacji ada-002.

Aby uzyskać informacje na temat dostępności regionalnej i uaktualnień modelu, zapoznaj się ze stroną modeli.

Konsolidacja przydziałów GPT-3.5 Turbo

Aby uprościć migrację między różnymi wersjami modeli GPT-3.5-Turbo (w tym 16 tys.), skonsolidujemy wszystkie limity przydziału GPT-3.5-Turbo z pojedynczą wartością przydziału.

Wszyscy klienci, którzy zatwierdzili zwiększony limit przydziału, będą mieli łączny łączny limit przydziału, który odzwierciedla poprzednie wzrosty.
Każdy klient, którego bieżące całkowite użycie w wersjach modelu jest mniejsze niż domyślne, domyślnie otrzyma nowy łączny łączny limit przydziału.

Dostępny model GPT-4-0125-preview

Wersja gpt-40125-preview modelu jest teraz dostępna w usłudze Azure OpenAI Service w regionach Wschodnie stany USA, Północno-środkowe stany USA i Południowo-środkowe stany USA. Klienci z wdrożeniami gpt-4 wersji 1106-preview zostaną automatycznie uaktualnioni do 0125-preview wersji w najbliższych tygodniach.

Aby uzyskać informacje na temat dostępności regionalnej i uaktualnień modelu, zapoznaj się ze stroną modeli.

Publiczna wersja zapoznawcza interfejsu API asystentów

Usługa Azure OpenAI obsługuje teraz interfejs API, który obsługuje grupy openAI. Asystenci usługi Azure OpenAI (wersja zapoznawcza) umożliwiają tworzenie asystentów sztucznej inteligencji dostosowanych do potrzeb za pomocą niestandardowych instrukcji i zaawansowanych narzędzi, takich jak interpreter kodu i funkcje niestandardowe. Aby dowiedzieć się więcej, zobacz:

OpenAI text to speech voices public preview (Publiczna wersja zapoznawcza tekstu openAI na głosy mowy)

Usługa Azure OpenAI Obsługuje teraz interfejsy API zamiany tekstu na mowę za pomocą głosów interfejsów OpenAI. Pobierz mowę wygenerowaną przez sztuczną inteligencję na podstawie podanego tekstu. Aby dowiedzieć się więcej, zapoznaj się z przewodnikiem przeglądu i wypróbuj przewodnik Szybki start.

Uwaga

Usługa Azure AI Speech obsługuje również tekst OpenAI na głosy mowy. Aby dowiedzieć się więcej, zobacz OpenAI text to speech voices via Azure OpenAI Service or via Azure AI Speech guide (Przewodnik po zamianie mowy za pośrednictwem usługi Azure OpenAI Lub Azure AI Speech ).

Nowe możliwości dostosowywania i obsługa modeli

Nowa regionalna obsługa usługi Azure OpenAI on Your Data

Teraz możesz używać usługi Azure OpenAI On Your Data w następującym regionie świadczenia usługi Azure:

Północna Republika Południowej Afryki

Ogólna dostępność usługi Azure OpenAI w danych

Usługa Azure OpenAI w danych jest teraz ogólnie dostępna.

Grudzień 2023 r.

Usługa Azure OpenAI na danych

Pełna obsługa sieci VPN i prywatnego punktu końcowego dla usługi Azure OpenAI On Your Data, w tym obsługa zabezpieczeń kont magazynu, zasobów usługi Azure OpenAI i zasobów usługi Azure AI usługa wyszukiwania.
Nowy artykuł dotyczący bezpiecznego używania usługi Azure OpenAI On Your Data przez ochronę danych za pomocą sieci wirtualnych i prywatnych punktów końcowych.

GPT-4 Turbo z usługą Vision jest teraz dostępna

Usługa GPT-4 Turbo z usługą Vision w usłudze Azure OpenAI jest teraz dostępna w publicznej wersji zapoznawczej. GPT-4 Turbo with Vision to duży model wielomodalny (LMM) opracowany przez openAI, który może analizować obrazy i dostarczać tekstowe odpowiedzi na pytania dotyczące nich. Obejmuje zarówno przetwarzanie języka naturalnego, jak i zrozumienie wizualne. W trybie rozszerzonym możesz użyć funkcji usługi Azure AI Vision , aby wygenerować dodatkowe szczegółowe informacje na podstawie obrazów.

Poznaj możliwości biblioteki GPT-4 Turbo z funkcją Vision w środowisku bez kodu, korzystając z platformy Azure OpenAI Playground. Dowiedz się więcej w przewodniku Szybki start.
Ulepszenia przetwarzania obrazów przy użyciu biblioteki GPT-4 Turbo z funkcją Vision są teraz dostępne w środowisku Azure OpenAI Playground i obejmują obsługę optycznego rozpoznawania znaków, uziemienia obiektów, obsługi obrazów dla "dodawania danych" i obsługi monitów wideo.
Wykonywać wywołania interfejsu API czatu bezpośrednio przy użyciu interfejsu API REST.
Dostępność regionów jest obecnie ograniczona do SwitzerlandNorth, , SwedenCentralWestUSiAustraliaEast
Dowiedz się więcej o znanych ograniczeniach GPT-4 Turbo z usługą Vision i innymi często zadawanymi pytaniami.

Listopad 2023

Obsługa nowych źródeł danych w usłudze Azure OpenAI na danych

Teraz możesz używać usługi Azure Cosmos DB dla rdzeni wirtualnych bazy danych MongoDB, a także adresów URL/adresów internetowych jako źródeł danych, aby pozyskiwać dane i rozmawiać z obsługiwanym modelem usługi Azure OpenAI.

GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 wydany

Oba modele to najnowsza wersja interfejsu OpenAI z ulepszonymi instrukcjami, następującymi instrukcjami: trybem JSON, odtwarzalnymi danymi wyjściowymi i wywoływaniem funkcji równoległych.

GPT-4 Turbo Preview ma maksymalne okno kontekstowe 128 000 tokenów i może wygenerować 4096 tokenów wyjściowych. Ma najnowsze dane szkoleniowe z wiedzą do kwietnia 2023 r. Ten model jest w wersji zapoznawczej i nie jest zalecany do użytku produkcyjnego. Wszystkie wdrożenia tego modelu w wersji zapoznawczej zostaną automatycznie zaktualizowane po udostępnieniu stabilnej wersji.
GPT-3.5-Turbo-1106 ma maksymalne okno kontekstowe 16 385 tokenów i może wygenerować 4096 tokenów wyjściowych.

Aby uzyskać informacje na temat dostępności regionalnej modelu, zapoznaj się ze stroną modeli.

Modele mają własne unikatowe przydziały przydziału dla regionu.

Publiczna wersja zapoznawcza DALL-E 3

DALL-E 3 to najnowszy model generowania obrazów z platformy OpenAI. Oferuje on ulepszoną jakość obrazu, bardziej złożone sceny i lepszą wydajność podczas renderowania tekstu na obrazach. Oferuje również więcej opcji współczynnika proporcji. Język DALL-E 3 jest dostępny za pośrednictwem programu OpenAI Studio i interfejsu API REST. Zasób OpenAI musi znajdować się w SwedenCentral regionie świadczenia usługi Azure.

Język DALL-E 3 zawiera wbudowane ponowne zapisywanie monitów w celu ulepszenia obrazów, zmniejszenia stronniczości i zwiększenia zmienności naturalnej.

Wypróbuj platformę DALL-E 3, korzystając z przewodnika Szybki start.

Odpowiedzialne AI

Rozszerzona możliwość konfigurowania klientów: wszyscy klienci usługi Azure OpenAI mogą teraz konfigurować wszystkie poziomy ważności (niski, średni, wysoki) dla kategorii nienawiści, przemocy, przemocy, seksualnej i samookaleczenia, w tym filtrowania tylko zawartości o wysokiej ważności. Konfigurowanie filtrów zawartości
Poświadczenia zawartości we wszystkich modelach DALL-E: obrazy generowane przez sztuczną inteligencję ze wszystkich modeli DALL-E zawierają teraz poświadczenia cyfrowe, które ujawniają zawartość wygenerowaną przez sztuczną inteligencję. Aplikacje, które wyświetlają zasoby obrazów, mogą korzystać z zestawu SDK inicjatywy content authenticity typu open source do wyświetlania poświadczeń w wygenerowanych obrazach sztucznej inteligencji. Poświadczenia zawartości w usłudze Azure OpenAI
Nowe modele RAI
- Wykrywanie ryzyka jailbreaku: Ataki zabezpieczeń systemu to monity użytkowników mające na celu sprowokowanie modelu generowania sztucznej inteligencji do wykazywania zachowań, które zostały wytrenowane w celu uniknięcia lub przerwania reguł ustawionych w komunikacie systemowym. Model wykrywania ryzyka zabezpieczeń systemu jailbreak jest opcjonalny (domyślnie wyłączony) i dostępny w modelu dodawania adnotacji i filtrowania. Jest on uruchamiany w monitach użytkownika.
- Tekst chronionych materiałów: tekst chroniony materiału opisuje znaną zawartość tekstową (na przykład teksty piosenek, artykuły, przepisy i wybraną zawartość internetową), którą można wydawać za pomocą dużych modeli językowych. Chroniony model tekstu materiału jest opcjonalny (domyślnie wyłączony) i dostępny w modelu dodawania adnotacji i filtrowania. Działa on po zakończeniu llM.
- Kod chronionych materiałów: Kod chroniony materiału opisuje kod źródłowy zgodny z zestawem kodu źródłowego z repozytoriów publicznych, które mogą być wyprowadzane przez duże modele językowe bez odpowiedniego cytowania repozytoriów źródłowych. Model kodu chronionego materiału jest opcjonalny (domyślnie wyłączony) i dostępny w modelu dodawania adnotacji i filtrowania. Działa on po zakończeniu llM.
Konfigurowanie filtrów zawartości
Listy blokowe: klienci mogą teraz szybko dostosowywać zachowanie filtru zawartości w celu dalszego monitowania i uzupełniania, tworząc niestandardową listę bloków w swoich filtrach. Niestandardowa lista bloków umożliwia filtrowi podejmowanie akcji na dostosowanej liście wzorców, takich jak określone terminy lub wzorce wyrażeń regularnych. Oprócz niestandardowych list bloków udostępniamy listę bloków wulgaryzmów firmy Microsoft (angielski). Korzystanie z list blokowych

Październik 2023

Nowe modele dostrajania (wersja zapoznawcza)

gpt-35-turbo-0613 Jest teraz dostępny do dostrajania.
babbage-002 i davinci-002 są teraz dostępne do dostrajania. Te modele zastępują starsze modele ada, babbage, curie i davinci, które były wcześniej dostępne do dostrajania.
Dostępność dostrajania jest ograniczona do niektórych regionów. Sprawdź stronę modeli, aby uzyskać najnowsze informacje na temat dostępności modelu w każdym regionie.
Dostosowane modele mają różne limity przydziału niż zwykłe modele.
Samouczek: dostrajanie GPT-3.5-Turbo

Usługa Azure OpenAI na danych

Nowe parametry niestandardowe służące do określania liczby pobranych dokumentów i ścisłości.
- Ustawienie strictness ustawia próg, aby kategoryzować dokumenty jako istotne dla zapytań.
- Ustawienie Pobranych dokumentów określa liczbę dokumentów oceniania z indeksu danych używanego do generowania odpowiedzi.
Stan pozyskiwania/przekazywania danych można zobaczyć w programie Azure OpenAI Studio.
Obsługa prywatnych punktów końcowych i sieci VPN dla kontenerów obiektów blob.

Wrzesień 2023

GPT-4

GPT-4 i GPT-4-32k są teraz dostępne dla wszystkich klientów usługi Azure OpenAI. Klienci nie muszą już ubiegać się o listę oczekującą, aby korzystała z bibliotek GPT-4 i GPT-4-32k (wymagania dotyczące rejestracji ograniczonego dostępu nadal mają zastosowanie do wszystkich modeli usługi Azure OpenAI). Dostępność może się różnić w zależności od regionu. Sprawdź stronę modeli, aby uzyskać najnowsze informacje na temat dostępności modelu w każdym regionie.

GPT-3.5 Turbo Poinstruuj

Usługa Azure OpenAI obsługuje teraz model GPT-3.5 Turbo Instruct. Ten model ma porównywalną wydajność i text-davinci-003 jest dostępny do użycia z interfejsem API uzupełniania. Sprawdź stronę modeli, aby uzyskać najnowsze informacje na temat dostępności modelu w każdym regionie.

Szepta publiczna wersja zapoznawcza

Usługa Azure OpenAI Service obsługuje teraz interfejsy API zamiany mowy na tekst obsługiwane przez model Whisper interfejsu OpenAI. Pobierz tekst wygenerowany przez sztuczną inteligencję na podstawie podanego dźwięku mowy. Aby dowiedzieć się więcej, zapoznaj się z przewodnikiem Szybki start.

Uwaga

Usługa Azure AI Speech obsługuje również model szeptu openAI za pośrednictwem interfejsu API transkrypcji wsadowej. Aby dowiedzieć się więcej, zapoznaj się z przewodnikiem Tworzenie transkrypcji wsadowej. Zapoznaj się z tematem Co to jest model Szeptu? aby dowiedzieć się więcej o tym, kiedy używać usługi Azure AI Speech a Azure OpenAI Service.

Nowe regiony

Usługa Azure OpenAI jest teraz również dostępna w regionach Szwecja Środkowa i Szwajcaria Północna. Sprawdź stronę modeli, aby uzyskać najnowsze informacje na temat dostępności modelu w każdym regionie.

Regionalne limity przydziału zwiększają się

Zwiększa się do maksymalnych domyślnych limitów przydziału dla niektórych modeli i regionów. Migrowanie obciążeń do tych modeli i regionów umożliwi korzystanie z wyższych tokenów na minutę (TPM).

Sierpień 2023

Aktualizacje usługi Azure OpenAI na własnych danych (wersja zapoznawcza)

Teraz możesz wdrożyć usługę Azure OpenAI na danych w agentach power virtual agents.
Usługa Azure OpenAI On Your Data obsługuje teraz prywatne punkty końcowe.
Możliwość filtrowania dostępu do poufnych dokumentów.
Automatycznie odśwież indeks zgodnie z harmonogramem.
Opcje wyszukiwania wektorowego i wyszukiwania semantycznego.
Wyświetlanie historii czatów we wdrożonej aplikacji internetowej

Lipiec 2023 r.

Obsługa wywoływania funkcji

Usługa Azure OpenAI obsługuje teraz wywołanie funkcji, aby umożliwić pracę z funkcjami w interfejsie API uzupełniania czatów.

Zwiększanie osadzania tablicy wejściowej

Usługa Azure OpenAI obsługuje teraz tablice z maksymalnie 16 danymi wejściowymi na żądanie interfejsu API z osadzeniem tekstu-ada-002 w wersji 2.

Nowe regiony

Usługa Azure OpenAI jest teraz również dostępna w regionach Kanada Wschodnia, Wschodnie stany USA 2, Japonia Wschodnia i Północno-środkowe stany USA. Sprawdź stronę modeli, aby uzyskać najnowsze informacje na temat dostępności modelu w każdym regionie.

Czerwiec 2023

Korzystanie z usługi Azure OpenAI na własnych danych (wersja zapoznawcza)

Usługa Azure OpenAI On Your Data jest teraz dostępna w wersji zapoznawczej, umożliwiając rozmowę z modelami OpenAI, takimi jak GPT-35-Turbo i GPT-4, i odbieranie odpowiedzi na podstawie danych.

Nowe wersje modeli gpt-35-turbo i gpt-4

gpt-35-turbo (wersja 0613)
gpt-35-turbo-16k (wersja 0613)
gpt-4 (wersja 0613)
gpt-4-32k (wersja 0613)

Południowe Zjednoczone Królestwo

Usługa Azure OpenAI jest teraz dostępna w regionie Południowe Zjednoczone Królestwo. Sprawdź stronę modeli, aby uzyskać najnowsze informacje na temat dostępności modelu w każdym regionie.

Filtrowanie i adnotacje zawartości (wersja zapoznawcza)

Jak skonfigurować filtry zawartości za pomocą usługi Azure OpenAI Service.
Włącz adnotacje , aby wyświetlić kategorię filtrowania zawartości i informacje o ważności w ramach wywołań uzupełniania i kończenia czatu GPT.

Norma sprzedaży

Limit przydziału zapewnia elastyczność aktywnego zarządzania alokacją limitów szybkości we wdrożeniach w ramach subskrypcji.

Maj 2023

Obsługa zestawu JavaScript SDK

NOWE zestawy SDK usługi Azure OpenAI w wersji zapoznawczej oferują obsługę języków JavaScript i Java.

Ogólna dostępność zakończenia czatu usługi Azure OpenAI

Ogólna obsługa dostępności dla:
- Wersja 2023-05-15interfejsu API uzupełniania czatu.
- Modele GPT-35-Turbo.
- Seria modeli GPT-4.

Jeśli obecnie używasz interfejsu API, zalecamy migrację do interfejsu 2023-03-15-preview API ogólnie dostępnego 2023-05-15 . Jeśli obecnie używasz wersji 2022-12-01 interfejsu API, ta wersja interfejsu API pozostaje ogólnie dostępna, ale nie obejmuje najnowszych funkcji uzupełniania czatu.

Ważne

Korzystanie z bieżących wersji modeli GPT-35-Turbo z punktem końcowym uzupełniania pozostaje w wersji zapoznawczej.

Francja Środkowa

Usługa Azure OpenAI jest teraz dostępna w regionie Francja Środkowa. Sprawdź stronę modeli, aby uzyskać najnowsze informacje na temat dostępności modelu w każdym regionie.

Kwiecień 2023

DALL-E 2 — publiczna wersja zapoznawcza. Usługa Azure OpenAI Service obsługuje teraz interfejsy API generowania obrazów obsługiwane przez model DALL-E 2 platformy OpenAI. Pobierz obrazy generowane przez sztuczną inteligencję na podstawie podanego tekstu opisowego. Aby dowiedzieć się więcej, zapoznaj się z przewodnikiem Szybki start. Aby zażądać dostępu, istniejący klienci usługi Azure OpenAI mogą zastosować się, wypełniając ten formularz.
Nieaktywne wdrożenia niestandardowych modeli zostaną usunięte po upływie 15 dni; modele pozostaną dostępne do ponownego wdrożenia. Jeśli dostosowany (dostrojony) model jest wdrażany przez ponad piętnaście (15) dni, w których nie zostaną wykonane żadne ukończenie ani wywołania czatu, wdrożenie zostanie automatycznie usunięte (i nie zostaną naliczone żadne dalsze opłaty za hosting dla tego wdrożenia). Podstawowy dostosowany model pozostanie dostępny i będzie można go ponownie wdrożyć w dowolnym momencie. Aby dowiedzieć się więcej, zapoznaj się z artykułem z instrukcjami.

Marzec 2023

Modele serii GPT-4 są teraz dostępne w wersji zapoznawczej w usłudze Azure OpenAI. Aby zażądać dostępu, istniejący klienci usługi Azure OpenAI mogą zastosować się, wypełniając ten formularz. Te modele są obecnie dostępne w regionach Wschodnie stany USA i Południowo-środkowe stany USA.
Nowy interfejs API uzupełniania czatu dla modeli GPT-35-Turbo i GPT-4 wydany w wersji zapoznawczej 3/21. Aby dowiedzieć się więcej, zapoznaj się ze zaktualizowanymi przewodnikami Szybki start i artykułem z instrukcjami.
GPT-35-Turbo (wersja zapoznawcza). Aby dowiedzieć się więcej, zapoznaj się z artykułem z instrukcjami.
Zwiększone limity trenowania do dostrajania: maksymalny rozmiar zadania trenowania (tokeny w pliku treningowym) x (# epok) to 2 miliardy tokenów dla wszystkich modeli. Zwiększyliśmy również maksymalną liczbę zadań treningowych z 120 do 720 godzin.
Dodawanie dodatkowych przypadków użycia do istniejącego dostępu. Wcześniej proces dodawania nowych przypadków użycia wymagał od klientów ponownego zastosowania do usługi. Teraz publikujemy nowy proces, który umożliwia szybkie dodawanie nowych przypadków użycia do korzystania z usługi. Ten proces jest zgodny z ustalonym procesem ograniczonego dostępu w ramach usług Azure AI. Istniejący klienci mogą potwierdzić wszystkie nowe przypadki użycia w tym miejscu. Należy pamiętać, że jest to wymagane w dowolnym momencie, w którym chcesz korzystać z usługi w przypadku nowego przypadku użycia, dla którego pierwotnie nie zastosowano.

2023 lutego

Nowe funkcje

Przykłady wersji zapoznawczej zestawu | .NET SDK (wnioskowania)
Aktualizacja zestawu SDK programu Terraform do obsługi operacji zarządzania usługą Azure OpenAI.
Wstawianie tekstu na końcu ukończenia jest teraz obsługiwane za pomocą parametru suffix .

Aktualizacje

Filtrowanie zawartości jest domyślnie włączone.

Nowe artykuły na temat:

Nowy kurs szkoleniowy:

Wprowadzenie do usługi Azure OpenAI

Styczeń 2023

Nowe funkcje

Ogólna dostępność usługi. Usługa Azure OpenAI jest teraz ogólnie dostępna.
Nowe modele: Dodawanie najnowszego modelu tekstu, text-davinci-003 (Wschodnie stany USA, Europa Zachodnia), text-ada-embeddings-002 (Wschodnie stany USA, Południowo-środkowe stany USA, Europa Zachodnia)

Grudzień 2022

Nowe funkcje

Najnowsze modele z platformy OpenAI. Usługa Azure OpenAI zapewnia dostęp do wszystkich najnowszych modeli, w tym serii GPT-3.5.
Nowa wersja interfejsu API (2022-12-01). Ta aktualizacja obejmuje kilka żądanych ulepszeń, w tym informacje o użyciu tokenu w odpowiedzi interfejsu API, ulepszone komunikaty o błędach dla plików, wyrównanie do interfejsu OpenAI w zakresie dostrajania struktury danych tworzenia oraz obsługę parametru sufiksu w celu umożliwienia niestandardowego nazewnictwa dostosowanych zadań.
Wyższe limity żądań na sekundę. 50 dla modeli innych niż Davinci. 20 dla modeli Davinci.
Szybsze dostosowywanie wdrożeń. Wdróż modele Ada i Curie w czasie poniżej 10 minut.
Wyższe limity treningowe: 40 mln tokenów treningowych dla Ada, Babbage i Curie. 10M dla Davinci.
Proces żądania modyfikacji nadużyć i nieodebranych danych rejestrowania i przeglądu ludzkiego. Obecnie usługa rejestruje dane żądania/odpowiedzi na potrzeby wykrywania nadużyć i nieprawidłowego użycia, aby upewnić się, że te zaawansowane modele nie są nadużywane. Jednak wielu klientów ma ścisłe wymagania dotyczące prywatności i zabezpieczeń danych, które wymagają większej kontroli nad danymi. Aby obsługiwać te przypadki użycia, publikujemy nowy proces dla klientów w celu zmodyfikowania zasad filtrowania zawartości lub wyłączenia rejestrowania nadużyć w przypadku przypadków użycia niskiego ryzyka. Ten proces jest zgodny z ustalonym procesem ograniczonego dostępu w ramach usług Azure AI, a istniejący klienci openAI mogą zastosować tutaj.
Szyfrowanie klucza zarządzanego przez klienta (CMK). Klucz cmK zapewnia klientom większą kontrolę nad zarządzaniem danymi w usłudze Azure OpenAI, udostępniając własne klucze szyfrowania używane do przechowywania danych szkoleniowych i dostosowanych modeli. Klucze zarządzane przez klienta (CMK), znane także jako własne klucze (BYOK), zapewniają większą elastyczność tworzenia, obracania, wyłączania i odwoływania kontroli dostępu. Możesz również przeprowadzać inspekcję kluczy szyfrowania używanych do ochrony danych. Dowiedz się więcej z naszej dokumentacji dotyczącej szyfrowania magazynowanych.
Obsługa skrytki
Zgodność SOC-2
Rejestrowanie i diagnostyka za pomocą ustawień usługi Azure Resource Health, analizy kosztów i metryk i diagnostyki.
Ulepszenia programu Studio. Liczne ulepszenia użyteczności przepływu pracy programu Studio, w tym obsługa roli usługi Azure AD w celu kontrolowania, kto w zespole ma dostęp do tworzenia dostosowanych modeli i wdrażania.

Zmiany (powodujące niezgodność)

Dostrajanie żądania tworzenia interfejsu API zostało zaktualizowane w celu dopasowania do schematu interfejsu OpenAI.

Wersje interfejsu API w wersji zapoznawczej:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "hyperparams": { 
        "batch_size": 4,
        "learning_rate_multiplier": 0.1,
        "n_epochs": 4,
        "prompt_loss_weight": 0.1,
    }
}

Interfejs API w wersji 2022-12-01:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "batch_size": 4,
    "learning_rate_multiplier": 0.1,
    "n_epochs": 4,
    "prompt_loss_weight": 0.1,
}

Filtrowanie zawartości jest domyślnie tymczasowo wyłączone . Usługa Azure con tryb namiotu ration działa inaczej niż usługa Azure OpenAI. Usługa Azure OpenAI uruchamia filtry zawartości podczas wywołania generacji w celu wykrywania szkodliwej lub obraźliwej zawartości i filtruje je z odpowiedzi. Dowiedz się więcej

Te modele zostaną ponownie włączone w kwartale 2023 r. i będą domyślnie włączone.

Akcje klienta

Skontaktuj się z pomocą techniczną platformy Azure, jeśli chcesz, aby były one włączone dla twojej subskrypcji.
Zastosuj się do filtrowania modyfikacji, jeśli chcesz, aby pozostały wyłączone. (Ta opcja będzie dotyczyć tylko przypadków użycia niskiego ryzyka).

Następne kroki

Dowiedz się więcej o modelach bazowych, które zasilają usługę Azure OpenAI.

Share via

Co nowego w usłudze Azure OpenAI Service

Maj 2024 r.

Model GPT-4o w wersji zapoznawczej dostępny na potrzeby wczesnego dostępu

Ogólna dostępność modelu GPT-4 Turbo

Różnice między modelami OpenAI i Azure OpenAI GPT-4 Turbo GA

Różnice w porównaniu z interfejsem gpt-4 vision-preview

Dostępność zarządzana zaaprowizowana przez GPT-4 Turbo

Dostępność w regionach

Wdrażanie GPT-4 Turbo z usługą Vision GA

Kwiecień 2024 r.

Dostrajanie jest teraz obsługiwane w dwóch nowych regionach Wschodnie stany USA 2 i Szwajcaria Zachodnia

Wschodnie stany USA 2

Szwajcaria Zachodnia

Przykłady trenowania czatu wieloetkowego

GPT-4 (0125) jest dostępny dla usługi Azure OpenAI On Your Data

Marzec 2024 r.

Monitorowanie zagrożeń i Sejf ty w usłudze Azure OpenAI Studio

Aktualizacje danych w usłudze Azure OpenAI

Interfejs API ogólnie dostępnej wersji 2024-02-01

Szept — ogólna dostępność

Ogólna dostępność języka DALL-E 3

Nowe regionalne wsparcie dla daLL-E 3

Wycofywanie i wycofywanie modeli

Interfejs API 2024-03-01-preview wydany

Aktualizacja do planów uaktualniania GPT-4-1106-Preview

Luty 2024 r.

Dostępny model GPT-3.5-turbo-0125

Dostępne modele osadzania trzeciej generacji

Konsolidacja przydziałów GPT-3.5 Turbo

Dostępny model GPT-4-0125-preview

Publiczna wersja zapoznawcza interfejsu API asystentów

OpenAI text to speech voices public preview (Publiczna wersja zapoznawcza tekstu openAI na głosy mowy)

Nowe możliwości dostosowywania i obsługa modeli

Nowa regionalna obsługa usługi Azure OpenAI on Your Data

Ogólna dostępność usługi Azure OpenAI w danych

Grudzień 2023 r.

Usługa Azure OpenAI na danych

GPT-4 Turbo z usługą Vision jest teraz dostępna

Listopad 2023

Obsługa nowych źródeł danych w usłudze Azure OpenAI na danych

GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 wydany

Publiczna wersja zapoznawcza DALL-E 3

Odpowiedzialne AI

Październik 2023

Nowe modele dostrajania (wersja zapoznawcza)

Usługa Azure OpenAI na danych

Wrzesień 2023

GPT-4

GPT-3.5 Turbo Poinstruuj

Szepta publiczna wersja zapoznawcza

Nowe regiony

Regionalne limity przydziału zwiększają się

Sierpień 2023

Aktualizacje usługi Azure OpenAI na własnych danych (wersja zapoznawcza)

Lipiec 2023 r.

Obsługa wywoływania funkcji

Zwiększanie osadzania tablicy wejściowej

Nowe regiony

Czerwiec 2023

Korzystanie z usługi Azure OpenAI na własnych danych (wersja zapoznawcza)

Nowe wersje modeli gpt-35-turbo i gpt-4

Południowe Zjednoczone Królestwo

Filtrowanie i adnotacje zawartości (wersja zapoznawcza)

Norma sprzedaży

Maj 2023

Obsługa zestawu JavaScript SDK

Ogólna dostępność zakończenia czatu usługi Azure OpenAI

Francja Środkowa

Kwiecień 2023

Marzec 2023

2023 lutego

Nowe funkcje

Aktualizacje

Styczeń 2023

Nowe funkcje

Grudzień 2022

Nowe funkcje

Zmiany (powodujące niezgodność)

Następne kroki