Azure OpenAI Service-Modelle

Azure OpenAI Service basiert auf einer Vielzahl von Modellen mit unterschiedlichen Funktionen und Preispunkten. Die Verfügbarkeit der Modelle variiert je nach Region. Informationen zu GPT-3 und anderen Modellen, die im Juli 2024 eingestellt werden, finden Sie unter Legacymodelle von Azure OpenAI Service.

Modelle Beschreibung
GPT-4 Turbo 🆕 Die neuesten und leistungsstärksten Azure OpenAI-Modelle mit multimodalen Versionen, die sowohl Text als auch Bilder als Eingabe akzeptieren.
GPT-4 Eine Reihe von Modellen, die GPT-3.5 verbessern und natürliche Sprache sowie Code verstehen und generieren können.
GPT-3.5 Eine Reihe von Modellen, die GPT-3 verbessern und natürliche Sprache sowie Code verstehen und generieren können.
Einbettungen Eine Reihe von Modellen, die Text in numerische Vektorform konvertieren können, um die Textähnlichkeit zu erleichtern.
DALL-E Eine Reihe von Modellen, die Originalbilder aus natürlicher Sprache generieren können.
Whisper Eine Reihe von Modellen in der Vorschau, die Sprache transkribieren und in Text übersetzen können.
Sprachsynthese (Vorschau) Eine Reihe von Modellen in der Vorschau, die Text in Sprache synthetisieren können.

GPT-4 Turbo

GPT-4 Turbo ist ein großes multimodales Modell, das Text- oder Bildeingaben akzeptiert und Text generiert sowie schwierige Probleme mit höherer Genauigkeit als alle früheren Modelle von OpenAI lösen kann. Wie GPT-3.5 Turbo und ältere GPT-4-Modelle ist GPT-4 Turbo für Chats optimiert und eignet sich gut für gängige Vervollständigungsaufgaben.

Das neueste GA-Release (Allgemeine Verfügbarkeit) von GPT-4 Turbo ist:

  • gpt-4Version:turbo-2024-04-09

Es ersetzt die folgenden Vorschaumodelle:

  • gpt-4Version:1106-Preview
  • gpt-4Version:0125-Preview
  • gpt-4Version:vision-preview

Unterschiede zwischen den allgemein verfügbaren Modellen OpenAI und Azure OpenAI GPT-4 Turbo

  • Die Version des neuesten 0409 Turbo-Modells von OpenAI unterstützt den JSON-Modus und Funktionsaufrufe für alle Rückschlussanforderungen.
  • Die neueste turbo-2024-04-09 Version von Azure OpenAI unterstützt derzeit nicht die Verwendung des JSON-Modus und keine Funktionsaufrufe beim Durchführen von Rückschlussanforderungen mit Bildeingaben (Vision). Textbasierte Eingabeanforderungen (Anforderungen ohne image_url und Inlinebilder) unterstützen den JSON-Modus und Funktionsaufrufe.

Unterschiede zu gpt-4 vision-preview

  • Die Integration von Azure KI-spezifischen Vision-Verbesserungen in GPT-4 Turbo mit Vision wird für gpt-4Version:turbo-2024-04-09 nicht unterstützt. Dazu gehören optische Zeichenerkennung (Optical Character Recognition, OCR), Objektgrounding, Videoprompts und eine verbesserte Verarbeitung Ihrer Daten mit Bildern.

Verfügbarkeit von GPT-4 Turbo für verwaltete Bereitstellungen

  • gpt-4Version:turbo-2024-04-09 ist sowohl für Standardbereitstellungen als auch für bereitgestellte Bereitstellungen verfügbar. Derzeit unterstützt die bereitgestellte Version dieses Modells keine Bild-/Vision-Anforderungen für Rückschlüsse. Bereitgestellte Bereitstellungen dieses Modells akzeptieren nur Texteingaben. Standardmodellimplementierungen akzeptieren sowohl Text- als auch Bild-/Vision-Anforderungen für Rückschlüsse.

Regionale Verfügbarkeit

Weitere Informationen zur regionalen Modellverfügbarkeit finden Sie in der Modellmatrix für standardmäßige und bereitstellte Bereitstellungen.

Bereitstellen von GPT-4 Turbo mit Vision GA

Um das GA-Modell über die Studio-Benutzeroberfläche bereitzustellen, wählen Sie GPT-4 und dann die Version turbo-2024-04-09 im Dropdownmenü aus. Das Standardkontingent für das gpt-4-turbo-2024-04-09-Modell entspricht dem aktuellen Kontingent für GPT-4-Turbo. Weitere Informationen finden Sie in den regionalen Kontingentbeschränkungen.

GPT-4

GPT-4 ist der Vorgänger von GPT-4 Turbo. Sowohl für GPT-4- als auch für GPT-4 Turbo-Modelle lautet der Basismodellname gpt-4. Sie können die Modellversion verwenden, um zwischen GPT-4- und Turbo-Modellen zu unterscheiden.

  • gpt-4Version0314
  • gpt-4Version0613
  • gpt-4-32kVersion0613

Sie können die Tokenkontextlänge, die von jedem Modell unterstützt wird, in der Modellzusammenfassungstabelle sehen.

GPT-4- und GPT-4 Turbo-Modelle

  • Diese Modelle können nur mit der Chatvervollständigungs-API verwendet werden.

In Modellversionen erfahren Sie, wie Azure OpenAI Service Modellversionsupgrades verarbeitet, und Arbeiten mit Modellen, um zu erfahren, wie Sie die Modellversionseinstellungen Ihrer GPT-4-Bereitstellungen anzeigen und konfigurieren.

Modell-ID Maximale Anforderung (Token) Trainingsdaten (bis)
gpt-4 (0314) 8\.192 September 2021
gpt-4-32k(0314) 32,768 September 2021
gpt-4 (0613) 8\.192 September 2021
gpt-4-32k (0613) 32,768 September 2021
gpt-4 (1106-Vorschau)1
GPT-4 Turbo-Preview
Eingabe: 128.000
Ausgabe: 4.096
Apr 2023
gpt-4 (0125-Vorschau)1
GPT-4 Turbo-Preview
Eingabe: 128.000
Ausgabe: 4.096
Dez. 2023
gpt-4 (vision-preview)2
GPT-4 Turbo mit Vision-Vorschau
Eingabe: 128.000
Ausgabe: 4.096
Apr 2023
gpt-4 (turbo-2024-04-09) 🆕
GPT-4 Turbo mit Vision GA
Eingabe: 128.000
Ausgabe: 4.096
Dez. 2023

1 GPT-4 Turbo Preview = gpt-4 (0125-Vorschau) oder gpt-4 (1106-Vorschau). Um dieses Modell bereitzustellen, wählen Sie unter Bereitstellungen das Modell gpt-4 aus. Wählen Sie unter Version (0125-Vorschau) oder (1106-Vorschau).

2 GPT-4 Turbo mit Vision-Vorschau = gpt-4 (vision-preview). Um dieses Modell bereitzustellen, wählen Sie unter Bereitstellungen das Modell gpt-4 aus. Wählen Sie als Modellversion die Option vision-preview aus.

Achtung

Es wird nicht empfohlen, Vorschaumodelle in der Produktion zu verwenden. Wir aktualisieren alle Bereitstellungen von Vorschaumodellen auf zukünftige Vorschauversionen und eine stabile Version. Modelle, die als Vorschau bezeichnet wurden, entsprechen nicht dem standardmäßigen Azure OpenAI-Modelllebenszyklus.

Hinweis

Version 0314 von gpt-4 und gpt-4-32k wird nicht vor dem 5. Juli 2024 eingestellt. Version 0613 von gpt-4 und gpt-4-32k wird nicht vor dem 30. September 2024 eingestellt. Informationen zum Modellupgradeverhalten finden Sie unter Modellupdates.

  • GPT-4 Version 0125-preview ist eine aktualisierte Version der GPT-4 Turbo Preview, die zuvor als Version 1106-preview veröffentlicht wurde.
  • GPT-4 Version 0125-preview erledigt Aufgaben wie die Codegenerierung vollständiger als die Version gpt-4-1106-preview. Je nach Aufgabe stellen Kund*innen möglicherweise fest, dass GPT-4-0125-preview im Vergleich zur gpt-4-1106-preview mehr Ausgaben generiert. Wir empfehlen Kund*innen, die Ausgaben des neuen Modells zu vergleichen. GPT-4-0125-preview behebt auch Fehler von gpt-4-1106-preview mit UTF-8-Behandlung für nicht englische Sprachen. GPT-4 Version turbo-2024-04-09 ist das neueste GA-Release und ersetzt 0125-Preview, 1106-preview und vision-preview.

Wichtig

  • Die gpt-4-Versionen 1106-Vorschau und 0125-Vorschau werden zukünftig mit einer stabilen gpt-4-Version aktualisiert. Bereitstellungen der gpt-4-Versionen 1106-Vorschau und 0125-Vorschau werden auf „Automatisches Update auf Standard“ festgelegt, und „Upgrade nach Ablauf“ wird gestartet, nachdem die stabile Version veröffentlicht wurde. Für jede Bereitstellung erfolgt ein Upgrade der Modellversion ohne Unterbrechung des Diensts für API-Aufrufe. Upgrades werden nach Region gestaffelt, und der gesamte Upgradevorgang wird voraussichtlich 2 Wochen dauern. Bereitstellungen der gpt-4-Versionen 1106-Vorschau und 0125-Vorschau, die auf „Kein Autoupgrade“ festgelegt sind, werden nicht aktualisiert und werden nicht mehr ausgeführt, wenn die Vorschauversion in der Region aktualisiert wird. Weitere Informationen zum Zeitpunkt des Upgrades finden Sie unter Eingestellte und veraltete Azure OpenAI-Modelle.

GPT-3.5

GPT-3.5-Modelle können natürliche Sprache oder Code verstehen und generieren. Das leistungsfähigste und kostengünstigste Modell in der GPT-3.5-Familie ist GPT-3.5 Turbo, das für den Chat optimiert wurde und auch für herkömmliche Vervollständigungsaufgaben gut geeignet ist. GPT-3.5 Turbo ist für die Verwendung mit der Chatvervollständigungs-API verfügbar. GPT-3.5 Turbo Instruct verfügt über ähnliche Funktionen wie text-davinci-003 und nutzt die Vervollständigungs-API anstelle der Chatvervollständigungs-API. Es wird empfohlen, GPT-3.5 Turbo und GPT-3.5 Turbo Instruct anstatt der älteren GPT-3.5- und GPT-3.5-Modelle zu verwenden.

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo-instruct

Sie können die Tokenkontextlänge, die von jedem Modell unterstützt wird, in der Modellzusammenfassungstabelle sehen.

Weitere Informationen zu GPT-3.5 Turbo und zur Chatvervollständigungs-API finden Sie in unserer ausführlichen Anleitung.

Einbettungen

text-embedding-3-large ist das neueste und leistungsfähigste Einbettungsmodell. Das Upgrade zwischen Einbettungsmodellen ist nicht möglich. Um von text-embedding-ada-002 zu text-embedding-3-large zu wechseln, müssen Sie neue Einbettungen generieren.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

In Tests berichtet OpenAI, dass sowohl das große als auch das kleine Einbettungsmodell der dritten Generation eine bessere durchschnittliche Leistung beim Abruf mehrerer Sprachen mit der MIRACL-Benchmark bietet, während die Leistung für englische Aufgaben mit der MTEB-Benchmark aufrechterhalten bleibt.

Bewertungsbenchmark text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL-Durchschnitt 31,4 44,0 54.9
MTEB-Durchschnitt 61.0 62,3 64,6

Die Einbettungsmodelle der dritten Generation unterstützen die Reduzierung der Einbettungsgröße über einen neuen dimensions-Parameter. In der Regel sind größere Einbettungen aus Compute-, Arbeitsspeicher- und Speicherperspektive teurer. Die Möglichkeit, die Anzahl der Dimensionen anzupassen, ermöglicht eine bessere Kontrolle über die Gesamtkosten und die Leistung. Der Parameter dimensions wird nicht in allen Versionen der OpenAI 1.x-Python-Bibliothek unterstützt. Um diesen Parameter zu nutzen, empfehlen wir ein Upgrade auf die neueste Version: pip install openai --upgrade.

Bei den MTEB-Benchmarktests von OpenAI wurde festgestellt, dass die Leistung des Modells der dritten Generation auch dann noch geringfügig besser ist, wenn die Dimensionen auf weniger als 1.536 Dimensionen für text-embeddings-ada-002 reduziert werden.

DALL-E

Die DALL-E-Modelle generieren Bilder aus Textprompts, die der Benutzer bereitstellt. DALL-E 3 ist allgemein verfügbar für die Verwendung mit den REST-APIs. DALL-E 2 und DALL-E 3 mit Client-SDKs befinden sich in der Vorschau.

Whisper

Die Whisper-Modelle können für Spracherkennung verwendet werden.

Sie können das Whisper-Modell auch über die API Batch-Transkription von Azure AI Speech verwenden. Im Artikel Was ist das Whisper-Modell? erfahren Sie mehr darüber, wann Azure KI Speech bzw. wann Azure OpenAI Service verwendet werden sollte.

Sprachsynthese (Vorschau)

Der OpenAI-Sprachsynthesemodelle, die sich derzeit in der Vorschau befinden, können verwendet werden, um Text in Sprache zu synthetisieren.

Sie können den OpenAI-Stimmen für die Sprachsynthese über Azure KI Speech verwenden. Weitere Informationen finden Sie im Leitfaden OpenAI-Stimmen für die Sprachsynthese über Azure OpenAI Service oder über Azure KI Speech.

Tabelle mit Modellzusammenfassung und Regionsverfügbarkeit

Hinweis

In diesem Artikel wird nur die Verfügbarkeit von Modellen/Regionen für Azure OpenAI-Kundinnen und Kunden mit Standard-Bereitstellungstypen behandelt. Einige ausgewählte Kunden haben Zugriff auf Modell-/Regionskombinationen, die nicht in der einheitlichen Tabelle unten aufgeführt sind. Weitere Informationen zu bereitgestellten Bereitstellungen finden Sie in den bereitgestellten Richtlinien.

Verfügbarkeit des Standardbereitstellungsmodells

Region gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 babbage-002, 1 dall-e-3, 3.0 davinci-002, 1 tts, 001 tts-hd, 001 whisper, 001
australiaeast - - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - -
eastus - - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - - -
swedencentral - - - - - -
switzerlandnorth - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - -

Diese Tabelle enthält nicht die regionale Verfügbarkeit für die Feinabstimmung. Diese Informationen finden Sie im dedizierten Abschnitt zur Feinabstimmung.

Standardbereitstellungsmodellkontingent

Das Standardkontingent für Modelle variiert je nach Modell und Region. Die Standardkontingentgrenzwerte können sich ändern.

Das Kontingent für Standardbereitstellungen wird in Bezug auf Token-Per-Minute (TPM) beschrieben.

Region GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V GPT-35-Turbo GPT-35-Turbo-Instruct Text-Embedding-Ada-002 text-embedding-3-small text-embedding-3-large Babbage-002 Babbage-002 – Optimierung Davinci-002 Davinci-002 – Optimierung GPT-35-Turbo – Optimierung GPT-35-Turbo-1106 – Optimierung GPT-35-Turbo-0125 – Optimierung
australiaeast 40 Tsd. 80.000 80.000 30.000 300 K - 350 K - - - - - - - - -
brazilsouth - - - - - - 350 K - - - - - - - - -
canadaeast 40 Tsd. 80.000 80.000 - 300 K - 350 K 350 K 350 K - - - - - - -
eastus - - 80.000 - 240.000 240.000 240.000 350 K 350 K - - - - - - -
eastus2 - - 80.000 - 300 K - 350 K 350 K 350 K - - - - 250 Tsd. 250 Tsd. 250 Tsd.
francecentral 20 Tsd. 60.000 80.000 - 240.000 - 240.000 - - - - - - - - -
japaneast - - - 30.000 300 K - 350 K - - - - - - - - -
northcentralus - - 80.000 - 300 K - 350 K - - 240.000 250 Tsd. 240.000 250 Tsd. 250 Tsd. 250 Tsd. 250 Tsd.
norwayeast - - 150 K - - - 350 K - - - - - - - - -
southafricanorth - - - - - - 350 K - - - - - - - - -
southcentralus - - 80.000 - 240.000 - 240.000 - - - - - - - - -
southindia - - 150 K - 300 K - 350 K - - - - - - - - -
swedencentral 40 Tsd. 80.000 150 K 30.000 300 K 240.000 350 K - - 240.000 250 Tsd. 240.000 250 Tsd. 250 Tsd. 250 Tsd. 250 Tsd.
switzerlandnorth 40 Tsd. 80.000 - 30.000 300 K - 350 K - - - - - - - - -
switzerlandwest - - - - - - - - - - 250 Tsd. - 250 Tsd. 250 Tsd. 250 Tsd. 250 Tsd.
uksouth - - 80.000 - 240.000 - 350 K - - - - - - - - -
westeurope - - - - 240.000 - 240.000 - - - - - - - - -
westus - - 80.000 30.000 300 K - 350 K - - - - - - - - -
westus3 - - 80.000 - - - 350 K - - - - - - - - -

1 K = 1.000 Token pro Minute (TPM). Die Beziehung zwischen TPM und Anforderungen pro Minute (RPM) ist derzeit als 6 RPM pro 1.000 TPM definiert.

Verfügbarkeit des bereitgestellten Bereitstellungsmodells

Region gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125
australiaeast -
brazilsouth - - -
canadacentral - - - -
canadaeast - - - -
eastus -
eastus2 -
francecentral - -
germanywestcentral - -
japaneast - - - -
koreacentral - - - -
northcentralus -
norwayeast - - - -
polandcentral -
southafricanorth - - -
southcentralus -
southindia -
swedencentral -
switzerlandnorth -
switzerlandwest - - - - - -
uksouth -
westus -
westus3

Hinweis

Die bereitgestellte Version von gpt-4Version:turbo-2024-04-09 ist derzeit nur auf Text beschränkt.

Wie erhalte ich Zugriff auf den bereitgestellten Durchsatz?

Sie müssen sich an Ihr Microsoft-Vertriebs-/Kontoteam wenden, um bereitgestellten Durchsatz zu erwerben. Wenn Sie nicht über ein Vertriebs-/Kontoteam verfügen, können Sie derzeit leider keinen bereitgestellten Durchsatz kaufen.

Weitere Informationen zu bereitgestellten Bereitstellungen finden Sie in den bereitgestellten Richtlinien.

GPT-4- und GPT-4 Turbo-Modellverfügbarkeit

Öffentliche Cloudregionen

Region gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613
australiaeast - -
canadaeast - - -
eastus - - - - -
eastus2 - - - -
francecentral - - -
japaneast - - - - -
northcentralus - - - - -
norwayeast - - - - -
southcentralus - - - - -
southindia - - - - -
swedencentral -
switzerlandnorth - - -
uksouth - - - -
westus - - - -
westus3 - - - - -

Kundenzugriff auswählen

Zusätzlich zu den oben genannten Regionen, die allen Azure OpenAI-Kunden zur Verfügung stehen, wurden einigen ausgewählten bereits bestehenden Kunden in zusätzlichen Regionen Zugriff auf Versionen von GPT-4 gewährt:

Modell Region
gpt-4 (0314) East US
Frankreich, Mitte
USA Süd Mitte
UK, Süden
gpt-4 (0613) East US
USA (Ost) 2
Japan, Osten
UK, Süden

Azure Government-Regionen

Die folgenden GPT-4-Modelle sind in Azure Government verfügbar:

Modell-ID Modellverfügbarkeit
gpt-4 (1106-Vorschau) US Government, Virginia
US Gov Arizona

GPT-3.5-Modelle

Wichtig

Das NEUE Modell gpt-35-turbo (0125) bietet verschiedene Verbesserungen, darunter eine höhere Genauigkeit bei der Reaktion auf angeforderte Formate und ein Fix für einen Fehler, der zu einem Textcodierungsproblem bei nicht englischsprachigen Funktionsaufrufen führte.

GPT-3.5 Turbo wird mit der Chatvervollständigungs-API verwendet. GPT-3.5 Turbo Version 0301 kann auch mit der Completions-API verwendet werden, obwohl dies nicht empfohlen wird. GPT-3.5 Turbo-Versionen 0613 und 1106 unterstützen nur die Chat-Abschluss-API.

GPT-3.5 Turbo Version 0301 ist die erste Version des veröffentlichten Modells. Version 0613 ist die zweite Version des Modells und fügt Unterstützung für Funktionsaufrufe hinzu.

In Modellversionen erfahren Sie, wie Azure OpenAI Service Modellversionsupgrades verarbeitet, und Arbeiten mit Modellen, um zu erfahren, wie Sie die Modellversionseinstellungen Ihrer GPT-3.5 Turbo-Bereitstellungen anzeigen und konfigurieren.

Hinweis

Version 0613 von gpt-35-turbo und gpt-35-turbo-16k wird nicht vor dem 1. August 2024 eingestellt. Version 0301 von gpt-35-turbo wird nicht vor dem 1. August 2024 eingestellt. Informationen zum Modellupgradeverhalten finden Sie unter Modellupdates.

Modell-ID Maximale Anforderung (Token) Trainingsdaten (bis)
gpt-35-turbo1 (0301) 4\.096 September 2021
gpt-35-turbo (0613) 4\.096 September 2021
gpt-35-turbo-16k (0613) 16.384 September 2021
gpt-35-turbo-instruct (0914) 4.097 September 2021
gpt-35-turbo (1106) Eingabe: 16.385
Ausgabe: 4.096
September 2021
gpt-35-turbo (0125) NEU Eingabe: 16.385
Ausgabe: 4.096
September 2021

GPT-3.5-Turbo-Modellverfügbarkeit

Öffentliche Cloudregionen

Region gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
australiaeast - - -
canadaeast - -
eastus - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - -
southcentralus - - - -
southindia - - - - -
swedencentral - -
switzerlandnorth - - - -
uksouth - -
westeurope - - - - -
westus - - - - -

1 Dieses Modell akzeptiert Anforderungen von mehr als 4.096 Token. Es wird nicht empfohlen, den Grenzwert von 4.096 Eingabetoken zu überschreiten, da die neuere Version des Modells auf 4.096 Token begrenzt ist. Wenn bei diesem Modell 4.096 Eingabetoken überschritten werden und Probleme auftreten, ist zu beachten, dass diese Konfiguration nicht offiziell unterstützt wird.

Azure Government-Regionen

Die folgenden GPT-3.5-Turbomodelle sind in Azure Government verfügbar:

Modell-ID Modellverfügbarkeit
gpt-35-turbo (1106-Vorschau) US Government, Virginia

Einbettungsmodelle

Diese Modelle können mit einbetteten API-Anforderungen verwendet werden.

Hinweis

text-embedding-3-large ist das neueste und leistungsfähigste Einbettungsmodell. Das Upgrade zwischen Einbettungsmodellen ist nicht möglich. Für die Migration von text-embedding-ada-002 zu text-embedding-3-large müssen Sie neue Einbettungen generieren.

Modell-ID Maximale Anforderung (Token) Ausgabedimensionen Trainingsdaten (bis)
text-embedding-ada-002 (Version 2) 8.191 1\.536 September 2021
text-embedding-ada-002 (Version 1) 2.046 1\.536 September 2021
text-embedding-3-large 8.191 3\.072 September 2021
text-embedding-3-small 8.191 1\.536 September 2021

Hinweis

Wenn ein Array von Eingaben für die Einbettung gesendet wird, können pro Aufruf des Einbettungsendpunkts maximal 2.048 Eingabeelemente im Array verwendet werden.

Öffentliche Cloudregionen

Region text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
australiaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
francecentral - - -
japaneast - - -
northcentralus - - -
norwayeast - - -
southafricanorth - - -
southcentralus - -
southindia - - -
swedencentral - - -
switzerlandnorth - - -
uksouth - - -
westeurope - - -
westus - - -
westus3 - - -

Azure Government-Regionen

Die folgenden Einbettungsmodelle sind in Azure Government verfügbar:

Modell-ID Modellverfügbarkeit
text-embedding-ada-002 (Version 2) US Government, Virginia
US Gov Arizona

DALL-E-Modelle

Modell-ID Verfügbarkeit von Funktionen Max. Anforderung (Zeichen)
dalle2 (Vorschau) East US 1.000
dall-e-3 „USA, Osten“, „Australien, Osten“, „Schweden, Mitte“ 4\.000

Optimierung von Modellen

babbage-002 und davinci-002 sind nicht trainiert, Anweisungen zu befolgen. Das Abfragen dieser Basismodelle sollte nur als Referenzpunkt für eine fein abgestimmte Version dienen, um den Fortschritt Ihres Trainings zu bewerten.

gpt-35-turbo – Die Feinabstimmung dieses Modells ist auf eine Teilmenge von Regionen beschränkt und ist nicht in allen Regionen, in denen das Basismodell verfügbar ist, verfügbar.

Modell-ID Regionen mit Feinabstimmung Maximale Anforderung (Token) Trainingsdaten (bis)
babbage-002 USA Nord Mitte
Schweden, Mitte
Schweiz, Westen
16.384 September 2021
davinci-002 USA Nord Mitte
Schweden, Mitte
Schweiz, Westen
16.384 September 2021
gpt-35-turbo (0613) USA (Ost 2)
USA Nord Mitte
Schweden, Mitte
Schweiz, Westen
4\.096 September 2021
gpt-35-turbo (1106) USA (Ost 2)
USA Nord Mitte
Schweden, Mitte
Schweiz, Westen
Eingabe: 16.385
Ausgabe: 4.096
September 2021
gpt-35-turbo (0125) USA (Ost 2)
USA Nord Mitte
Schweden, Mitte
Schweiz, Westen
16.385 September 2021

Whisper-Modelle

Modell-ID Modellverfügbarkeit Maximale Anforderung (Größe der Audiodatei)
whisper USA (Ost) 2
USA Nord Mitte
Norwegen, Osten
Indien (Süden)
Schweden, Mitte
Europa, Westen
25 MB

Sprachsynthesemodelle (Vorschau)

Modell-ID Modellverfügbarkeit
tts-1 USA Nord Mitte
Schweden, Mitte
tts-1-hd USA Nord Mitte
Schweden, Mitte

Assistants (Vorschau)

Für Assistants benötigen Sie eine Kombination aus einem unterstützten Modell und einer unterstützten Region. Für bestimmte Tools und Funktionen sind die neuesten Modelle erforderlich. Die folgenden Modelle sind in der Assistants-API, SDK, Azure KI Studio und Azure OpenAI Studio verfügbar. Die folgende Tabelle ist für die nutzungsbasierte Bezahlung. Informationen zur Verfügbarkeit der bereitgestellten Durchsatzeinheit (PTU) finden Sie unter bereitgestellten Durchsatz.

Region gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106) gpt-4 (0125)
Australien (Osten)
East US
USA (Ost) 2
Frankreich, Mitte
Norwegen, Osten
Schweden, Mitte
UK, Süden

Nächste Schritte