Share via


Az Azure OpenAI Service modelljei

Az Azure OpenAI szolgáltatást különböző képességekkel és árpontokkal rendelkező modellek változatos halmaza működteti. A modellek elérhetősége régiónként változik. A GPT-3 és más, 2024 júliusában nyugdíjba vonuló modellekkel kapcsolatban lásd: Azure OpenAI Service legacy modellek.

Modellek Leírás
GPT-4o > GPT-4 Turbo NEW A legújabb, többmodális verziójú Azure OpenAI-modellek, amelyek bemenetként szövegeket és képeket is elfogadnak.
GPT-4 A GPT-3.5-ben fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és kódot.
GPT-3.5 A GPT-3-on fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és a kódot.
Beágyazások Olyan modellek készlete, amelyek a szöveg numerikus vektorformává alakíthatók a szöveg hasonlóságának megkönnyítése érdekében.
DALL-E Olyan modellek sorozata, amelyek eredeti képeket hozhatnak létre természetes nyelvről.
Suttogás Előzetes verziójú modellek sorozata, amelyek átírhatják és lefordíthatják a beszédet szöveggé.
Szövegfelolvasás (előzetes verzió) Egy előzetes verziójú modellsorozat, amely képes szövegfelolvasásra.

GPT-4o és GPT-4 Turbo

A GPT-4o az OpenAI legújabb előzetes verziója. A GPT-4o egyetlen modellben integrálja a szöveget és a képeket, így egyszerre több adattípust is képes kezelni. Ez a multimodális megközelítés növeli a pontosságot és a válaszkészséget az emberi-számítógépes interakciókban. A GPT-4o megfelel a GPT-4 Turbo angol nyelvű szöveg- és kódolási feladatainak, miközben kiváló teljesítményt nyújt nem angol nyelvű és látási feladatokban, új teljesítményteszteket állít be az AI-képességekhez.

Korai hozzáférésű játszótér

A meglévő Azure OpenAI-ügyfelek kipróbálhatják a GPT-4o-t az Új Azure OpenAI Studio korai hozzáférésű játszótéren (előzetes verzió).

A legújabb modell tesztelése:

Feljegyzés

  • A GPT-4o korai hozzáférésű játszótér jelenleg csak az USA 3. nyugati régiójában és az USA keleti régiójában található erőforrásokhoz érhető el, és előfizetésenként öt percenként 10 kérésre korlátozódik.
  • Az Azure OpenAI szolgáltatással való visszaélés monitorozása minden korai hozzáférésű játszótér-felhasználó számára engedélyezve van, még akkor is, ha jóváhagyást ad a módosításra; az alapértelmezett tartalomszűrők engedélyezve vannak, és nem módosíthatók.
  • A GPT-4o egy Azure OpenAI előzetes verziójú modell, és jelenleg nem érhető el üzembe helyezéshez/közvetlen API-hozzáféréshez.
  1. Lépjen az Azure OpenAI Studióba, https://oai.azure.com/ és jelentkezzen be olyan hitelesítő adatokkal, amelyek hozzáférnek az OpenAI-erőforrásokhoz.
  2. Válasszon egy Azure OpenAI-erőforrást az USA 3. nyugati régiójában vagy az USA keleti régiójában. Ha nem rendelkezik erőforrással ezen régiók egyikében, létre kell hoznia egy erőforrást.
  3. Az Azure OpenAI Studio fő lapján válassza a Korai hozzáférésű játszótér (előzetes verzió) gombot az Első lépések szakaszban. (Ez a gomb csak akkor lesz elérhető, ha egy erőforrás Az USA 3 . nyugati régiója vagy az USA keleti régiója van kiválasztva.)
  4. Most már ugyanúgy tehet fel kérdéseket a modellben, mint korábban a meglévő csevegési játszótéren.

GPT-4 Turbo

A GPT-4 Turbo egy nagy multimodális modell (szöveg- vagy képbemenetek elfogadása és szöveg generálása), amely nagyobb pontossággal képes megoldani a nehéz problémákat, mint az OpenAI korábbi modelljei. A GPT-3.5 Turbo és a régebbi GPT-4 modellekhez hasonlóan a GPT-4 Turbo is csevegésre van optimalizálva, és jól működik a hagyományos befejezési feladatokhoz.

A GPT-4 Turbo legújabb GA kiadása a következő:

  • gpt-4Verzió:turbo-2024-04-09

Ez a következő előzetes modellek lecserélése:

  • gpt-4Verzió:1106-Preview
  • gpt-4Verzió:0125-Preview
  • gpt-4Verzió:vision-preview

Az OpenAI és az Azure OpenAI GPT-4 Turbo GA modellek közötti különbségek

  • Az OpenAI legújabb 0409 turbómodell verziója támogatja a JSON módot és a függvényeket, amelyek minden következtetési kérést meghívnak.
  • Az Azure OpenAI legújabb turbo-2024-04-09 verziója jelenleg nem támogatja a JSON mód és a függvényhívás használatát, amikor következtetési kérelmeket készít képi (vision) bemenettel. A szövegalapú bemeneti kérések (képek nélküli image_url és beágyazott kérések) támogatják a JSON-módot és a függvényhívást.

Különbségek a gpt-4 vision-preview-tól

  • Az Azure AI-specifikus Vision-fejlesztések a GPT-4 Turbo és a Vision integrációját nem támogatják a gpt-4Verzió:turbo-2024-04-09. Ez magában foglalja az optikai karakterfelismerést (OCR), az objektumok földelését, a videoüzeneteket és az adatok képekkel való jobb kezelését.

GPT-4 Turbo kiosztott felügyelt rendelkezésre állás

  • gpt-4Verzió:turbo-2024-04-09 standard és kiépített üzemelő példányokhoz is elérhető. A modell kiépített verziója jelenleg nem támogatja a kép-/látásbeli következtetési kérelmeket. A modell kiépített üzembe helyezései csak szöveges bemeneteket fogadnak el. A standard modelltelepítések szöveges és képi/látási következtetési kéréseket is elfogadnak.

Régiónkénti elérhetőség

A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a standard és a kiépített üzemelő példányok modellmátrixát.

A GPT-4 Turbo üzembe helyezése a Vision GA-val

Ha a GA-modellt a Studio felhasználói felületén szeretné üzembe helyezni, válassza ki GPT-4 , majd válassza ki a turbo-2024-04-09 verziót a legördülő menüből. A modell alapértelmezett kvótája megegyezik a gpt-4-turbo-2024-04-09 GPT-4-Turbo jelenlegi kvótával. Tekintse meg a regionális kvótakorlátokat.

GPT-4

A GPT-4 a GPT-4 Turbo elődje. Mind a GPT-4, mind a GPT-4 Turbo modellek alapmodelljének gpt-4neve . A GPT-4 és a Turbo modellek között a modellverzió vizsgálatával lehet különbséget tenni.

  • gpt-4Verzió0314
  • gpt-4Verzió0613
  • gpt-4-32kVerzió0613

A modellösszesítő táblázatban láthatja az egyes modellek által támogatott jogkivonat-környezet hosszát.

GPT-4 és GPT-4 Turbo modellek

  • Ezek a modellek csak a Csevegés befejezése API-val használhatók.

A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-4 üzemelő példányok modellverzió-beállításainak megtekintéséhez és konfigurálásához.

Modellazonosító Leírás Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
gpt-4o (2024-05-13)
GPT-4o (Omni) előzetes verzió
Legújabb előzetes verziójú modell
- Szöveg, képfeldolgozás
- Nagyobb pontosság és válaszkészség
- Parity with English text and coding tasks to GPT-4 Turbo with Vision
- Kiváló teljesítmény nem angol nyelven és látási feladatokban
- Jelenleg csak korai hozzáférésű játszótéren keresztül érhető el
– Jelenleg nincs üzembe helyezés/API-hozzáférés
Bemenet: 128 000
Kimenet: 4096
2023. október
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo és Vision
Legújabb GA-modell
- Az összes korábbi GPT-4 előzetes modell cseréje (vision-preview, 1106-Preview, ). 0125-Preview
- A funkciók rendelkezésre állása jelenleg eltérő a bemeneti módszertől és az üzembe helyezés típusától függően.
- Nem támogatja a fejlesztéseket.
Bemenet: 128 000
Kimenet: 4096
2023. december
gpt-4 (0125-Preview)*
GPT-4 Turbo előzetes verzió
Mintamodell
-Lecseréli az 1106-előzetes verziót
– Jobb kódgenerálási teljesítmény
– Csökkenti azokat az eseteket, amikor a modell nem végez el feladatot
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
Bemenet: 128 000
Kimenet: 4096
2023. december
gpt-4 (vision-preview)
GPT-4 Turbo a Vision Előzetes verzióval
Mintamodell
– Szöveg- és képbevitelt fogad el.
- Támogatja a fejlesztéseket
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
Bemenet: 128 000
Kimenet: 4096
2023. ápr.
gpt-4 (1106-előzetes verzió)
GPT-4 Turbo előzetes verzió
Mintamodell
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
Bemenet: 128 000
Kimenet: 4096
2023. ápr.
gpt-4-32k (0613) Régebbi GA-modell
- Alapszintű függvényhívás eszközökkel
32,768 2021. szeptember
gpt-4 (0613) Régebbi GA-modell
- Alapszintű függvényhívás eszközökkel
8,192 2021. szeptember
gpt-4-32k(0314) Régebbi GA-modell
- Nyugdíjazási információk
32,768 2021. szeptember
gpt-4 (0314) Régebbi GA-modell
- Nyugdíjazási információk
8,192 2021. szeptember

Figyelemfelhívás

Nem javasoljuk, hogy éles környezetben használjunk előzetes verziójú modelleket. Az előzetes modellek összes üzembe helyezését a jövőbeni előzetes verzióra vagy a legújabb stabil/GA verzióra frissítjük. Az előzetes verzióra kijelölt modellek nem követik a standard Azure OpenAI-modell életciklusát.

Feljegyzés

A verziót 0314gpt-4gpt-4-32k legkésőbb 2024. július 5-én kivonjuk. A verziót 0613gpt-4gpt-4-32k legkésőbb 2024. szeptember 30-án kivonjuk. A modellfrissítési viselkedést a modellfrissítési viselkedést tekintheti meg.

  • A GPT-4 0125-előzetes verziója a GPT-4 Turbo előzetes verzió frissített verziója, amely korábban 1106-os előzetes verzióként jelent meg.
  • A GPT-4 0125-előzetes verziója olyan feladatokat hajt végre, mint a kódlétrehozás a gpt-4-1106-előzetes verzióhoz képest. Emiatt a feladattól függően az ügyfelek azt tapasztalhatják, hogy a GPT-4-0125-preview több kimenetet generál a gpt-4-1106-preview-hoz képest. Javasoljuk, hogy az ügyfelek hasonlítsák össze az új modell kimeneteit. A GPT-4-0125-preview a gpt-4-1106-preview hibáit is elhárítja, a nem angol nyelvű UTF-8 kezeléssel.
  • A GPT-4 verzió turbo-2024-04-09 a legújabb GA-kiadás, és lecseréli 0125-Previewa , 1106-previewés vision-preview.

Fontos

  • gpt-4 Az 1106-preview, a 0125-Preview és a vision-preview verziók a jövőben stabil verzióval gpt-4 lesznek frissítve. gpt-4 Az 1106-előzetes verzió, a 0125-preview és a vision-preview "Automatikus frissítés alapértelmezettre" értékre van állítva, és a "Frissítés, ha lejárt" a stabil verzió kiadása után frissülni fog. Minden üzemelő példány esetében a modellverzió frissítése az API-hívások szolgáltatásának megszakítása nélkül történik. A frissítések régiónként vannak megosztva, és a teljes frissítési folyamat várhatóan 2 hétig tart. gpt-4 Az 1106-előzetes verzió, a 0125-Preview és a vision-preview "No autoupgrade" (Nincs automatikus frissítés) verzióra beállított központi telepítései nem lesznek frissítve, és a régióban az előzetes verzió frissítésekor leállnak. A frissítés időzítésével kapcsolatos további információkért tekintse meg az Azure OpenAI-modell kivonásait és elavulását .

GPT-3.5

A GPT-3.5 modellek képesek megérteni és létrehozni a természetes nyelvet vagy kódot. A GPT-3.5 család leginkább alkalmas és költséghatékony modellje a GPT-3.5 Turbo, amely csevegésre lett optimalizálva, és jól működik a hagyományos befejezési feladatokhoz is. A GPT-3.5 Turbo a Chat Completions API-val használható. A GPT-3.5 Turbo Instruct hasonló képességekkel text-davinci-003 rendelkezik a Befejezések API használatához a Csevegés befejezések API helyett. A GPT-3.5 Turbo és a GPT-3.5 Turbo Instruct örökölt GPT-3.5 és GPT-3 modellek használatát javasoljuk.

Modellazonosító Leírás Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
gpt-35-turbo (0125) ÚJ Legújabb GA-modell
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
- Nagyobb pontosság a kért formátumokban való válaszadáshoz.
– Kijavítottunk egy hibát, amely szövegkódolási hibát okozott a nem angol nyelvű függvényhívások esetében.
Bemenet: 16 385
Kimenet: 4096
2021. szeptember
gpt-35-turbo (1106) Régebbi GA-modell
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
Bemenet: 16 385
Kimenet: 4096
2021. szeptember
gpt-35-turbo-instruct (0914) Csak befejezési végpont 4,097 2021. szeptember
gpt-35-turbo-16k (0613) Régebbi GA-modell
- Alapszintű függvényhívás eszközökkel
16,384 2021. szeptember
gpt-35-turbo (0613) Régebbi GA-modell
- Alapszintű függvényhívás eszközökkel
4,096 2021. szeptember
gpt-35-turbo1 (0301) Régebbi GA-modell
- Nyugdíjazási információk
4,096 2021. szeptember

Ha többet szeretne megtudni a GPT-3.5 Turbo és a Csevegés befejezések API használatáról, tekintse meg részletes útmutatónkat.

1 Ez a modell 4096 jogkivonatot > fogad el. Nem ajánlott túllépni a 4096 bemeneti jogkivonat korlátját, mivel a modell újabb verziója 4096 jogkivonaton van leképezve. Ha 4096 bemeneti jogkivonat túllépésekor problémákat tapasztal ezzel a modellel, ez a konfiguráció hivatalosan nem támogatott.

Beágyazások

text-embedding-3-large A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek közötti frissítés nem lehetséges. Ahhoz, hogy áttérjen a használatról text-embedding-ada-002 , text-embedding-3-large új beágyazásokat kell létrehoznia.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

A tesztelés során az OpenAI a nagy és a kis harmadik generációs beágyazási modelleket is jobb átlagos többnyelvű lekérési teljesítményt nyújt a MIRACL-teljesítményteszttel , miközben továbbra is fenntartja az angol feladatok teljesítményét az MTEB-teljesítményteszttel .

Kiértékelési teljesítményteszt text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL-átlag 31.4 44.0 54.9
MTEB-átlag 61,0 62.3 64.6

A harmadik generációs beágyazási modellek támogatják a beágyazás méretének csökkentését egy új dimensions paraméterrel. A nagyobb beágyazások általában számítási, memória- és tárolási szempontból drágábbak. A dimenziók számának módosításához nagyobb mértékben szabályozható a teljes költség és a teljesítmény. A dimensions paraméter nem támogatott az OpenAI 1.x Python-kódtár minden verziójában, ezért javasoljuk, hogy a paramétert a legújabb verzióra frissítse: pip install openai --upgrade.

Az OpenAI MTEB benchmark-tesztje azt találta, hogy még akkor is, ha a harmadik generációs modell méretei 1536-nál text-embeddings-ada-002 kisebbre csökkennek, a teljesítmény kissé jobb marad.

DALL-E

A DALL-E modellek képeket hoznak létre a felhasználó által megadott szöveges kérésekből. A DALL-E 3 általánosan elérhető a REST API-khoz. A DALL-E 2 és a DALL-E 3 ügyféloldali SDK-kkal előzetes verzióban érhető el.

Suttogás

A Suttogó modellek szövegfelolvasáshoz használhatók.

A Whisper-modellt az Azure AI Speech kötegelt átírási API-val is használhatja. További információ az Azure AI Speech és az Azure OpenAI szolgáltatás használatáról: Mi a Whisper-modell?

Szövegfelolvasás (előzetes verzió)

A jelenleg előzetes verzióban elérhető OpenAI-szöveg-beszédmodellek a szöveg beszédszintézisére használhatók.

Az OpenAI szöveget az Azure AI Speech használatával is beszédre használhatja. További információ: OpenAI text to speech voices via Azure OpenAI Service vagy Azure AI Speech guide.

Modellösszesítő táblázat és régió rendelkezésre állása

Feljegyzés

Ez a cikk elsősorban a Standard üzembehelyezési típusokkal rendelkező összes Azure OpenAI-ügyfélre érvényes modell/régió rendelkezésre állását ismerteti. Egyes kiválasztott ügyfelek hozzáférhetnek az alábbi egyesített táblázatban nem szereplő modell-/régiókombinációkhoz. A kiépített üzembe helyezésekkel kapcsolatos további információkért tekintse meg a kiépített útmutatót.

Standard üzemi modell rendelkezésre állása

Régió gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 babbage-002, 1 dall-e-3, 3.0 davinci-002, 1 tts, 001 tts-hd, 001 whisper, 001
ausztráliaeast - - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - -
eastus - - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - - -
USA déli középső régiója - - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - - -
swedencentral - - - - - -
switzerlandnorth - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - -

Ez a táblázat nem tartalmazza a regionális rendelkezésre állás finomhangolását, erről a dedikált finomhangolási szakaszból tájékozódhat.

Standard üzemi modell kvótája

A modellek alapértelmezett kvótája modelltől és régiótól függően változik. Az alapértelmezett kvótakorlátok változhatnak.

A standard üzemelő példányok kvótáját a Tokens-Per-Minute (TPM) kifejezések ismertetik.

Régió GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V GPT-35-Turbo GPT-35-Turbo-Instruct Text-Embedding-Ada-002 text-embedding-3-small text-embedding-3-large Babbage-002 Babbage-002 - finetune Davinci-002 Davinci-002 - finetune GPT-35-Turbo - finetune GPT-35-Turbo-1106 - finetune GPT-35-Turbo-0125 - finetune
ausztráliaeast 40 K 80 K 80 K 30 K 300 K - 350 K - - - - - - - - -
brazilsouth - - - - - - 350 K - - - - - - - - -
canadaeast 40 K 80 K 80 K - 300 K - 350 K 350 K 350 K - - - - - - -
eastus - - 80 K - 240 K 240 K 240 K 350 K 350 K - - - - - - -
eastus2 - - 80 K - 300 K - 350 K 350 K 350 K - - - - 250 K 250 K 250 K
francecentral 20 e 60 K 80 K - 240 K - 240 K - - - - - - - - -
japaneast - - - 30 K 300 K - 350 K - - - - - - - - -
northcentralus - - 80 K - 300 K - 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
norwayeast - - 150 K - - - 350 K - - - - - - - - -
southafricanorth - - - - - - 350 K - - - - - - - - -
USA déli középső régiója - - 80 K - 240 K - 240 K - - - - - - - - -
southindia - - 150 K - 300 K - 350 K - - - - - - - - -
swedencentral 40 K 80 K 150 K 30 K 300 K 240 K 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
switzerlandnorth 40 K 80 K - 30 K 300 K - 350 K - - - - - - - - -
svájcwest - - - - - - - - - - 250 K - 250 K 250 K 250 K 250 K
uksouth - - 80 K - 240 K - 350 K - - - - - - - - -
westeurope - - - - 240 K - 240 K - - - - - - - - -
westus - - 80 K 30 K 300 K - 350 K - - - - - - - - -
westus3 - - 80 K - - - 350 K - - - - - - - - -

1 K = 1000 token/perc (TPM). A TPM és a percenkénti kérések (RPM) közötti kapcsolat jelenleg 6 RPM/1000 TPM-ként van definiálva.

Üzembehelyezési modell rendelkezésre állása

Régió gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125
ausztráliaeast -
brazilsouth - - -
canadacentral - - - -
canadaeast - - - -
eastus -
eastus2 -
francecentral - -
germanywestcentral - -
japaneast - - - -
koreacentral - - - -
northcentralus -
norwayeast - - - -
lengyelországcentral -
southafricanorth - - -
USA déli középső régiója -
southindia -
swedencentral
switzerlandnorth -
svájcwest - - - - - -
uksouth -
westus -
westus3

Feljegyzés

A Verzió kiépített verziója gpt-4:turbo-2024-04-09 jelenleg csak szövegre korlátozódik.

Hogyan hozzáférést kap a kiépítetthez?

A kiosztott átviteli sebesség beszerzéséhez a Microsoft értékesítési/fiókcsapatával kell beszélnie. Ha nincs értékesítési/fiókcsapata, sajnos jelenleg nem vásárolhat kiosztott átviteli sebességet.

A kiépített üzembe helyezésekkel kapcsolatos további információkért tekintse meg a kiépített útmutatót.

GPT-4 és GPT-4 Turbo modell rendelkezésre állása

Nyilvános felhőrégiók

Régió gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613
ausztráliaeast - -
canadaeast - - -
eastus - - - - -
eastus2 - - - -
francecentral - - -
japaneast - - - - -
northcentralus - - - - -
norwayeast - - - - -
USA déli középső régiója - - - - -
southindia - - - - -
swedencentral -
switzerlandnorth - - -
uksouth - - - -
westus - - - -
westus3 - - - - -

Ügyfélhozzáférés kiválasztása

A fenti régiók mellett, amelyek minden Azure OpenAI-ügyfél számára elérhetők, egyes kiválasztott, már meglévő ügyfelek további régiókban kaptak hozzáférést a GPT-4 verzióihoz:

Modell Régió
gpt-4 (0314) USA keleti régiója
Közép-Franciaország
USA déli középső régiója
Az Egyesült Királyság déli régiója
gpt-4 (0613) USA keleti régiója
USA 2. keleti régiója
Kelet-Japán
Az Egyesült Királyság déli régiója

Azure Government-régiók

Az Azure Governmentben az alábbi GPT-4 modellek érhetők el:

Modellazonosító Modell rendelkezésre állása
gpt-4 (1106-előzetes verzió) USA-beli államigazgatás – Virginia
USA-beli államigazgatás – Arizona

GPT-3.5 modellek

Fontos

Az ÚJ gpt-35-turbo (0125) modell számos fejlesztést tartalmaz, többek között nagyobb pontosságot a kért formátumokban való válaszadáshoz, valamint egy olyan hiba kijavítását, amely a nem angol nyelvű függvényhívások szövegkódolási hibáját okozta.

A GPT-3.5 Turbót a Chat Completion API-val együtt használják. A GPT-3.5 Turbo 0301-es verziója a Completions API-val is használható, bár ez nem ajánlott. A GPT-3.5 Turbo 0613- és 1106-os verziói csak a Chat Completions API-t támogatják.

A GPT-3.5 Turbo 0301-es verziója a modell első verziója. A 0613-es verzió a modell második verziója, és függvényhívási támogatást ad hozzá.

A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-3.5 Turbo-környezetek modellverzió-beállításainak megtekintéséhez és konfigurálásához.

Feljegyzés

A verzió 0613 és gpt-35-turbo-16kgpt-35-turbo a kivonás legkorábban 2024. augusztus 1-jére lesz kivezetve. A verzió 0301 legkésőbb gpt-35-turbo 2024. augusztus 1-jére megszűnik. A modellfrissítési viselkedést a modellfrissítési viselkedést tekintheti meg.

GPT-3.5-Turbo modell rendelkezésre állása

Nyilvános felhőrégiók

Régió gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
ausztráliaeast - - -
canadaeast - -
eastus - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - -
USA déli középső régiója - - - -
southindia - - - - -
swedencentral - -
switzerlandnorth - - - -
uksouth - -
westeurope - - - - -
westus - - - - -

Azure Government-régiók

Az Azure Governmentben az alábbi GPT-3.5 turbómodellek érhetők el:

Modellazonosító Modell rendelkezésre állása
gpt-35-turbo (1106-előzetes verzió) USA-beli államigazgatás – Virginia

Beágyazási modellek

Ezek a modellek csak API-kérések beágyazásával használhatók.

Feljegyzés

text-embedding-3-large A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek közötti frissítés nem lehetséges. A használatból text-embedding-ada-002text-embedding-3-large való migráláshoz új beágyazásokat kell létrehoznia.

Modellazonosító Maximális kérelem (jogkivonatok) Kimeneti dimenziók Betanítási adatok (naprakész)
text-embedding-ada-002 (2. verzió) 8,191 1,536 2021. szeptember
text-embedding-ada-002 (1. verzió) 2,046 1,536 2021. szeptember
text-embedding-3-large 8,191 3,072 2021. szeptember
text-embedding-3-small 8,191 1,536 2021. szeptember

Feljegyzés

Bemenetek tömbjének beágyazáshoz való küldésekor a tömbben lévő bemeneti elemek maximális száma a beágyazási végpontra irányuló hívásonként 2048.

Nyilvános felhőrégiók

Régió text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
ausztráliaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
francecentral - - -
japaneast - - -
northcentralus - - -
norwayeast - - -
southafricanorth - - -
USA déli középső régiója - -
southindia - - -
swedencentral - - -
switzerlandnorth - - -
uksouth - - -
westeurope - - -
westus - - -
westus3 - - -

Azure Government-régiók

A következő beágyazási modellek érhetők el az Azure Governmentben:

Modellazonosító Modell rendelkezésre állása
text-embedding-ada-002 (2. verzió) USA-beli államigazgatás – Virginia
USA-beli államigazgatás – Arizona

DALL-E modellek

Modellazonosító Funkció rendelkezésre állása Maximális kérelem (karakterek)
dalle2 (előzetes verzió) USA keleti régiója 1000
dall-e-3 USA keleti régiója, Kelet-Ausztrália, Közép-Svédország 4 000

Modellek finomhangolása

babbage-002 és davinci-002 nincsenek betanításuk az utasítások követésére. Ezeknek az alapmodelleknek a lekérdezése csak egy finomhangolt verzió hivatkozási pontjaként végezhető el a betanítás előrehaladásának kiértékeléséhez.

gpt-35-turbo - A modell finomhangolása a régiók egy részhalmazára korlátozódik, és nem érhető el minden régióban, ahol az alapmodell elérhető.

Modellazonosító Régiók finomhangolása Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
babbage-002 USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
16,384 2021. szeptember
davinci-002 USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
16,384 2021. szeptember
gpt-35-turbo (0613) USA 2. keleti régiója
USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
4,096 2021. szeptember
gpt-35-turbo (1106) USA 2. keleti régiója
USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
Bemenet: 16 385
Kimenet: 4096
2021. szeptember
gpt-35-turbo (0125) USA 2. keleti régiója
USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
16,385 2021. szeptember

Suttogó modellek

Modellazonosító Modell rendelkezésre állása Maximális kérelem (hangfájl mérete)
whisper USA 2. keleti régiója
USA északi középső régiója
Kelet-Norvégia
Dél-India
Svédország középső régiója
Nyugat-Európa
25 MB

Szöveg–beszédmodellek (előzetes verzió)

Modellazonosító Modell rendelkezésre állása
tts-1 USA északi középső régiója
Közép-Svédország
tts-1-hd USA északi középső régiója
Közép-Svédország

Asszisztensek (előzetes verzió)

Az Asszisztensek esetében egy támogatott modell és egy támogatott régió kombinációjára van szükség. Bizonyos eszközökhöz és képességekhez a legújabb modellek szükségesek. A következő modellek érhetők el az Assistants API-ban, az SDK-ban, az Azure AI Studióban és az Azure OpenAI Studióban. Az alábbi táblázat használatalapú fizetésre szolgál. A kiosztott átviteli egység (PTU) rendelkezésre állásáról további információt a kiosztott átviteli sebességben talál.

Régió gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106) gpt-4 (0125)
Kelet-Ausztrália
USA keleti régiója
USA 2. keleti régiója
Közép-Franciaország
Kelet-Norvégia
Közép-Svédország
Az Egyesült Királyság déli régiója

Következő lépések