Az Azure OpenAI Service modelljei
Az Azure OpenAI szolgáltatást különböző képességekkel és árpontokkal rendelkező modellek változatos halmaza működteti. A modellek elérhetősége régiónként változik. A GPT-3 és más, 2024 júliusában nyugdíjba vonuló modellekkel kapcsolatban lásd: Azure OpenAI Service legacy modellek.
Modellek | Leírás |
---|---|
GPT-4o > GPT-4 Turbo NEW | A legújabb, többmodális verziójú Azure OpenAI-modellek, amelyek bemenetként szövegeket és képeket is elfogadnak. |
GPT-4 | A GPT-3.5-ben fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és kódot. |
GPT-3.5 | A GPT-3-on fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és a kódot. |
Beágyazások | Olyan modellek készlete, amelyek a szöveg numerikus vektorformává alakíthatók a szöveg hasonlóságának megkönnyítése érdekében. |
DALL-E | Olyan modellek sorozata, amelyek eredeti képeket hozhatnak létre természetes nyelvről. |
Suttogás | Előzetes verziójú modellek sorozata, amelyek átírhatják és lefordíthatják a beszédet szöveggé. |
Szövegfelolvasás (előzetes verzió) | Egy előzetes verziójú modellsorozat, amely képes szövegfelolvasásra. |
GPT-4o és GPT-4 Turbo
A GPT-4o az OpenAI legújabb előzetes verziója. A GPT-4o egyetlen modellben integrálja a szöveget és a képeket, így egyszerre több adattípust is képes kezelni. Ez a multimodális megközelítés növeli a pontosságot és a válaszkészséget az emberi-számítógépes interakciókban. A GPT-4o megfelel a GPT-4 Turbo angol nyelvű szöveg- és kódolási feladatainak, miközben kiváló teljesítményt nyújt nem angol nyelvű és látási feladatokban, új teljesítményteszteket állít be az AI-képességekhez.
Korai hozzáférésű játszótér
A meglévő Azure OpenAI-ügyfelek kipróbálhatják a GPT-4o-t az Új Azure OpenAI Studio korai hozzáférésű játszótéren (előzetes verzió).
A legújabb modell tesztelése:
Feljegyzés
- A GPT-4o korai hozzáférésű játszótér jelenleg csak az USA 3. nyugati régiójában és az USA keleti régiójában található erőforrásokhoz érhető el, és előfizetésenként öt percenként 10 kérésre korlátozódik.
- Az Azure OpenAI szolgáltatással való visszaélés monitorozása minden korai hozzáférésű játszótér-felhasználó számára engedélyezve van, még akkor is, ha jóváhagyást ad a módosításra; az alapértelmezett tartalomszűrők engedélyezve vannak, és nem módosíthatók.
- A GPT-4o egy Azure OpenAI előzetes verziójú modell, és jelenleg nem érhető el üzembe helyezéshez/közvetlen API-hozzáféréshez.
- Lépjen az Azure OpenAI Studióba, https://oai.azure.com/ és jelentkezzen be olyan hitelesítő adatokkal, amelyek hozzáférnek az OpenAI-erőforrásokhoz.
- Válasszon egy Azure OpenAI-erőforrást az USA 3. nyugati régiójában vagy az USA keleti régiójában. Ha nem rendelkezik erőforrással ezen régiók egyikében, létre kell hoznia egy erőforrást.
- Az Azure OpenAI Studio fő lapján válassza a Korai hozzáférésű játszótér (előzetes verzió) gombot az Első lépések szakaszban. (Ez a gomb csak akkor lesz elérhető, ha egy erőforrás Az USA 3 . nyugati régiója vagy az USA keleti régiója van kiválasztva.)
- Most már ugyanúgy tehet fel kérdéseket a modellben, mint korábban a meglévő csevegési játszótéren.
GPT-4 Turbo
A GPT-4 Turbo egy nagy multimodális modell (szöveg- vagy képbemenetek elfogadása és szöveg generálása), amely nagyobb pontossággal képes megoldani a nehéz problémákat, mint az OpenAI korábbi modelljei. A GPT-3.5 Turbo és a régebbi GPT-4 modellekhez hasonlóan a GPT-4 Turbo is csevegésre van optimalizálva, és jól működik a hagyományos befejezési feladatokhoz.
A GPT-4 Turbo legújabb GA kiadása a következő:
gpt-4
Verzió:turbo-2024-04-09
Ez a következő előzetes modellek lecserélése:
gpt-4
Verzió:1106-Preview
gpt-4
Verzió:0125-Preview
gpt-4
Verzió:vision-preview
Az OpenAI és az Azure OpenAI GPT-4 Turbo GA modellek közötti különbségek
- Az OpenAI legújabb
0409
turbómodell verziója támogatja a JSON módot és a függvényeket, amelyek minden következtetési kérést meghívnak. - Az Azure OpenAI legújabb
turbo-2024-04-09
verziója jelenleg nem támogatja a JSON mód és a függvényhívás használatát, amikor következtetési kérelmeket készít képi (vision) bemenettel. A szövegalapú bemeneti kérések (képek nélküliimage_url
és beágyazott kérések) támogatják a JSON-módot és a függvényhívást.
Különbségek a gpt-4 vision-preview-tól
- Az Azure AI-specifikus Vision-fejlesztések a GPT-4 Turbo és a Vision integrációját nem támogatják a
gpt-4
Verzió:turbo-2024-04-09
. Ez magában foglalja az optikai karakterfelismerést (OCR), az objektumok földelését, a videoüzeneteket és az adatok képekkel való jobb kezelését.
GPT-4 Turbo kiosztott felügyelt rendelkezésre állás
gpt-4
Verzió:turbo-2024-04-09
standard és kiépített üzemelő példányokhoz is elérhető. A modell kiépített verziója jelenleg nem támogatja a kép-/látásbeli következtetési kérelmeket. A modell kiépített üzembe helyezései csak szöveges bemeneteket fogadnak el. A standard modelltelepítések szöveges és képi/látási következtetési kéréseket is elfogadnak.
Régiónkénti elérhetőség
A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a standard és a kiépített üzemelő példányok modellmátrixát.
A GPT-4 Turbo üzembe helyezése a Vision GA-val
Ha a GA-modellt a Studio felhasználói felületén szeretné üzembe helyezni, válassza ki GPT-4
, majd válassza ki a turbo-2024-04-09
verziót a legördülő menüből. A modell alapértelmezett kvótája megegyezik a gpt-4-turbo-2024-04-09
GPT-4-Turbo jelenlegi kvótával. Tekintse meg a regionális kvótakorlátokat.
GPT-4
A GPT-4 a GPT-4 Turbo elődje. Mind a GPT-4, mind a GPT-4 Turbo modellek alapmodelljének gpt-4
neve . A GPT-4 és a Turbo modellek között a modellverzió vizsgálatával lehet különbséget tenni.
gpt-4
Verzió0314
gpt-4
Verzió0613
gpt-4-32k
Verzió0613
A modellösszesítő táblázatban láthatja az egyes modellek által támogatott jogkivonat-környezet hosszát.
GPT-4 és GPT-4 Turbo modellek
- Ezek a modellek csak a Csevegés befejezése API-val használhatók.
A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-4 üzemelő példányok modellverzió-beállításainak megtekintéséhez és konfigurálásához.
Modellazonosító | Leírás | Maximális kérelem (jogkivonatok) | Betanítási adatok (legfeljebb) |
---|---|---|---|
gpt-4o (2024-05-13) GPT-4o (Omni) előzetes verzió |
Legújabb előzetes verziójú modell - Szöveg, képfeldolgozás - Nagyobb pontosság és válaszkészség - Parity with English text and coding tasks to GPT-4 Turbo with Vision - Kiváló teljesítmény nem angol nyelven és látási feladatokban - Jelenleg csak korai hozzáférésű játszótéren keresztül érhető el – Jelenleg nincs üzembe helyezés/API-hozzáférés |
Bemenet: 128 000 Kimenet: 4096 |
2023. október |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo és Vision |
Legújabb GA-modell - Az összes korábbi GPT-4 előzetes modell cseréje ( vision-preview , 1106-Preview , ). 0125-Preview - A funkciók rendelkezésre állása jelenleg eltérő a bemeneti módszertől és az üzembe helyezés típusától függően. - Nem támogatja a fejlesztéseket. |
Bemenet: 128 000 Kimenet: 4096 |
2023. december |
gpt-4 (0125-Preview)*GPT-4 Turbo előzetes verzió |
Mintamodell -Lecseréli az 1106-előzetes verziót – Jobb kódgenerálási teljesítmény – Csökkenti azokat az eseteket, amikor a modell nem végez el feladatot - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) |
Bemenet: 128 000 Kimenet: 4096 |
2023. december |
gpt-4 (vision-preview)GPT-4 Turbo a Vision Előzetes verzióval |
Mintamodell – Szöveg- és képbevitelt fogad el. - Támogatja a fejlesztéseket - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) |
Bemenet: 128 000 Kimenet: 4096 |
2023. ápr. |
gpt-4 (1106-előzetes verzió)GPT-4 Turbo előzetes verzió |
Mintamodell - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) |
Bemenet: 128 000 Kimenet: 4096 |
2023. ápr. |
gpt-4-32k (0613) |
Régebbi GA-modell - Alapszintű függvényhívás eszközökkel |
32,768 | 2021. szeptember |
gpt-4 (0613) |
Régebbi GA-modell - Alapszintű függvényhívás eszközökkel |
8,192 | 2021. szeptember |
gpt-4-32k (0314) |
Régebbi GA-modell - Nyugdíjazási információk |
32,768 | 2021. szeptember |
gpt-4 (0314) |
Régebbi GA-modell - Nyugdíjazási információk |
8,192 | 2021. szeptember |
Figyelemfelhívás
Nem javasoljuk, hogy éles környezetben használjunk előzetes verziójú modelleket. Az előzetes modellek összes üzembe helyezését a jövőbeni előzetes verzióra vagy a legújabb stabil/GA verzióra frissítjük. Az előzetes verzióra kijelölt modellek nem követik a standard Azure OpenAI-modell életciklusát.
Feljegyzés
A verziót 0314
gpt-4
gpt-4-32k
legkésőbb 2024. július 5-én kivonjuk. A verziót 0613
gpt-4
gpt-4-32k
legkésőbb 2024. szeptember 30-án kivonjuk. A modellfrissítési viselkedést a modellfrissítési viselkedést tekintheti meg.
- A GPT-4 0125-előzetes verziója a GPT-4 Turbo előzetes verzió frissített verziója, amely korábban 1106-os előzetes verzióként jelent meg.
- A GPT-4 0125-előzetes verziója olyan feladatokat hajt végre, mint a kódlétrehozás a gpt-4-1106-előzetes verzióhoz képest. Emiatt a feladattól függően az ügyfelek azt tapasztalhatják, hogy a GPT-4-0125-preview több kimenetet generál a gpt-4-1106-preview-hoz képest. Javasoljuk, hogy az ügyfelek hasonlítsák össze az új modell kimeneteit. A GPT-4-0125-preview a gpt-4-1106-preview hibáit is elhárítja, a nem angol nyelvű UTF-8 kezeléssel.
- A GPT-4 verzió
turbo-2024-04-09
a legújabb GA-kiadás, és lecseréli0125-Preview
a ,1106-preview
ésvision-preview
.
Fontos
gpt-4
Az 1106-preview, a 0125-Preview és a vision-preview verziók a jövőben stabil verzióvalgpt-4
lesznek frissítve.gpt-4
Az 1106-előzetes verzió, a 0125-preview és a vision-preview "Automatikus frissítés alapértelmezettre" értékre van állítva, és a "Frissítés, ha lejárt" a stabil verzió kiadása után frissülni fog. Minden üzemelő példány esetében a modellverzió frissítése az API-hívások szolgáltatásának megszakítása nélkül történik. A frissítések régiónként vannak megosztva, és a teljes frissítési folyamat várhatóan 2 hétig tart.gpt-4
Az 1106-előzetes verzió, a 0125-Preview és a vision-preview "No autoupgrade" (Nincs automatikus frissítés) verzióra beállított központi telepítései nem lesznek frissítve, és a régióban az előzetes verzió frissítésekor leállnak. A frissítés időzítésével kapcsolatos további információkért tekintse meg az Azure OpenAI-modell kivonásait és elavulását .
GPT-3.5
A GPT-3.5 modellek képesek megérteni és létrehozni a természetes nyelvet vagy kódot. A GPT-3.5 család leginkább alkalmas és költséghatékony modellje a GPT-3.5 Turbo, amely csevegésre lett optimalizálva, és jól működik a hagyományos befejezési feladatokhoz is. A GPT-3.5 Turbo a Chat Completions API-val használható. A GPT-3.5 Turbo Instruct hasonló képességekkel text-davinci-003
rendelkezik a Befejezések API használatához a Csevegés befejezések API helyett. A GPT-3.5 Turbo és a GPT-3.5 Turbo Instruct örökölt GPT-3.5 és GPT-3 modellek használatát javasoljuk.
Modellazonosító | Leírás | Maximális kérelem (jogkivonatok) | Betanítási adatok (legfeljebb) |
---|---|---|---|
gpt-35-turbo (0125) ÚJ |
Legújabb GA-modell - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) - Nagyobb pontosság a kért formátumokban való válaszadáshoz. – Kijavítottunk egy hibát, amely szövegkódolási hibát okozott a nem angol nyelvű függvényhívások esetében. |
Bemenet: 16 385 Kimenet: 4096 |
2021. szeptember |
gpt-35-turbo (1106) |
Régebbi GA-modell - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) |
Bemenet: 16 385 Kimenet: 4096 |
2021. szeptember |
gpt-35-turbo-instruct (0914) |
Csak befejezési végpont | 4,097 | 2021. szeptember |
gpt-35-turbo-16k (0613) |
Régebbi GA-modell - Alapszintű függvényhívás eszközökkel |
16,384 | 2021. szeptember |
gpt-35-turbo (0613) |
Régebbi GA-modell - Alapszintű függvényhívás eszközökkel |
4,096 | 2021. szeptember |
gpt-35-turbo 1 (0301) |
Régebbi GA-modell - Nyugdíjazási információk |
4,096 | 2021. szeptember |
Ha többet szeretne megtudni a GPT-3.5 Turbo és a Csevegés befejezések API használatáról, tekintse meg részletes útmutatónkat.
1 Ez a modell 4096 jogkivonatot > fogad el. Nem ajánlott túllépni a 4096 bemeneti jogkivonat korlátját, mivel a modell újabb verziója 4096 jogkivonaton van leképezve. Ha 4096 bemeneti jogkivonat túllépésekor problémákat tapasztal ezzel a modellel, ez a konfiguráció hivatalosan nem támogatott.
Beágyazások
text-embedding-3-large
A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek közötti frissítés nem lehetséges. Ahhoz, hogy áttérjen a használatról text-embedding-ada-002
, text-embedding-3-large
új beágyazásokat kell létrehoznia.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
A tesztelés során az OpenAI a nagy és a kis harmadik generációs beágyazási modelleket is jobb átlagos többnyelvű lekérési teljesítményt nyújt a MIRACL-teljesítményteszttel , miközben továbbra is fenntartja az angol feladatok teljesítményét az MTEB-teljesítményteszttel .
Kiértékelési teljesítményteszt | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
MIRACL-átlag | 31.4 | 44.0 | 54.9 |
MTEB-átlag | 61,0 | 62.3 | 64.6 |
A harmadik generációs beágyazási modellek támogatják a beágyazás méretének csökkentését egy új dimensions
paraméterrel. A nagyobb beágyazások általában számítási, memória- és tárolási szempontból drágábbak. A dimenziók számának módosításához nagyobb mértékben szabályozható a teljes költség és a teljesítmény. A dimensions
paraméter nem támogatott az OpenAI 1.x Python-kódtár minden verziójában, ezért javasoljuk, hogy a paramétert a legújabb verzióra frissítse: pip install openai --upgrade
.
Az OpenAI MTEB benchmark-tesztje azt találta, hogy még akkor is, ha a harmadik generációs modell méretei 1536-nál text-embeddings-ada-002
kisebbre csökkennek, a teljesítmény kissé jobb marad.
DALL-E
A DALL-E modellek képeket hoznak létre a felhasználó által megadott szöveges kérésekből. A DALL-E 3 általánosan elérhető a REST API-khoz. A DALL-E 2 és a DALL-E 3 ügyféloldali SDK-kkal előzetes verzióban érhető el.
Suttogás
A Suttogó modellek szövegfelolvasáshoz használhatók.
A Whisper-modellt az Azure AI Speech kötegelt átírási API-val is használhatja. További információ az Azure AI Speech és az Azure OpenAI szolgáltatás használatáról: Mi a Whisper-modell?
Szövegfelolvasás (előzetes verzió)
A jelenleg előzetes verzióban elérhető OpenAI-szöveg-beszédmodellek a szöveg beszédszintézisére használhatók.
Az OpenAI szöveget az Azure AI Speech használatával is beszédre használhatja. További információ: OpenAI text to speech voices via Azure OpenAI Service vagy Azure AI Speech guide.
Modellösszesítő táblázat és régió rendelkezésre állása
Feljegyzés
Ez a cikk elsősorban a Standard üzembehelyezési típusokkal rendelkező összes Azure OpenAI-ügyfélre érvényes modell/régió rendelkezésre állását ismerteti. Egyes kiválasztott ügyfelek hozzáférhetnek az alábbi egyesített táblázatban nem szereplő modell-/régiókombinációkhoz. A kiépített üzembe helyezésekkel kapcsolatos további információkért tekintse meg a kiépített útmutatót.
Standard üzemi modell rendelkezésre állása
Régió | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 | babbage-002, 1 | dall-e-3, 3.0 | davinci-002, 1 | tts, 001 | tts-hd, 001 | whisper, 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ausztráliaeast | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - |
eastus | - | - | ✅ | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - |
eastus2 | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ |
francecentral | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
japaneast | - | - | - | ✅ | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | - | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
USA déli középső régiója | - | - | ✅ | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
westus3 | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - |
Ez a táblázat nem tartalmazza a regionális rendelkezésre állás finomhangolását, erről a dedikált finomhangolási szakaszból tájékozódhat.
Standard üzemi modell kvótája
A modellek alapértelmezett kvótája modelltől és régiótól függően változik. Az alapértelmezett kvótakorlátok változhatnak.
A standard üzemelő példányok kvótáját a Tokens-Per-Minute (TPM) kifejezések ismertetik.
Régió | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | GPT-35-Turbo | GPT-35-Turbo-Instruct | Text-Embedding-Ada-002 | text-embedding-3-small | text-embedding-3-large | Babbage-002 | Babbage-002 - finetune | Davinci-002 | Davinci-002 - finetune | GPT-35-Turbo - finetune | GPT-35-Turbo-1106 - finetune | GPT-35-Turbo-0125 - finetune |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ausztráliaeast | 40 K | 80 K | 80 K | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
canadaeast | 40 K | 80 K | 80 K | - | 300 K | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - |
eastus | - | - | 80 K | - | 240 K | 240 K | 240 K | 350 K | 350 K | - | - | - | - | - | - | - |
eastus2 | - | - | 80 K | - | 300 K | - | 350 K | 350 K | 350 K | - | - | - | - | 250 K | 250 K | 250 K |
francecentral | 20 e | 60 K | 80 K | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 K | - | 300 K | - | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K |
norwayeast | - | - | 150 K | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
USA déli középső régiója | - | - | 80 K | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 K | - | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
swedencentral | 40 K | 80 K | 150 K | 30 K | 300 K | 240 K | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K |
switzerlandnorth | 40 K | 80 K | - | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
svájcwest | - | - | - | - | - | - | - | - | - | - | 250 K | - | 250 K | 250 K | 250 K | 250 K |
uksouth | - | - | 80 K | - | 240 K | - | 350 K | - | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 K | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
westus3 | - | - | 80 K | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
1 K = 1000 token/perc (TPM). A TPM és a percenkénti kérések (RPM) közötti kapcsolat jelenleg 6 RPM/1000 TPM-ként van definiálva.
Üzembehelyezési modell rendelkezésre állása
Régió | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|
ausztráliaeast | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
brazilsouth | ✅ | ✅ | - | - | ✅ | ✅ | - |
canadacentral | ✅ | - | - | - | ✅ | - | ✅ |
canadaeast | ✅ | ✅ | - | - | - | ✅ | - |
eastus | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - | ✅ |
germanywestcentral | ✅ | ✅ | ✅ | - | ✅ | ✅ | - |
japaneast | - | ✅ | ✅ | - | - | - | ✅ |
koreacentral | ✅ | - | - | - | ✅ | ✅ | - |
northcentralus | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
norwayeast | ✅ | - | ✅ | - | ✅ | - | - |
lengyelországcentral | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
southafricanorth | ✅ | ✅ | - | - | ✅ | ✅ | - |
USA déli középső régiója | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
southindia | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
svájcwest | - | - | - | - | - | - | ✅ |
uksouth | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Feljegyzés
A Verzió kiépített verziója gpt-4
:turbo-2024-04-09
jelenleg csak szövegre korlátozódik.
Hogyan hozzáférést kap a kiépítetthez?
A kiosztott átviteli sebesség beszerzéséhez a Microsoft értékesítési/fiókcsapatával kell beszélnie. Ha nincs értékesítési/fiókcsapata, sajnos jelenleg nem vásárolhat kiosztott átviteli sebességet.
A kiépített üzembe helyezésekkel kapcsolatos további információkért tekintse meg a kiépített útmutatót.
GPT-4 és GPT-4 Turbo modell rendelkezésre állása
Nyilvános felhőrégiók
Régió | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 |
---|---|---|---|---|---|---|
ausztráliaeast | ✅ | ✅ | - | ✅ | - | ✅ |
canadaeast | ✅ | ✅ | - | - | - | ✅ |
eastus | - | - | ✅ | - | - | - |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | - | - | - | ✅ |
japaneast | - | - | - | ✅ | - | - |
northcentralus | - | - | ✅ | - | - | - |
norwayeast | - | ✅ | - | - | - | - |
USA déli középső régiója | - | - | ✅ | - | - | - |
southindia | - | ✅ | - | - | - | - |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | ✅ |
uksouth | - | ✅ | ✅ | - | - | - |
westus | - | ✅ | - | ✅ | - | - |
westus3 | - | ✅ | - | - | - | - |
Ügyfélhozzáférés kiválasztása
A fenti régiók mellett, amelyek minden Azure OpenAI-ügyfél számára elérhetők, egyes kiválasztott, már meglévő ügyfelek további régiókban kaptak hozzáférést a GPT-4 verzióihoz:
Modell | Régió |
---|---|
gpt-4 (0314) |
USA keleti régiója Közép-Franciaország USA déli középső régiója Az Egyesült Királyság déli régiója |
gpt-4 (0613) |
USA keleti régiója USA 2. keleti régiója Kelet-Japán Az Egyesült Királyság déli régiója |
Azure Government-régiók
Az Azure Governmentben az alábbi GPT-4 modellek érhetők el:
Modellazonosító | Modell rendelkezésre állása |
---|---|
gpt-4 (1106-előzetes verzió) |
USA-beli államigazgatás – Virginia USA-beli államigazgatás – Arizona |
GPT-3.5 modellek
Fontos
Az ÚJ gpt-35-turbo (0125)
modell számos fejlesztést tartalmaz, többek között nagyobb pontosságot a kért formátumokban való válaszadáshoz, valamint egy olyan hiba kijavítását, amely a nem angol nyelvű függvényhívások szövegkódolási hibáját okozta.
A GPT-3.5 Turbót a Chat Completion API-val együtt használják. A GPT-3.5 Turbo 0301-es verziója a Completions API-val is használható, bár ez nem ajánlott. A GPT-3.5 Turbo 0613- és 1106-os verziói csak a Chat Completions API-t támogatják.
A GPT-3.5 Turbo 0301-es verziója a modell első verziója. A 0613-es verzió a modell második verziója, és függvényhívási támogatást ad hozzá.
A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-3.5 Turbo-környezetek modellverzió-beállításainak megtekintéséhez és konfigurálásához.
Feljegyzés
A verzió 0613
és gpt-35-turbo-16k
gpt-35-turbo
a kivonás legkorábban 2024. augusztus 1-jére lesz kivezetve. A verzió 0301
legkésőbb gpt-35-turbo
2024. augusztus 1-jére megszűnik. A modellfrissítési viselkedést a modellfrissítési viselkedést tekintheti meg.
GPT-3.5-Turbo modell rendelkezésre állása
Nyilvános felhőrégiók
Régió | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 |
---|---|---|---|---|---|---|
ausztráliaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
eastus | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
USA déli középső régiója | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
swedencentral | - | ✅ | ✅ | - | ✅ | ✅ |
switzerlandnorth | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
Azure Government-régiók
Az Azure Governmentben az alábbi GPT-3.5 turbómodellek érhetők el:
Modellazonosító | Modell rendelkezésre állása |
---|---|
gpt-35-turbo (1106-előzetes verzió) |
USA-beli államigazgatás – Virginia |
Beágyazási modellek
Ezek a modellek csak API-kérések beágyazásával használhatók.
Feljegyzés
text-embedding-3-large
A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek közötti frissítés nem lehetséges. A használatból text-embedding-ada-002
text-embedding-3-large
való migráláshoz új beágyazásokat kell létrehoznia.
Modellazonosító | Maximális kérelem (jogkivonatok) | Kimeneti dimenziók | Betanítási adatok (naprakész) |
---|---|---|---|
text-embedding-ada-002 (2. verzió) |
8,191 | 1,536 | 2021. szeptember |
text-embedding-ada-002 (1. verzió) |
2,046 | 1,536 | 2021. szeptember |
text-embedding-3-large |
8,191 | 3,072 | 2021. szeptember |
text-embedding-3-small |
8,191 | 1,536 | 2021. szeptember |
Feljegyzés
Bemenetek tömbjének beágyazáshoz való küldésekor a tömbben lévő bemeneti elemek maximális száma a beágyazási végpontra irányuló hívásonként 2048.
Nyilvános felhőrégiók
Régió | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 |
---|---|---|---|---|
ausztráliaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | - |
japaneast | - | ✅ | - | - |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | - |
southafricanorth | - | ✅ | - | - |
USA déli középső régiója | ✅ | ✅ | - | - |
southindia | - | ✅ | - | - |
swedencentral | - | ✅ | - | - |
switzerlandnorth | - | ✅ | - | - |
uksouth | - | ✅ | - | - |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | - |
Azure Government-régiók
A következő beágyazási modellek érhetők el az Azure Governmentben:
Modellazonosító | Modell rendelkezésre állása |
---|---|
text-embedding-ada-002 (2. verzió) |
USA-beli államigazgatás – Virginia USA-beli államigazgatás – Arizona |
DALL-E modellek
Modellazonosító | Funkció rendelkezésre állása | Maximális kérelem (karakterek) |
---|---|---|
dalle2 (előzetes verzió) | USA keleti régiója | 1000 |
dall-e-3 | USA keleti régiója, Kelet-Ausztrália, Közép-Svédország | 4 000 |
Modellek finomhangolása
babbage-002
és davinci-002
nincsenek betanításuk az utasítások követésére. Ezeknek az alapmodelleknek a lekérdezése csak egy finomhangolt verzió hivatkozási pontjaként végezhető el a betanítás előrehaladásának kiértékeléséhez.
gpt-35-turbo
- A modell finomhangolása a régiók egy részhalmazára korlátozódik, és nem érhető el minden régióban, ahol az alapmodell elérhető.
Modellazonosító | Régiók finomhangolása | Maximális kérelem (jogkivonatok) | Betanítási adatok (legfeljebb) |
---|---|---|---|
babbage-002 |
USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
16,384 | 2021. szeptember |
davinci-002 |
USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
16,384 | 2021. szeptember |
gpt-35-turbo (0613) |
USA 2. keleti régiója USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
4,096 | 2021. szeptember |
gpt-35-turbo (1106) |
USA 2. keleti régiója USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
Bemenet: 16 385 Kimenet: 4096 |
2021. szeptember |
gpt-35-turbo (0125) |
USA 2. keleti régiója USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
16,385 | 2021. szeptember |
Suttogó modellek
Modellazonosító | Modell rendelkezésre állása | Maximális kérelem (hangfájl mérete) |
---|---|---|
whisper |
USA 2. keleti régiója USA északi középső régiója Kelet-Norvégia Dél-India Svédország középső régiója Nyugat-Európa |
25 MB |
Szöveg–beszédmodellek (előzetes verzió)
Modellazonosító | Modell rendelkezésre állása |
---|---|
tts-1 |
USA északi középső régiója Közép-Svédország |
tts-1-hd |
USA északi középső régiója Közép-Svédország |
Asszisztensek (előzetes verzió)
Az Asszisztensek esetében egy támogatott modell és egy támogatott régió kombinációjára van szükség. Bizonyos eszközökhöz és képességekhez a legújabb modellek szükségesek. A következő modellek érhetők el az Assistants API-ban, az SDK-ban, az Azure AI Studióban és az Azure OpenAI Studióban. Az alábbi táblázat használatalapú fizetésre szolgál. A kiosztott átviteli egység (PTU) rendelkezésre állásáról további információt a kiosztott átviteli sebességben talál.
Régió | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
---|---|---|---|---|---|
Kelet-Ausztrália | ✅ | ✅ | ✅ | ✅ | |
USA keleti régiója | ✅ | ✅ | |||
USA 2. keleti régiója | ✅ | ✅ | ✅ | ||
Közép-Franciaország | ✅ | ✅ | ✅ | ✅ | |
Kelet-Norvégia | ✅ | ||||
Közép-Svédország | ✅ | ✅ | ✅ | ✅ | |
Az Egyesült Királyság déli régiója | ✅ | ✅ | ✅ | ✅ |