Azure OpenAI 服務模型

Azure OpenAI 服務是由一組具有不同功能和價格點的各種模型提供。 模型供應情形因區域而異 如需 2024 年 7 月淘汰的 GPT-3 和其他模型相關資訊,請參閱 Azure OpenAI 服務舊模型

模型 描述
GPT-4 一組在 GPT-3.5 上獲得改善的模型,可以了解及產生自然語言和程式碼。
GPT-3.5 一組在 GPT-3 上獲得改善的模型,可以了解及產生自然語言和程式碼。
內嵌 一組可將文字轉換成數值向量形式,以輔助文字相似性的模型。
DALL-E 一系列可從自然語言產生原始影像的模型。
耳語 預覽版中的一系列模型,可將語音轉譯和翻譯為文字。
文字轉換語音 (預覽版) 預覽版中的一系列模型,可以合成文字轉換語音。

GPT-4 和 GPT-4 Turbo 預覽版

GPT-4 是大型多模式模型 (接受文字或影像輸入並產生文字),可比 OpenAI 先前任何模型更精確地解決困難的問題。 與 GPT-3.5 Turbo 一樣,GPT-4 已針對聊天進行最佳化,且適用於傳統的完成工作。 使用聊天完成 API 來使用 GPT-4。 若要深入了解如何與 GPT-4 和聊天完成 API 進行互動,請參閱我們的深入操作說明

包含視覺功能的 GPT-4 Turbo 是接受影像輸入的 GPT-4 版本。 它作為 gpt-4vision-preview 模型提供。

  • gpt-4
  • gpt-4-32k

您可以在模型摘要資料表中看到每個模型所支援的權杖內容長度。

GPT-3.5

GPT-3.5 模型可以了解並產生自然語言或程式碼。 GPT-3.5 系列中功能最強大且符合成本效益的模型是 GPT-3.5 Turbo,已針對聊天進行最佳化,也適用於傳統的完成工作。 GPT-3.5 Turbo 可與聊天完成 API 搭配使用。 GPT-3.5 Turbo Instruct 具有與使用完成 API 而非聊天完成 API 類似的功能 text-davinci-003。 我們建議使用 GPT-3.5 Turbo 和 GPT-3.5 Turbo Instruct,而不是舊版 GPT-3.5 和 GPT-3 模型

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo-instruct

您可以在模型摘要資料表中看到每個模型所支援的權杖內容長度。

若要深入了解如何與 GPT-3.5 Turbo 和聊天完成 API 進行互動,請參閱我們的深入操作說明

Embeddings

text-embedding-3-large 是最新且功能最強的內嵌模型。 無法在內嵌模型之間進行升級。 若要從使用 text-embedding-ada-002 移轉至 text-embedding-3-large,您必須產生新的內嵌。

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

在測試中,OpenAI 報告顯示大型和小型第三代內嵌模型在 MIRACL 基準中提供了更好的平均多語言擷取效能,同時仍在 MTEB 基準中保持了英文工作的效能。

評估基準 text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL 平均值 31.4 44.0 54.9
MTEB 平均值 61.0 62.3 64.6

第三代內嵌模型支援透過新的 dimensions 參數減少內嵌的大小。 一般而言,從計算、記憶體和儲存體的觀點來看,較大的內嵌成本會更高。 調整維度數目的功能可讓您更充分掌控整體成本和效能。 OpenAI 1.x Python 程式庫的所有版本都不支援 dimensions 參數,若要利用此參數,建議您升級至最新版本:pip install openai --upgrade

OpenAI 的 MTEB 基準測試發現,即使第三代模型的維度減少到小於 text-embeddings-ada-002 1,536 個維度,效能還是稍微好一些。

DALL-E

DALL-E 模型會從使用者提供的文字提示產生影像。 DALL-E 3 通常可用於 REST API。 具有用戶端 SDK 的 DALL-E 2 和 DALL-E 3 處於預覽狀態。

耳語

Whisper 模型可用於語音轉換文字。

您還可以透過 Azure AI 語音批次轉譯 API 使用 Whisper 模型。 請參閱什麼是 Whisper 模型?深入了解何時使用 Azure AI 語音與Azure OpenAI 服務。

文字轉換語音 (預覽版)

OpenAI 文字轉換語音模型 (目前為預覽版) 可用於合成文字轉換語音。

您也可以透過 Azure AI 語音使用 OpenAI 文字轉換語音聲音。 若要深入了解,請參閱透過 Azure OpenAI 服務或透過 Azure AI 語音實現 OpenAI 文字轉換語音聲音指南。

模型摘要資料表和區域可用性

注意

本文僅涵蓋適用於所有 Azure OpenAI 客戶且部署類型為 Standard模型/區域可用性。 某些選取的客戶可以存取下列統一數據表中未列出的模型/區域組合。 這些數據表也不適用於只有 具有自己唯一模型/區域可用性矩陣的已布建 部署類型的客戶。 如需布建部署的詳細資訊,請參閱我們的布建指引

標準部署模型可用性

Region gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 babbage-002, 1 dall-e-3, 3.0 davinci-002, 1 tts, 001 tts-hd, 001 whisper, 001
australiaeast - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - -
eastus - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - -
swedencentral - - - - - -
switzerlandnorth - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - -

下表不包含微調區域可用性,如需這項資訊,請參閱專用 的微調區段

標準部署模型配額

模型的預設配額會因模型和區域而異。 默認配額限制可能會變更。

標準部署的配額會以 每分鐘令牌(TPM)來說明。

區域 GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V GPT-35-Turbo GPT-35-Turbo-指示 Text-Embedding-Ada-002 text-embedding-3-small text-embedding-3-large Babbage-002 Babbage-002 - finetune Davinci-002 達文奇-002 - 微調 GPT-35-Turbo - 微調 GPT-35-Turbo-1106 - 微調 GPT-35-Turbo-0125 - 微調
australiaeast 40 K 80 K 80 K 30 K 300 K - 350 K - - - - - - - - -
brazilsouth - - - - - - 350 K - - - - - - - - -
canadaeast 40 K 80 K 80 K - 300 K - 350 K 350 K 350 K - - - - - - -
eastus - - 80 K - 240 K 240 K 240 K 350 K 350 K - - - - - - -
eastus2 - 80 K 80 K - 300 K - 350 K 350 K 350 K - - - - 250 K 250 K 250 K
francecentral 20 K 60 K 80 K - 240 K - 240 K - - - - - - - - -
japaneast - - - 30 K 300 K - 350 K - - - - - - - - -
northcentralus - - 80 K - 300 K - 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
norwayeast - - 150 K - - - 350 K - - - - - - - - -
southafricanorth - - - - - - 350 K - - - - - - - - -
southcentralus - - 80 K - 240 K - 240 K - - - - - - - - -
southindia - - 150 K - 300 K - 350 K - - - - - - - - -
swedencentral 40 K 80 K 150 K 30 K 300 K 240 K 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
switzerlandnorth 40 K 80 K - 30 K 300 K - 350 K - - - - - - - - -
switzerlandwest - - - - - - - - - - 250 K - 250 K 250 K 250 K 250 K
uksouth - - 80 K - 240 K - 350 K - - - - - - - - -
westeurope - - - - 240 K - 240 K - - - - - - - - -
westus - - 80 K 30 K 300 K - 350 K - - - - - - - - -
westus3 - - - - - - 350 K - - - - - - - - -

1 K = 每分鐘 1000 個令牌(TPM)。 TPM 與每分鐘要求 (RPM) 之間的關聯性目前定義為每 1000 TPM 6 RPM。

GPT-4 和 GPT-4 Turbo 預覽版模型

GPT-4、GPT-4-32k 和包含視覺功能的 GPT-4 Turbo現在可供所有 Azure OpenAI 服務客戶使用。 可用性因區域而異。 如果沒有在您的區域中看到 GPT-4,請稍後返回查看。

這些模型只能與聊天完成 API 搭配使用。

GPT-4 0314 版是該模型發行的第一個版本。 版本 0613 是模型的第二個版本,並新增了函式呼叫支援。

請參閱模型版本,了解 Azure OpenAI 服務如何處理模型版本升級,以及使用模型了解如何檢視和設定 GPT-4 部署的模型版本設定。

注意

gpt-4gpt-4-32k 的版本 0314 將在 2024 年 7 月 5 日或之後淘汰。 gpt-4gpt-4-32k 的版本 0613 將在 2024 年 9 月 30 日或之後淘汰。 如需了解模型升級行為,請參閱模型更新

GPT-4 版本 0125-preview 是先前發行為 1106-preview 版 GPT-4 Turbo 預覽版的更新版本。 與 gpt-4-1106-preview 相比,GPT-4 版本 0125-preview 更完整地完成程式碼產生等工作。 因此,根據工作的不同,客戶可能會發現 GPT-4-0125-preview 比 gpt-4-1106-preview 產生更多的輸出。 我們建議客戶比較新模型的輸出。 GPT-4-0125-preview 也會解決 gpt-4-1106-preview 中針對非英文語言的 UTF-8 處理中的錯誤 (bug)。

重要

  • gpt-4 版本 1106-Preview 和 0125-Preview 將會在未來使用穩定版本的 gpt-4 升級。 2024 年 3 月 8 日已排程的 gpt-4 1106-Preview 部署升級至 gpt-4 0125-Preview。 gpt-4版本 1106-Preview 和 0125-Preview 的部署會設定為「預設自動更新」,而「過期時升級」將會在穩定版本發行后開始升級。 針對每個部署,模型版本升級會在服務中不中斷 API 呼叫。 升級會依區域暫存,且完整升級程式預期需要 2 周的時間。 gpt-4版本 1106-Preview 和 0125-Preview 的部署不會升級為「無自動升級」,且會在區域中升級預覽版本時停止運作。
Model ID 要求上限 (權杖) 訓練資料 (上限)
gpt-4 (0314) 8,192 2021 年 9 月
gpt-4-32k(0314) 32,768 2021 年 9 月
gpt-4 (0613) 8,192 2021 年 9 月
gpt-4-32k (0613) 32,768 2021 年 9 月
gpt-4 (1106-Preview)1
GPT-4 Turbo 預覽版
輸入:128,000
輸出:4,096
2023 年 4 月
gpt-4 (0125-Preview)1
GPT-4 Turbo 預覽版
輸入:128,000
輸出:4,096
2023 年 12 月
gpt-4 (vision-preview)2
包含視覺功能的 GPT-4 Turbo 預覽版
輸入:128,000
輸出:4,096
2023 年 4 月

1 GPT-4 Turbo Preview = gpt-4 (0125-Preview) 或 gpt-4 (1106-Preview)。 若要部署此模型,請在 [部署] 底下,選取模型 [gpt-4]。 在版本下選取 [0125-Preview] 或 [1106-Preview]。

2 包含視覺功能的 GPT-4 Turbo 預覽版 = gpt-4 (vision-preview)。 若要部署此模型,請在 [部署] 底下,選取模型 [gpt-4]。 對於 [模型版本],請選取 [vision-preview]。

警告

我們不建議在生產環境中使用預覽模型。 我們會將預覽模型的所有部署升級至未來的預覽版本和穩定版本。 指定的模型預覽版不遵循標準的 Azure OpenAI 模型生命週期。

注意

GPT-4 (0314) & (0613) 列為可用的區域將有權存取 8K 和 32K 版本的模型

GPT-4 和 GPT-4 Turbo 預覽版模型可用性

公用雲端區域

Region gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4-32k, 0613
australiaeast -
canadaeast - -
eastus - - - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - - -
norwayeast - - - -
southcentralus - - - -
southindia - - - -
swedencentral -
switzerlandnorth - -
uksouth - - - -
westus - - -

選取客戶存取權

除了上述可供所有 Azure OpenAI 客戶使用的區域之外,某些選取的現有客戶已獲授與其他區域中 GPT-4 版本的存取權:

模型 區域
gpt-4 (0314) 美國東部
法國中部
美國中南部
英國南部
gpt-4 (0613) 美國東部
美國東部 2
日本東部
英國南部

Azure Government 區域

Azure Government 提供下列 GPT-4 模型:

Model ID 模型可用性
gpt-4 (1106-Preview) US Gov 維吉尼亞州
US Gov 亞利桑那州

GPT-3.5 模型

重要

新的 gpt-35-turbo (0125) 模型進行了各種改善,包括提高以要求格式回應的精確度,以及修正導致非英文語言函式呼叫的文字編碼問題的錯誤 (bug)。

GPT-3.5 Turbo 與 Chat Completion API 搭配使用。 GPT-3.5 Turbo 版本 0301 也可以與完成 API 搭配使用。 GPT-3.5 Turbo 版本 0613 和 1106 僅支援聊天完成 API。

GPT-3.5 Turbo 版本 0301 是該模型發行的第一個版本。 版本 0613 是模型的第二個版本,並新增了函式呼叫支援。

請參閱模型版本,了解 Azure OpenAI 服務如何處理模型版本升級,以及使用模型了解如何檢視和設定 GPT-3.5 Turbo 部署的模型版本設定。

注意

gpt-35-turbogpt-35-turbo-16k 的版本0613將不會早於 2024 年 7 月 13 日淘汰。 gpt-35-turbo的版本0301不會早於 2024 年 6 月 13 日淘汰。 如需了解模型升級行為,請參閱模型更新

Model ID 要求上限 (權杖) 訓練資料 (上限)
gpt-35-turbo1 (0301) 4,096 2021 年 9 月
gpt-35-turbo (0613) 4,096 2021 年 9 月
gpt-35-turbo-16k (0613) 16,384 2021 年 9 月
gpt-35-turbo-instruct (0914) 4,097 2021 年 9 月
gpt-35-turbo (1106) 輸入:16,385
輸出:4,096
2021 年 9 月
gpt-35-turbo (0125) 新增 16,385 2021 年 9 月

GPT-3.5-Turbo 模型可用性

公用雲端區域

Region gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
australiaeast - - -
canadaeast - -
eastus - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - -
southcentralus - - - -
southindia - - - - -
swedencentral - -
switzerlandnorth - - - -
uksouth - -
westeurope - - - - -
westus - - - - -

1 此模型將接受 > 4,096 個權杖要求。 不建議超過 4,096 個輸入權杖限制,因為較新版本的模型上限為 4,096 個權杖。 如果使用此模型超過 4,096 個輸入權杖時遇到問題,則官方不支援此設定。

Azure Government 區域

Azure Government 提供下列 GPT-3.5 渦輪增壓模型:

Model ID 模型可用性
gpt-35-turbo (1106-Preview) US Gov 維吉尼亞州

內嵌模型

這些模型只能與內嵌 API 要求搭配使用。

注意

text-embedding-3-large 是最新且功能最強的內嵌模型。 無法在內嵌模型之間進行升級。 若要從使用 text-embedding-ada-002 移轉至 text-embedding-3-large,您必須產生新的內嵌。

Model ID 要求上限 (權杖) 輸出維度 訓練資料 (上限)
text-embedding-ada-002 (版本 2) 8,191 1,536 2021 年 9 月
text-embedding-ada-002 (版本 1) 2,046 1,536 2021 年 9 月
text-embedding-3-large 8,191 3,072 2021 年 9 月
text-embedding-3-small 8,191 1,536 2021 年 9 月

注意

傳送輸入陣列以進行內嵌時,每次呼叫內嵌端點時陣列中輸入項目的數目上限為 2048。

公用雲端區域

Region text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
australiaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
francecentral - - -
japaneast - - -
northcentralus - - -
norwayeast - - -
southafricanorth - - -
southcentralus - -
southindia - - -
swedencentral - - -
switzerlandnorth - - -
uksouth - - -
westeurope - - -
westus - - -
westus3 - - -

Azure Government 區域

Azure Government 提供下列內嵌模型:

Model ID 模型可用性
text-embedding-ada-002 (版本 2) US Gov 維吉尼亞州
US Gov 亞利桑那州

DALL-E 模型

Model ID 功能可用性 要求上限 (字元)
dalle2 (預覽) 美國東部 1,000
dall-e-3 美國東部、澳大利亞東部、瑞典中部 4,000

微調模型

未訓練 babbage-002davinci-002 以遵循指示進行操作。 查詢這些基礎模型只能作為微調版本的參考點,以評估訓練的進度。

gpt-35-turbo - 此模型的微調僅限於區域子集,而且在基礎模型可用的每個區域中並非都可用。

Model ID 微調區域 要求上限 (權杖) 訓練資料 (上限)
babbage-002 美國中北部
瑞典中部
瑞士西部
16,384 2021 年 9 月
davinci-002 美國中北部
瑞典中部
瑞士西部
16,384 2021 年 9 月
gpt-35-turbo (0613) 美國東部 2
美國中北部
瑞典中部
瑞士西部
4,096 2021 年 9 月
gpt-35-turbo (1106) 美國東部 2
美國中北部
瑞典中部
瑞士西部
輸入:16,385
輸出:4,096
2021 年 9 月
gpt-35-turbo (0125) 美國東部 2
美國中北部
瑞典中部
瑞士西部
16,385 2021 年 9 月

耳語模型

Model ID 模型可用性 要求上限 (音訊檔案大小)
whisper 美國東部 2
美國中北部
挪威東部
印度南部
瑞典中部
西歐
25 MB

文字轉換語音模型 (預覽版)

Model ID 模型可用性
tts-1 美國中北部
瑞典中部
tts-1-hd 美國中北部
瑞典中部

助理 (預覽版)

對於助理,您需要支援的模型和支援的區域組合。 某些工具和功能需要最新的模型。 助理 API、SDK、Azure AI Studio 和 Azure OpenAI Studio 提供下列模型。 下表適用於隨用隨付。 如需布建輸送量單位 (PTU) 可用性的相關信息,請參閱 布建的輸送量

區域 gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106) gpt-4 (0125)
澳大利亞東部
美國東部
美國東部 2
法國中部
挪威東部
瑞典中部
英國南部

下一步