Share via


Azure OpenAI 서비스의 새로운 기능

이 문서에서는 Azure OpenAI에 대한 최신 릴리스 및 주요 설명서 업데이트에 대한 요약을 제공합니다.

2024년 5월

도우미 v2(미리 보기)

이제 도우미 API의 새로 고침이 공개적으로 제공됩니다. 여기에는 다음 업데이트가 포함되어 있습니다.

  • 파일 검색 도구 및 벡터 스토리지
  • 토큰 사용 관리를 위한 최대 완료 및 최대 프롬프트 토큰 지원
  • 도우미가 지정된 도구를 사용하도록 강제하는 tool_choice매개 변수입니다. 이제 보조 역할로 메시지를 작성하여 스레드에서 사용자 지정 대화 기록을 만들 수 있습니다.
  • temperature, top_p, response_format매개 변수를 지원합니다.
  • 스트리밍 및 폴링 지원. Python SDK의 도우미 함수를 사용하여 실행을 만들고 응답을 스트리밍할 수 있습니다. 또한 폴링 없이 개체 상태 업데이트를 공유하기 위해 폴링 SDK 도우미를 추가했습니다.
  • Azure OpenAI Studio를 사용하여 Logic Appss 및 함수 호출을 실험해 보세요. Logic Apps에 구현된 REST API를 함수로 가져오면 스튜디오는 사용자 프롬프트에 따라 자동으로 함수(Logic Appss 워크플로로)를 호출합니다.
  • Microsoft Research의 AutoGen은 다양한 애플리케이션에서 LLM(대규모 언어 모델) 워크플로를 편리하게 빌드할 수 있도록 다중 에이전트 대화 프레임워크를 제공합니다. Azure OpenAI 도우미는 이제 AutoGen 기반 다중 에이전트 워크플로에 도우미를 원활하게 추가할 수 있는 새로운 실험용 에이전트인 GPTAssistantAgent를 통해 AutoGen에 통합되었습니다. 이를 통해 작업 또는 도메인에 특화된 여러 Azure OpenAI 도우미가 복잡한 작업을 공동 작업하고 처리할 수 있습니다.
  • 다음 지역에서 미세 조정된 gpt-3.5-turbo-0125모델을 지원합니다.
    • 미국 동부 2
    • 스웨덴 중부
  • 다음에 대한 지역별 지원 확대:
    • 일본 동부
    • 영국 남부
    • 미국 서부
    • 미국 서부 3

GPT-4o 모델 GA(일반 공급)

GPT-4o("o는 "omni"를 의미함)는 2024년 5월 13일에 출시된 OpenAI의 최신 모델입니다.

  • GPT-4o는 텍스트와 이미지를 단일 모델로 통합하여 여러 데이터 형식을 동시에 처리할 수 있습니다. 이러한 다중 모드 방식은 인간-컴퓨터 상호 작용의 정확도와 응답성을 향상시킵니다.
  • GPT-4o는 영어 텍스트 및 코딩 작업에서 GPT-4 Turbo와 일치하는 동시에 영어가 아닌 언어 및 비전 작업에서 탁월한 성능을 제공하여 AI 기능에 대한 새로운 벤치마크를 설정합니다.

모델 지역별 사용 가능 여부에 대한 자세한 내용은 모델 페이지를 참조하세요.

글로벌 표준 배포 유형(미리 보기)

글로벌 배포는 비전역 서비스와 동일한 Azure OpenAI 리소스에서 사용할 수 있지만 Azure의 글로벌 인프라를 활용하여 각 요청에 대해 최상의 가용성을 제공하면서 트래픽을 데이터 센터로 동적으로 라우팅할 수 있습니다. 글로벌 표준은 새 모델에 대해 가장 높은 기본 할당량을 제공하고 여러 리소스에 걸쳐 부하 분산을 수행할 필요성을 제거합니다.

자세한 내용은 배포 유형 가이드를 참조하세요.

DALL-E 및 GPT-4 Turbo Vision GA 구성 가능 콘텐츠 필터

DALL-E 2 및 3과 GPT-4 Turbo with Vision GA(gpt-4-turbo-2024-04-09) 배포를 위한 사용자 지정 콘텐츠 필터를 만듭니다. 콘텐츠 필터링

모든 Azure OpenAI 고객이 사용할 수 있는 비동기 필터

이제 모든 Azure OpenAI 고객은 스트리밍 시나리오의 대기 시간 개선을 위해 필터를 비동기식으로 실행할 수 있습니다. 콘텐츠 필터링

Prompt Shields

프롬프트 쉴드는 직접(탈옥) 공격과 간접 공격이라는 두 가지 형식의 공격으로부터 Azure OpenAI 모델로 구동되는 애플리케이션을 보호합니다. 간접 공격(간접 프롬프트 공격 또는 교차 도메인 프롬프트 삽입 공격이라고도 함)은 애플리케이션 개발자 또는 사용자가 직접 작성하지 않은 정보를 애플리케이션이 처리할 때 발생할 수 있는 생성형 AI 모델 기반 시스템에 대한 공격 형식입니다. 콘텐츠 필터링

2024-05-01-preview API 릴리스

GPT-4 Turbo 모델 GA(일반 공급)

GPT-4 Turbo의 최신 GA 릴리스는 다음과 같습니다.

  • gpt-4버전turbo-2024-04-09:

이는 다음 미리 보기 모델을 대체합니다.

  • gpt-4버전1106-Preview:
  • gpt-4버전0125-Preview:
  • gpt-4버전vision-preview:

OpenAI와 Azure OpenAI GPT-4 Turbo GA 모델의 차이점

  • OpenAI의 최신 0409 터보 모델 버전은 JSON 모드와 모든 유추 요청에 대한 함수 호출을 지원합니다.
  • Azure OpenAI의 최신 turbo-2024-04-09 버전은 현재 이미지(비전) 입력으로 유추 요청을 할 때 JSON 모드 및 함수 호출 사용을 지원하지 않습니다. 텍스트 기반 입력 요청(image_url 및 인라인 이미지가 없는 요청)은 JSON 모드 및 함수 호출을 지원합니다.

gpt-4 vision-preview와의 차이점

  • GPT-4 Turbo with Vision과 Azure AI 관련 Vision 개선 사항 통합은 gpt-4버전:turbo-2024-04-09에서는 지원되지 않습니다. 여기에는 OCR(광학 인식), 개체 근거 있는, 동영상 프롬프트 및 이미지가 포함된 데이터 처리 개선이 포함됩니다.

GPT-4 Turbo 프로비전된 관리 가용성

  • gpt-4버전:turbo-2024-04-09는 표준 배포와 프로비전 배포 모두에 사용할 수 있습니다. 현재 이 모델의 프로비전된 버전은 이미지/비전 유추 요청을 지원하지 않습니다. 이 모델의 프로비전된 배포에서는 텍스트 입력만 허용됩니다. 표준 모델 배포는 텍스트 및 이미지/비전 유추 요청을 모두 허용합니다.

사용 가능 지역

모델 지역별 가용성에 대한 자세한 내용은 표준프로비전 배포에 대한 모델 행렬을 참조하세요.

GPT-4 Turbo with Vision GA 배포

Studio UI에서 GA 모델을 배포하려면 GPT-4를 선택한 다음 드롭다운 메뉴에서 turbo-2024-04-09 버전을 선택합니다. gpt-4-turbo-2024-04-09 모델의 기본 할당량은 GPT-4-Turbo의 현재 할당량과 동일합니다. 지역별 할당량 한도를 참조하세요.

조기 액세스가 가능한 GPT-4o 미리 보기 모델

GPT-4o("o는 "omni"를 의미함)는 2024년 5월 13일에 출시된 OpenAI의 최신 미리 보기 모델입니다.

  • GPT-4o는 텍스트와 이미지를 단일 모델로 통합하여 여러 데이터 형식을 동시에 처리할 수 있습니다. 이러한 다중 모드 방식은 인간-컴퓨터 상호 작용의 정확도와 응답성을 향상시킵니다.
  • GPT-4o는 영어 텍스트 및 코딩 작업에서 GPT-4 Turbo와 일치하는 동시에 영어가 아닌 언어 및 비전 작업에서 탁월한 성능을 제공하여 AI 기능에 대한 새로운 벤치마크를 설정합니다.

GPT-4 Turbo 모델 GA(일반 공급)

GPT-4 Turbo의 최신 GA 릴리스는 다음과 같습니다.

  • gpt-4버전turbo-2024-04-09:

이는 다음 미리 보기 모델을 대체합니다.

  • gpt-4버전1106-Preview:
  • gpt-4버전0125-Preview:
  • gpt-4버전vision-preview:

OpenAI와 Azure OpenAI GPT-4 Turbo GA 모델의 차이점

  • OpenAI의 최신 0409 터보 모델 버전은 JSON 모드와 모든 유추 요청에 대한 함수 호출을 지원합니다.
  • Azure OpenAI의 최신 turbo-2024-04-09 버전은 현재 이미지(비전) 입력으로 유추 요청을 할 때 JSON 모드 및 함수 호출 사용을 지원하지 않습니다. 텍스트 기반 입력 요청(image_url 및 인라인 이미지가 없는 요청)은 JSON 모드 및 함수 호출을 지원합니다.

gpt-4 vision-preview와의 차이점

  • GPT-4 Turbo with Vision과 Azure AI 관련 Vision 개선 사항 통합은 gpt-4버전:turbo-2024-04-09에서는 지원되지 않습니다. 여기에는 OCR(광학 인식), 개체 근거 있는, 동영상 프롬프트 및 이미지가 포함된 데이터 처리 개선이 포함됩니다.

GPT-4 Turbo 프로비전된 관리 가용성

  • gpt-4버전:turbo-2024-04-09는 표준 배포와 프로비전 배포 모두에 사용할 수 있습니다. 현재 이 모델의 프로비전된 버전은 이미지/비전 유추 요청을 지원하지 않습니다. 이 모델의 프로비전된 배포에서는 텍스트 입력만 허용됩니다. 표준 모델 배포는 텍스트 및 이미지/비전 유추 요청을 모두 허용합니다.

사용 가능 지역

모델 지역별 가용성에 대한 자세한 내용은 표준프로비전 배포에 대한 모델 행렬을 참조하세요.

GPT-4 Turbo with Vision GA 배포

Studio UI에서 GA 모델을 배포하려면 GPT-4를 선택한 다음 드롭다운 메뉴에서 turbo-2024-04-09 버전을 선택합니다. gpt-4-turbo-2024-04-09 모델의 기본 할당량은 GPT-4-Turbo의 현재 할당량과 동일합니다. 지역별 할당량 한도를 참조하세요.

2024년 4월

이제 미국 동부 2와 스위스 서부 두 개의 새로운 지역에서 미세 조정이 지원됩니다.

이제 다음을 지원하여 미세 조정이 가능합니다.

미국 동부 2

  • gpt-35-turbo(0613)
  • gpt-35-turbo(1106)
  • gpt-35-turbo(0125)

스위스 서부

  • babbage-002
  • davinci-002
  • gpt-35-turbo(0613)
  • gpt-35-turbo(1106)
  • gpt-35-turbo(0125)

각 지역의 모델 가용성 및 미세 조정 지원에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.

다단계 채팅 학습 예

이제 미세 조정에서 다단계 채팅 학습 예를 지원합니다.

GPT-4(0125)는 Azure OpenAI On Your Data에서 사용할 수 있음

이제 Azure OpenAI On Your Data를 통해 사용 가능한 지역에서 GPT-4(0125) 모델을 사용할 수 있습니다.

2024년 3월

Azure OpenAI 스튜디오의 위험 및 안전 모니터링

이제 Azure OpenAI 스튜디오는 콘텐츠 필터 구성을 사용하는 각 배포에 대한 위험 및 안전 대시보드를 제공합니다. 필터링 작업의 결과를 확인하는 데 사용합니다. 그런 다음, 필터 구성을 조정하여 비즈니스 요구 사항을 더 잘 충족하고 책임 있는 AI 원칙을 충족할 수 있습니다.

위험 및 안전 모니터링 사용

Azure OpenAI On Your Data 업데이트

  • 이제 Azure OpenAI On Your Data를 사용할 Elasticsearch 벡터 데이터베이스에 연결할 수 있습니다.
  • 데이터 수집 중에 청크 크기 매개 변수를 사용하여 인덱스에 지정된 데이터 청크의 최대 토큰 수를 설정할 수 있습니다.

2024-02-01 GA(일반 공급) API 릴리스

최신 GA API 릴리스이며 이전 2023-05-15 GA 릴리스를 대체합니다. 이 릴리스에서는 Whisper, DALLE-3, 미세 조정, On Your Data 등과 같은 최신 Azure OpenAI GA 기능에 대한 지원을 추가합니다.

도우미, TTS(텍스트 음성 변환), 특정 On Your Data 데이터 소스의 미리 보기 기능에는 여전히 미리 보기 API 버전이 필요합니다. 자세한 내용은 API 버전 수명 주기 가이드를 확인하세요.

Whisper GA(일반 공급)

이제 Whisper 음성 텍스트 변환 모델은 REST 및 Python 모두에 대한 GA입니다. 클라이언트 라이브러리 SDK는 현재 공개 미리 보기로 제공됩니다.

빠른 시작에 따라 Whisper를 사용해 보세요.

DALL-E 3 GA(일반 공급)

DALL-E 3 이미지 생성 모델은 이제 REST 및 Python 모두에 대한 GA입니다. 클라이언트 라이브러리 SDK는 현재 공개 미리 보기로 제공됩니다.

빠른 시작에 따라 DALL-E 3를 사용해 보세요.

DALL-E 3에 대한 새로운 지역 지원

이제 SwedenCentral 외에도 East US 또는 AustraliaEast Azure 지역에서 Azure OpenAI 리소스를 사용하여 DALL-E 3에 액세스할 수 있습니다.

모델 사용 중단 및 사용 중지

Azure OpenAI Service에서 모델 사용 중단 및 사용 중지를 추적하는 페이지가 추가되었습니다. 이 페이지에서는 현재 사용 가능하고, 사용되지 않으며, 사용 중지된 모델에 대한 정보를 제공합니다.

2024-03-01-preview API 릴리스

2024-03-01-preview2024-02-15-preview와 동일한 기능을 가지며 포함에 대해 두 개의 새 매개 변수를 추가합니다.

  • encoding_formatfloat 또는 base64의 포함을 생성하는 형식을 지정할 수 있습니다. 기본값은 float입니다.
  • dimensions는 출력 포함 수를 설정할 수 있습니다. 이 매개 변수는 새 3세대 포함 모델(text-embedding-3-large, text-embedding-3-small)에서만 지원됩니다. 일반적으로 더 큰게 포함되면 컴퓨팅, 메모리 및 스토리지 관점에서 더 비쌉니다. 차원 수를 조정할 수 있게 되므로 전체 비용 및 성능을 더 많이 제어할 수 있습니다. dimensions 매개 변수는 모든 버전의 OpenAI 1.x Python 라이브러리에서 지원되지 않습니다. 이 매개 변수를 활용하려면 최신 버전으로 업그레이드하는 것이 좋습니다. pip install openai --upgrade.

현재 미리 보기 API 버전을 사용하여 최신 기능을 활용하는 경우 API 버전 수명 주기 문서를 참조하여 현재 API 버전이 지원되는 기간을 추적하는 것이 좋습니다.

GPT-4-1106-Preview 업그레이드 플랜으로 업데이트

2024년 3월 8일로 예정된 gpt-4 1106-Preview를 gpt-4 0125-Preview로의 배포 업그레이드는 더 이상 진행되지 않습니다. 안정적인 버전의 모델이 릴리스된 후 gpt-4 버전 1106-Preview 및 0125-Preview가 "기본값으로 자동 업데이트" 및 "만료된 경우 업그레이드"로 설정된 배포가 업그레이드되기 시작합니다.

업그레이드 프로세스에 대한 자세한 내용은 모델 페이지를 참조하세요.

2024년 2월

GPT-3.5-turbo-0125 모델 사용 가능

이 모델에는 요청된 형식의 응답 정확도 향상 및 영어 이외의 언어 함수 호출에 대한 텍스트 인코딩 문제를 발생시킨 버그 수정 등 다양한 개선 사항이 있습니다.

모델 지역 가용성 및 업그레이드에 대한 자세한 내용은 모델 페이지를 참조하세요.

3세대 포함 모델 사용 가능

  • text-embedding-3-large
  • text-embedding-3-small

테스트에서 OpenAI는 2세대 text-embedding-ada-002 모델보다 MTEB 벤치마크를 사용하여 영어 작업에 대해 더 나은 성능을 계속 유지하면서 MIRACL 벤치마크를 통해 크고 작은 3세대 포함 모델이 더 나은 평균 다국어 검색 성능을 제공한다고 보고합니다.

모델 지역 가용성 및 업그레이드에 대한 자세한 내용은 모델 페이지를 참조하세요.

GPT-3.5 Turbo 할당량 통합

다양한 버전의 GPT-3.5-Turbo 모델(16k 포함) 간의 마이그레이션을 간소화하기 위해 모든 GPT-3.5-Turbo 할당량을 단일 할당량 값으로 통합합니다.

  • 승인된 할당량을 늘인 고객은 이전 증가를 반영하는 총 할당량을 합산합니다.

  • 모델 버전에서 현재 총사용량이 기본값보다 작은 고객은 기본적으로 새롭게 결합된 총 할당량을 받게 됩니다.

GPT-4-0125-preview 모델 사용 가능

gpt-4 모델 버전 0125-preview를 이제 미국 동부, 미국 중북부 및 미국 중남부 지역의 Azure OpenAI Service에서 사용할 수 있습니다. gpt-4 버전 1106-preview가 배포된 고객은 앞으로 몇 주 안에 자동으로 0125-preview로 업그레이드됩니다.

모델 지역 가용성 및 업그레이드에 대한 자세한 내용은 모델 페이지를 참조하세요.

도우미 API 공개 미리 보기

이제 Azure OpenAI는 OpenAI의 GPT를 구동하는 API를 지원합니다. Azure OpenAI 도우미(미리 보기)를 사용하면 사용자 지정 지침과 코드 해석기 및 사용자 지정 함수 같은 고급 도구를 통해 필요에 맞게 조정된 AI 도우미를 만들 수 있습니다. 자세한 내용은 다음을 참조하세요.

OpenAI 텍스트 음성 변환 음성 공개 미리 보기

이제 Azure OpenAI Service는 OpenAI의 음성을 사용하여 텍스트 음성 변환 API를 지원합니다. 제공하는 텍스트에서 AI 생성 음성을 가져오세요. 자세한 내용은 개요 가이드를 참조하고, 빠른 시작을 사용해 보세요.

참고 항목

Azure AI 음성은 OpenAI 텍스트 음성 변환 음성도 지원합니다. 자세한 내용은 Azure OpenAI Service 또는 Azure AI 음성을 통한 OpenAI 텍스트 음성 음성 가이드를 참조하세요.

새로운 미세 조정 기능 및 모델 지원

Azure OpenAI On Your Data에 대한 새로운 지역 지원

이제 다음 Azure 지역에서 Azure OpenAI On Your Data를 사용할 수 있습니다.

  • 남아프리카 공화국 북부

Azure OpenAI On Your Data 일반 공급

2023년 12월

데이터에 대한 Azure OpenAI

  • 스토리지 계정, Azure OpenAI 리소스, Azure AI 검색 서비스 리소스에 대한 보안 지원을 포함하여 Azure OpenAI On Your Data에 대한 전체 VPN 및 프라이빗 엔드포인트 지원.
  • 가상 네트워크 및 프라이빗 엔드포인트를 사용하여 데이터를 보호함으로써 Azure OpenAI On Your Data를 안전하게 사용하기 위한 새로운 문서.

GPT-4 Turbo with Vision 이제 사용 가능

Azure OpenAI Service의 GPT-4 Turbo with Vision은 현재 공개 미리 보기입니다. GPT-4 Turbo with Vision은 이미지를 분석하고 이미지에 대한 질문에 대한 텍스트 응답을 제공할 수 있는 OpenAI에서 개발한 LMM(대형 다중 모드 모델)입니다. 이는 자연어 처리와 시각적 이해를 모두 통합합니다. 향상된 모드에서는 Azure AI 비전 기능을 사용하여 이미지에서 추가 인사이트를 생성할 수 있습니다.

  • Azure OpenAI Playground를 사용하여 코드 없는 환경에서 GPT-4 Turbo with Vision의 기능을 살펴보세요. 빠른 시작 가이드에서 자세히 알아보세요.
  • GPT-4 Turbo with Vision을 사용한 비전 향상 기능은 이제 Azure OpenAI Playground에서 사용할 수 있으며 광학 문자 인식, 개체 접지, "데이터 추가"에 대한 이미지 지원 및 비디오 프롬프트에 대한 지원을 포함합니다.
  • REST API를 사용하여 채팅 API를 직접 호출합니다.
  • 지역 가용성은 현재 SwitzerlandNorth, SwedenCentral, WestUS, AustraliaEast로 제한됩니다.
  • GPT-4 Turbo with Vision의 알려진 제한 사항 및 기타 질문과 대답에 대해 자세히 알아보세요.

2023년 11월

Azure OpenAI On Your Data의 새 데이터 원본 지원

  • 이제 Azure Cosmos DB for MongoDB vCore뿐 아니라 URL/웹 주소를 데이터 원본으로 사용하여 데이터를 수집하고 지원되는 Azure OpenAI 모델과 채팅할 수 있습니다.

GPT-4 Turbo 미리 보기 및 GPT-3.5-Turbo-1106 릴리스

두 모델 모두 향상된 명령 따르기, JSON 모드, 재현 가능한 출력 및 병렬 함수 호출이 포함된 OpenAI의 최신 릴리스입니다.

  • GPT-4 Turbo 미리 보기에는 128,000개 토큰의 최대 컨텍스트 창이 있으며, 4,096개의 출력 토큰을 생성할 수 있습니다. 2023년 4월까지의 정보가 포함된 최신 교육 데이터가 있습니다. 이 모델은 미리 보기이며, 프로덕션에서 사용하지 않는 것이 좋습니다. 안정적인 릴리스를 사용할 수 있게 되면 이 미리 보기 모델의 모든 배포가 자동으로 업데이트됩니다.

  • GPT-3.5-Turbo-1106에는 16,385개 토큰의 최대 컨텍스트 창이 있으며, 4,096개의 출력 토큰을 생성할 수 있습니다.

모델 지역 가용성에 대한 자세한 내용은 모델 페이지를 참조하세요.

모델에는 지역별로 고유한 할당량 할당이 있습니다.

DALL-E 3 공개 미리 보기

DALL-E 3는 OpenAI의 최신 이미지 생성 모델입니다. 이미지에서 텍스트를 렌더링할 때 향상된 이미지 품질, 더 복잡한 장면, 향상된 성능을 제공합니다. 또한 더 많은 가로 세로 비율 옵션도 함께 제공됩니다. DALL-E 3는 OpenAI 스튜디오와 REST API를 통해 사용할 수 있습니다. OpenAI 리소스가 SwedenCentral Azure 지역에 있어야 합니다.

DALL-E 3에는 이미지를 향상시키고, 편견을 줄이고, 자연스러운 변화를 높이기 위한 기본 제공 프롬프트 다시 쓰기가 포함되어 있습니다.

빠른 시작에 따라 DALL-E 3를 사용해 보세요.

책임 있는 AI

  • 확장된 고객 구성 가능성: 이제 모든 Azure OpenAI 고객은 높은 심각도 콘텐츠만 필터링하는 것을 포함하여 증오, 폭력, 성적, 자해 범주의 모든 심각도 수준(낮음, 중간, 높음)을 구성할 수 있습니다. 콘텐츠 필터 구성

  • 모든 DALL-E 모델의 콘텐츠 자격 증명: 이제 모든 DALL-E 모델의 AI 생성 이미지에 AI 생성으로 콘텐츠를 공개하는 디지털 자격 증명이 포함됩니다. 이미지 자산을 표시하는 애플리케이션은 오픈 소스 콘텐츠 인증 이니셔티브 SDK 를 활용하여 AI 생성 이미지에 자격 증명을 표시할 수 있습니다. Azure OpenAI의 콘텐츠 자격 증명

  • 새 RAI 모델

    • 탈옥 감지: 탈옥 공격은 시스템 메시지에 설정된 규칙을 피하거나 위반하도록 학습된 동작을 보이도록 생성 AI 모델을 자극하도록 설계된 사용자 프롬프트입니다. 탈옥 위험 감지 모델은 선택 사항(기본값 해제)이며, 주석 및 필터 모델에서 사용할 수 있습니다. 이 모델은 사용자 프롬프트에서 실행됩니다.
    • 보호 자료 텍스트: 보호 자료 텍스트는 대규모 언어 모델에서 출력할 수 있는 알려진 텍스트 콘텐츠(예: 노래 가사, 문서, 조리법 및 선택한 웹 콘텐츠)를 설명합니다. 보호 자료 텍스트 모델은 선택 사항(기본값 해제)이며, 주석 및 필터 모델에서 사용할 수 있습니다. 이 모델은 LLM 완성 시 실행됩니다.
    • 보호 자료 코드: 보호 자료 코드는 공용 리포지토리의 소스 코드 집합과 일치하는 소스 코드를 설명하며, 원본 리포지토리를 적절하게 인용하지 않고도 대규모 언어 모델로 출력할 수 있습니다. 보호 자료 코드 모델은 선택 사항(기본값 해제)이며, 주석 및 필터 모델에서 사용할 수 있습니다. 이 모델은 LLM 완성 시 실행됩니다.

    콘텐츠 필터 구성

  • 차단 목록: 고객은 이제 필터에 사용자 지정 차단 목록을 만들어 프롬프트 및 완성을 위한 콘텐츠 필터 동작을 빠르게 사용자 지정할 수 있습니다. 사용자 지정 차단 목록을 통해 필터는 특정 용어 또는 정규식 패턴과 같은 사용자 지정된 패턴 목록에 대한 작업을 수행할 수 있습니다. Microsoft는 사용자 지정 차단 목록 외에도 Microsoft 욕설 차단 목록(영어)을 제공합니다. 차단 목록 사용

2023년 10월

새 미세 조정 모델(미리 보기)

데이터에 대한 Azure OpenAI

  • 검색된 문서 수와 엄격성을 확인하기 위한 새 사용자 지정 매개 변수.
    • 엄격성 설정은 쿼리와 관련된 문서를 분류하는 임계값을 설정합니다.
    • 검색된 문서 설정은 응답을 생성하는 데 사용되는 데이터 인덱스에서 최고 점수 문서의 수를 지정합니다.
  • Azure OpenAI 스튜디오에서 데이터 수집/업로드 상태를 볼 수 있습니다.
  • Blob 컨테이너의 프라이빗 엔드포인트 및 VPN 지원.

2023년 9월

GPT-4

이제 모든 Azure OpenAI Service 고객이 GPT-4 및 GPT-4-32k를 사용할 수 있습니다. 고객은 더 이상 GPT-4와 GPT-4-32k를 사용하기 위해 대기 목록을 신청할 필요가 없습니다(제한된 액세스 등록 요구 사항은 모든 Azure OpenAI 모델에 계속 적용됨). 가용성은 지역에 따라 달라질 수 있습니다. 각 지역의 모델 가용성에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.

GPT-3.5 Turbo Instruct

이제 Azure OpenAI Service는 GPT-3.5 Turbo Instruct 모델을 지원합니다. 이 모델은 text-davinci-003과 성능이 비슷하며, 완성 API와 함께 사용할 수 있습니다. 각 지역의 모델 가용성에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.

Whisper 공개 미리 보기

Azure OpenAI 서비스는 이제 OpenAI의 Whisper 모델에서 제공하는 음성 텍스트 변환 API를 지원합니다. 제공하는 음성 오디오를 기반으로 AI에서 생성된 텍스트를 가져옵니다. 자세히 알아보려면 빠른 시작을 확인하세요.

참고 항목

또한 Azure AI 음성은 일괄 처리 대화 기록 API를 통해 OpenAI의 Whisper 모델을 지원합니다. 자세한 내용은 일괄 처리 대화 내용 기록 만들기 가이드를 확인해 보세요. Azure AI 음성과 Azure OpenAI Service를 언제 사용해야 하는지 자세히 알아보려면 Whisper 모델이란?을 확인하세요.

새 지역

  • Azure OpenAI는 이제 스웨덴 중부 및 스위스 북부 지역에서도 사용할 수 있습니다. 각 지역의 모델 가용성에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.

지역 할당량 한도 증가

  • 특정 모델 및 지역에 대한 최대 기본 할당량 한도가 늘어납니다. 이러한 모델 및 지역으로 워크로드를 마이그레이션하면 TPM(분당 더 높은 토큰)을 활용할 수 있습니다.

2023년 8월

자체 데이터에 대한 Azure OpenAI(미리 보기) 업데이트

2023년 7월

함수 호출 지원

기본 제공 입력 배열 증가

새 지역

  • Azure OpenAI는 이제 캐나다 동부, 미국 동부 2, 일본 동부 및 미국 중북부 지역에서도 사용할 수 있습니다. 각 지역의 모델 가용성에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.

2023년 6월

자체 데이터에 Azure OpenAI 사용(미리 보기)

  • Azure OpenAI On Your Data가 이제 미리 보기로 제공됩니다. 이를 통해 GPT-35-Turbo 및 GPT-4와 같은 OpenAI 모델과 채팅하고 데이터를 기반으로 응답을 받을 수 있습니다.

gpt-35-turbo 및 gpt-4 모델의 새 버전

  • gpt-35-turbo (버전 0613)
  • gpt-35-turbo-16k (버전 0613)
  • gpt-4(버전 0613)
  • gpt-4-32k(버전 0613)

영국 남부

  • 이제 Azure OpenAI를 영국 남부 지역에서 사용할 수 있습니다. 각 지역의 모델 가용성에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.

콘텐츠 필터링 및 주석(미리 보기)

할당량

2023년 5월

Java 및 JavaScript SDK 지원

  • JavaScriptJava를 지원하는 새로운 Azure OpenAI 미리 보기 SDK.

Azure OpenAI 채팅 완료 일반 공급(GA)

  • 다음에 대한 일반 가용성 지원:
    • 채팅 완료 API 버전 2023-05-15.
    • GPT-35-터보 모델.
    • GPT-4 모델 시리즈.

현재 2023-03-15-preview API를 사용하고 있다면 GA 2023-05-15 API로 마이그레이션하는 것이 좋습니다. 현재 API 버전 2022-12-01을 사용하고 있는 경우 이 API는 GA 상태로 유지되지만 최신 채팅 완료 기능은 포함되지 않습니다.

Important

완료 엔드포인트가 있는 GPT-35-Turbo 모델의 현재 버전을 사용하는 것은 미리 보기 상태로 유지됩니다.

프랑스 중부

  • 이제 Azure OpenAI를 프랑스 중부 지역에서 사용할 수 있습니다. 각 지역의 모델 가용성에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.

2023년 4월

  • DALL-E 2 공개 미리 보기. Azure OpenAI Service는 이제 OpenAI의 DALL-E 2 모델을 기반으로 하는 이미지 생성 API를 지원합니다. 귀하가 제공한 설명 텍스트를 기반으로 AI 생성 이미지를 가져옵니다. 자세히 알아보려면 빠른 시작을 확인하세요. 액세스를 요청하려면 기존 Azure OpenAI 고객이 이 양식을 작성하여 신청할 수 있습니다.

  • 사용자 지정된 모델의 비활성 배포는 이제 15일 후에 삭제됩니다. 모델은 재배포가 가능한 상태로 유지됩니다. 사용자 지정된(미세 조정된) 모델이 15일 이상 배포되고, 이 기간 동안 완료되거나 채팅이 완료되지 않으면 배포는 자동으로 삭제됩니다(해당 배포에 대한 추가 호스팅 비용은 발생하지 않습니다). 기본 사용자 지정된 모델은 계속 사용 가능하며 언제든지 다시 배포할 수 있습니다. 자세한 내용은 방법 도움말을 확인하세요.

2023년 3월

  • GPT-4 시리즈 모델은 이제 Azure OpenAI에서 미리 보기로 제공됩니다. 액세스를 요청하려면 기존 Azure OpenAI 고객이 이 양식을 작성하여 신청할 수 있습니다. 이러한 모델은 현재 미국 동부 및 미국 중남부 지역에서 사용할 수 있습니다.

  • 3월 21일 미리 보기로 출시된 GPT-35-Turbo 및 GPT-4 모델용 새로운 Chat Completion API. 자세히 알아보려면 업데이트된 빠른 시작방법 문서를 확인합니다.

  • GPT-35-터보 미리 보기. 자세한 내용은 방법 문서를 참조하세요.

  • 미세 조정을 위한 학습 제한 증가: 최대 학습 작업 크기(학습 파일의 토큰) x(epoch 수)는 모든 모델에 대해 20억 토큰입니다. 또한 최대 학습 작업을 120시간에서 720시간으로 늘렸습니다.

  • 기존 액세스에 추가 사용 사례를 추가합니다.  이전에는 새로운 사용 사례를 추가하려면 고객이 서비스에 다시 신청해야 했습니다. 이제 서비스 사용에 새로운 사용 사례를 신속하게 추가할 수 있는 새로운 프로세스를 출시합니다. 이 프로세스는 Azure AI 서비스 내에 설정된 제한된 액세스 프로세스를 따릅니다. 기존 고객은 여기에서 모든 새로운 사용 사례를 증명할 수 있습니다. 이는 사용자가 원래 신청하지 않은 새로운 사용 사례에 대해 서비스를 사용하고자 할 때마다 필요하다는 점에 유의하세요.

2023년 2월

새로운 기능

업데이트

  • 콘텐츠 필터링은 기본적으로 켜져 있습니다.

새로운 문서:

새로운 학습 과정:

2023년 1월

새로운 기능

  • 서비스 GA. 이제 Azure OpenAI 서비스가 일반 공급됩니다.

  • 새 모델: 최신 텍스트 모델인 text-davinci-003(미국 동부, 서유럽), text-ada-embeddings-002(미국 동부, 미국 중남부, 서유럽) 추가

2022년 12월

새로운 기능

  • OpenAI의 최신 모델입니다. Azure OpenAI는 GPT-3.5 시리즈를 포함한 모든 최신 모델에 대한 액세스를 제공합니다.

  • 새로운 API 버전(2022-12-01). 이 업데이트에는 API 응답의 토큰 사용 정보, 파일에 대한 개선된 오류 메시지, 미세 조정 만들기 데이터 구조에 대한 OpenAI와의 맞춤, 미세 조정 작업의 사용자 지정 명명을 허용하는 접미사 매개 변수 지원을 포함하여 요청된 몇 가지 개선 사항이 포함되어 있습니다. ​

  • 초당 요청 제한이 더 높습니다. Davinci가 아닌 모델의 경우 50입니다. Davinci 모델의 경우 20개입니다.

  • 배포를 더 빠르게 미세 조정합니다. 10분 이내에 Ada 및 Curie 미세 조정 모델을 배포합니다.

  • 높은 학습 한도: Ada, Babbage 및 Curie에 대한 4천만 개의 학습 토큰. Davinci의 경우 10M입니다.

  • 남용 및 오용 데이터 로깅 및 인간의 검토에 대한 수정 요청 프로세스입니다. 현재 이 서비스는 이러한 강력한 모델이 남용되지 않도록 남용 및 오용 검색 목적으로 요청/응답 데이터를 로그합니다. 그러나 많은 고객이 자신의 데이터에 대한 더 많은 제어가 필요한 엄격한 데이터 개인 정보 보호 및 보안 요구 사항을 가지고 있습니다. 이러한 사용 사례를 지원하기 위해 고객이 콘텐츠 필터링 정책을 수정하거나 위험도가 낮은 사용 사례에 대한 남용 기록을 해제할 수 있는 새로운 프로세스를 출시하고 있습니다. 이 프로세스는 Azure AI 서비스 내에 확립된 제한된 액세스 프로세스를 따르며 기존 OpenAI 고객은 여기에서 신청할 수 있습니다.

  • CMK(고객 관리형 키) 암호화. CMK는 학습 데이터 및 사용자 지정된 모델을 저장하는 데 사용되는 자체 암호화 키를 제공하여 고객이 Azure OpenAI에서 데이터 관리를 보다 효과적으로 제어할 수 있도록 합니다. CMK(고객 관리 키)(BYOK(Bring Your Own Key)라고도 함)를 사용하여 훨씬 더 유연하게 액세스 제어를 만들고, 회전하고, 해제하고, 취소할 수 있습니다. 데이터를 보호하는 데 사용되는 암호화 키를 감사할 수도 있습니다. 유휴 데이터 암호화 설명서에서 자세히 알아봅니다.

  • Lockbox 지원

  • SOC-2 준수

  • Azure Resource Health, 비용 분석 및 메트릭 및 진단 설정을 통한 로깅 및 진단.

  • 스튜디오 개선. 미세 조정된 모델을 만들고 배포할 수 있는 액세스 권한이 있는 팀을 제어하기 위한 Azure AD 역할 지원을 포함하여 Studio 워크플로에 대한 수많은 유용성 개선.

변경 내용(중단)

미세 조정 만들기 API 요청이 OpenAI의 스키마와 일치하도록 업데이트되었습니다.

미리 보기 API 버전:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "hyperparams": { ​
        "batch_size": 4,​
        "learning_rate_multiplier": 0.1,​
        "n_epochs": 4,​
        "prompt_loss_weight": 0.1,​
    }​
}

API 버전 2022-12-01:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "batch_size": 4,​
    "learning_rate_multiplier": 0.1,​
    "n_epochs": 4,​
    "prompt_loss_weight": 0.1,​
}

기본적으로 콘텐츠 필터링은 일시적으로 꺼져 있습니다. Azure 콘텐츠 조정은 Azure OpenAI와 다르게 작동합니다. Azure OpenAI는 생성 호출 중에 콘텐츠 필터를 실행하여 유해하거나 악의적인 콘텐츠를 검색하고 응답에서 필터링합니다. 자세한 정보

​이러한 모델은 2023년 1분기에 다시 사용되며 기본적으로 켜집니다. ​

고객 작업

다음 단계

Azure OpenAI를 지원하는 기본 모델에 대해 자세히 알아봅니다.