Azure AI 视频索引器支持矩阵和服务限制

本文介绍 Azure AI 视频索引器支持的格式和限制。

上传文件大小和视频持续时间

如果从设备上传文件,文件大小限制为 2 GB。

如果视频是从 URL 上传的,文件大小限制为 30 GB。 URL 必须导致具有媒体文件扩展名(例如 myvideo.MP4)而不是网页(例如 https://www.youtube.com)的联机媒体文件。

文件持续时间限制为 4 小时。

索引请求限制

通过 VI 网站上传和编制索引时,最多可以在单个请求中为 10 个视频编制索引。 通过 API 提交请求时,API 请求限制为每秒 10 个请求,每分钟最多 120 个请求。

语言

有关支持的语言列表,请参阅我们的 语言支持文章

使用单语言或多语言检测时,在为媒体文件编制索引期间允许识别 10 种语言。 可以选择 10 种语言。

OCR

视频索引器每个索引视频的 OCR 限制为 50,000 个单词。 达到限制后,不会生成其他 OCR 结果。

项目

使用网站时,项目中的源文件数限制为 10,使用 API 时限制为 100。

自定义人员模型

每个人员模型最多支持 100 万人,每个 VI 帐户最多可以有 50 个人员模型。

徽标检测

徽标组最多可以包含 50 个徽标。

支持的文件格式

Azure AI 视频索引器支持以下文件格式:

文件格式(文件扩展名)
FLV(使用 H.264 和 AAC 编解码器)(.flv)
MXF (.mxf)
GXF (.gxf)
MPEG2-PS、MPEG2-TS、3GP(.ts、.ps、.3gp、.3gpp、.mpg)
Windows Media 视频 (WMV)/ASF(.wmv、.asf)
AVI(8 位/10 位未压缩)(.avi)
MP4(.mp4、.m4a、.m4v)/ISMV(.isma、.ismv)
Microsoft 数字视频录制 (DVR-MS) (.dvr-ms)
Matroska/WebM (.mkv)
WAVE/WAV (.wav)
QuickTime (.mov)

支持的输入视频编解码器

输入视频编解码器
AVC 8 位/10 位,最多 4:2:2,包括 AVCIntra、8 位 4:2:0 和 4:2:2
Sony XAVC/XAVC S(在 MXF 容器中)
Avid DNxHD(在 MXF 容器中)
DVCPro/DVCProHD(在 MXF 容器中)
数字视频 (DV)(AVI 文件格式)
JPEG 2000
MPEG-2(最多 422 个配置文件和高水平);包括索尼 XDCAM、索尼 XDCAM HD、索尼 XDCAM HD、索尼 XDCAM IMX、CableLabs® 和 D10 等变体,最多 420 个配置文件
MPEG-1
VC-1/WMV9
Mpeg-4 第 2 部分
Theora
YUV420(未压缩或夹层)
Apple ProRes 422
Apple ProRes 422 LT
Apple ProRes 422 HQ
Apple ProRes Proxy
Apple ProRes 4444
Apple ProRes 4444 XQ
HEVC/H.265 主配置文件

支持的输入音频编解码器

输入音频编解码器
AAC(AAC-LC、AAC-HE 和 AAC-HEv2;最高支持 5.1)
MPEG Layer 2
MP3 (MPEG-1 Audio Layer 3)
Windows Media 音频
WAV/PCM
FLAC
Opus
Vorbis
AMR(自适应多速率)

输出格式

视频将转码为单个格式和分辨率(720p)、mp4 H254(视频)和 AAC(音频)。