Проверка выходных данных индексатора видео Azure AI
Внимание
Из-за объявления об Службы мультимедиа Azure выхода на пенсию Индексатор видео Azure объявляет корректировки функций Индексатора видео Azure. Ознакомьтесь с изменениями, связанными с выходом на пенсию службы мультимедиа Azure (AMS), чтобы понять, что это означает для учетной записи Индексатора видео Azure. Ознакомьтесь с руководством по обновлению и миграции AMS: VI.
При индексировании видео Azure AI Video Indexer создает содержимое JSON, содержащее сведения об указанной аналитике видео. Эти аналитические сведения включают расшифровку, элементы оптического распознавания символов (OCR), лица, темы и аналогичные сведения. Каждый тип аналитических сведений содержит экземпляры диапазонов времени с отображением времени, когда такие аналитические сведения появляются в видео.
Дополнительные сведения см. в аналитических сведениях об индексаторе видео в Azure AI.
Корневые элементы аналитических сведений
Имя | Описание |
---|---|
accountId |
Идентификатор учетной записи Индексатора видео, содержащей список воспроизведения. |
id |
Идентификатор списка воспроизведения. |
name |
Имя списка воспроизведения. |
description |
Описание списка воспроизведения. |
userName |
Имя пользователя, создавшего список воспроизведения. |
created |
Время создания списка воспроизведения. |
privacyMode |
Режим конфиденциальности списка воспроизведения (Private или Public ). |
state |
Состояние списка воспроизведения (Uploaded , Processing , Processed , Failed или Quarantined ). |
isOwned |
Указывает, был ли список воспроизведения создан текущим пользователем. |
isEditable |
Указывает, имеет ли текущий пользователь право изменять список воспроизведения. |
isBase |
Указывает, является ли список воспроизведения основным (одно видео) или составлен на основе других видео (производный). |
durationInSeconds |
Общая длительность списка воспроизведения. |
summarizedInsights |
Созданные выходные данные JSON содержат Insights и SummarizedInsights элементы. Рекомендуется использовать и не использовать Insights SummarizedInsights (которое присутствует для обратной совместимости). |
videos |
Список видео, которые составляют список воспроизведения. Если этот список воспроизведения создан из диапазонов времени других видео (производных), видео в этом списке содержат только данные из включенных диапазонов времени. |
{
...
"accountId": "00000000-0000-0000-0000-000000000000",
"id": "abc3454321",
"name": "My first video",
"description": "I am trying VI",
"userName": "Some name",
"created": "2018/2/2 18:00:00.000",
"privacyMode": "Private",
"state": "Processed",
"isOwned": true,
"isEditable": false,
"isBase": false,
"durationInSeconds": 120,
"summarizedInsights" : null,
"videos": [{ . . . }]
}
Совет
Созданные выходные данные JSON содержат Insights
и SummarizedInsights
элементы. Настоятельно рекомендуется использовать и не использовать Insights
SummarizedInsights
(которое присутствует для обратной совместимости).
Сводка аналитических сведений
В этом разделе приводится сводка аналитических сведений.
Атрибут | Description |
---|---|
name |
Имя видео. Например: Azure Monitor . |
id |
Идентификатор видео. Например: 63c6d532ff . |
privacyMode |
Анализируемое видео может иметь один из следующих режимов: видео Public доступно для всех пользователей в вашей учетной записи и любому пользователю, у которого есть ссылка на видео. Видео Private доступно для всех пользователей в вашей учетной записи. |
duration |
Время, когда произошло создание аналитики, в секундах. |
thumbnailVideoId |
Идентификатор видео, из которого создан эскиз. |
thumbnailId |
Идентификатор эскиза видео. Чтобы получить фактический эскиз, вызовите Get-Thumbnail и передайте thumbnailVideoId и thumbnailId . |
faces |
Содержит ноль или более лиц. Дополнительные сведения см. в разделе "Лица". |
keywords |
Содержит ноль или более ключевых слов. Дополнительные сведения см. в разделе keywords. |
sentiments |
Содержит ноль или более тональностей. Дополнительные сведения см. в разделе sentiments. |
audioEffects |
Содержит ноль или более звуковых эффектов. Дополнительные сведения см. в разделе audioEffects. |
labels |
Содержит ноль или более меток. Дополнительные сведения см. в разделе labels. |
brands |
Содержит ноль или более торговых марок. Дополнительные сведения см. в разделе brands. |
statistics |
Дополнительные сведения см. в разделе statistics. |
emotions |
Содержит ноль или более эмоций. Дополнительные сведения см. в разделе emotions. |
topics |
Содержит ноль или более тем. Дополнительные сведения см. в разделе topics. |
videos
Имя | Описание |
---|---|
accountId |
Идентификатор учетной записи Индексатора видео, содержащей видео. |
id |
Идентификатор видео. |
name |
Имя видео. |
state |
Состояние видео (Uploaded , Processing , Processed , Failed или Quarantined ). |
processingProgress |
Ход выполнения во время обработки. Например: 20% . |
failureCode |
Код ошибки, если видео не удалось обработать. Например: UnsupportedFileType . |
failureMessage |
Сообщение ошибки, если видео не удалось обработать. |
externalId |
Внешний идентификатор видео (если указан пользователем). |
externalUrl |
Внешний URL-адрес видео (если указан пользователем). |
metadata |
Внешние метаданные видео (если указаны пользователем). |
isAdult |
Указывает, определено ли видео как содержимое для взрослых при проверке вручную. |
insights |
Объект insights. Дополнительные сведения см. в разделе insights. |
thumbnailId |
Идентификатор эскиза видео. Чтобы получить фактический эскиз, вызовите Get-Thumbnail и передайте идентификатор видео и идентификатор эскиза. |
publishedUrl |
URL-адрес для потоковой передачи видео. |
publishedUrlProxy |
URL-адрес для потоковой передачи видео на устройства Apple. |
viewToken |
Маркер просмотра с ограниченным сроком действия для потоковой передачи видео. |
sourceLanguage |
Исходный язык видео. |
language |
Фактический язык видео (язык перевода). |
indexingPreset |
Предустановка, используемая для индексирования видео. |
streamingPreset |
Предустановка, используемая для публикации видео. |
linguisticModelId |
Модель настройки расшифровки (CRIS), используемая для расшифровки видео. |
statistics |
Дополнительные сведения см. в разделе statistics. |
{
"videos": [{
"accountId": "2cbbed36-1972-4506-9bc7-55367912df2d",
"id": "142a356aa6",
"state": "Processed",
"privacyMode": "Private",
"processingProgress": "100%",
"failureCode": "General",
"failureMessage": "",
"externalId": null,
"externalUrl": null,
"metadata": null,
"insights": {. . . },
"thumbnailId": "89d7192c-1dab-4377-9872-473eac723845",
"publishedUrl": "https://videvmediaservices.streaming.mediaservices.windows.net:443/d88a652d-334b-4a66-a294-3826402100cd/Xamarine.ism/manifest",
"publishedProxyUrl": null,
"viewToken": "Bearer=<token>",
"sourceLanguage": "En-US",
"language": "En-US",
"indexingPreset": "Default",
"linguisticModelId": "00000000-0000-0000-0000-000000000000"
}],
}
insights
Каждая аналитика (например, строки расшифровки, лица или торговые марки) содержит список уникальных элементов (например, face1
, face2
, face3
). Каждый элемент имеет собственные метаданные и список своих экземпляров, которые являются диапазонами времени с дополнительными метаданными.
Лицо может иметь идентификатор, имя, эскиз, другие метаданные и список его темпоральных экземпляров (например, 00:00:05 – 00:00:10
, 00:01:00 - 00:02:30
и 00:41:21 – 00:41:49
). Каждый временной экземпляр может содержать дополнительные метаданные. Например, метаданные могут включать координаты прямоугольника вокруг лица (20,230,60,60
).
Версия | Версия кода |
---|---|
sourceLanguage |
Исходный язык видео (предполагается один основной язык) в виде строки BCP-47. |
language |
Язык аналитики (перевод с исходного языка) в виде строки BCP-47. |
transcript |
Аналитические сведения по расшифровке. |
ocr |
Аналитические сведения по распознаванию символов. |
keywords |
Аналитические сведения по ключевым словам. |
transcripts |
Может содержать одну или несколько расшифровок. |
faces |
Лица проницательности. |
labels |
Аналитические сведения по меткам. |
shots |
Аналитические сведения по снимкам. |
brands |
Аналитические сведения по торговым маркам. |
audioEffects |
Аналитические сведения по звуковым эффектам. |
sentiments |
Аналитические сведения по тональности. |
visualContentModeration |
Аналитические сведения по изменению визуального содержимого. |
textualContentModeration |
Аналитические сведения по изменению текстового содержимого. |
emotions |
Аналитические сведения по эмоциям. |
topics |
Аналитические сведения по темам. |
speakers |
Аналитические сведения по говорящим. |
Пример:
{
"version": "0.9.0.0",
"sourceLanguage": "en-US",
"language": "es-ES",
"transcript": ...,
"ocr": ...,
"keywords": ...,
"faces": ...,
"labels": ...,
"shots": ...,
"brands": ...,
"audioEffects": ...,
"sentiments": ...,
"visualContentModeration": ...,
"textualContentModeration": ...
}
расшифровка
Имя | Описание |
---|---|
id |
Идентификатор строки. |
text |
Сама расшифровка аудиозаписи. |
confidence |
Доверительный уровень для точности расшифровки. |
speakerId |
Идентификатор говорящего. |
language |
Язык расшифровки аудиозаписи. Предназначен для поддержки расшифровки, где каждая строка может быть написана на другом языке. |
instances |
Список диапазонов времени, в которых появилась эта строка. Если экземпляр находится в расшифровке, он имеет только один экземпляр. |
Пример:
"transcript":[
{
"id":1,
"text":"Well, good morning everyone and welcome to",
"confidence":0.8839,
"speakerId":1,
"language":"en-US",
"instances":[
{
"adjustedStart":"0:00:10.21",
"adjustedEnd":"0:00:12.81",
"start":"0:00:10.21",
"end":"0:00:12.81"
}
]
},
{
"id":2,
"text":"ignite 2016. Your mission at Microsoft is to empower every",
"confidence":0.8944,
"speakerId":2,
"language":"en-US",
"instances":[
{
"adjustedStart":"0:00:12.81",
"adjustedEnd":"0:00:17.03",
"start":"0:00:12.81",
"end":"0:00:17.03"
}
]
}
ocr
Имя | Описание |
---|---|
id |
Идентификатор строки OCR. |
text |
Текст OCR. |
confidence |
Достоверность распознавания. |
language |
Язык OCR. |
instances |
Список диапазонов времени, в которых появилось это OCR. (Одно и то же OCR может встречаться несколько раз.) |
height |
Высота прямоугольника OCR. |
top |
Верхнее расположение в пикселях. |
left |
Левое расположение в пикселях. |
width |
Ширина прямоугольника OCR. |
angle |
Угол прямоугольника OCR, от -180 до 180 . Значение 0 означает горизонтальное письмо слева направо. Значение 90 означает вертикальное письмо сверху вниз. Значение 180 означает горизонтальное письмо справа налево. Значение -90 означает вертикальное письмо снизу вверх. Значение 30 означает письмо с левого верхнего угла в правый нижний. |
"ocr": [
{
"id": 0,
"text": "LIVE FROM NEW YORK",
"confidence": 675.971,
"height": 35,
"language": "en-US",
"left": 31,
"top": 97,
"width": 400,
"angle": 30,
"instances": [
{
"start": "00:00:26",
"end": "00:00:52"
}
]
}
],
ключевые слова
Имя | Описание |
---|---|
id |
Идентификатор ключевого слова. |
text |
Текст ключевого слова. |
confidence |
Достоверность распознавания ключевого слова. |
language |
Язык ключевого слова (при наличии перевода). |
instances |
Список диапазонов времени, когда проявляется это ключевое слово. (Ключевое слово может встречаться несколько раз.) |
{
id: 0,
text: "technology",
confidence: 1,
language: "en-US",
instances: [{
adjustedStart: "0:05:15.782",
adjustedEnd: "0:05:16.249",
start: "0:05:15.782",
end: "0:05:16.249"
},
{
adjustedStart: "0:04:54.761",
adjustedEnd: "0:04:55.228",
start: "0:04:54.761",
end: "0:04:55.228"
}]
}
faces
Если лица присутствуют, Индексатор видео Azure ИИ использует API распознавания лиц во всех кадрах видео для обнаружения лиц и знаменитостей.
Имя | Описание |
---|---|
id |
Идентификатор лица. |
name |
Имя лица. Это может быть Unknown #0 , идентифицированная знаменитость или заданный клиентом человек. |
confidence |
Доверительный уровень идентификации лиц. |
description |
Текстовое описание знаменитости. |
thumbnailId |
Идентификатор эскиза лица. |
knownPersonId |
Внутренний идентификатор, если это известный человек. |
referenceId |
Идентификатор Bing, если это знаменитость из Bing. |
referenceType |
В настоящее время только Bing. |
title |
Если это знаменитость, род деятельности. Например: Microsoft's CEO . |
imageUrl |
URL-адрес изображения, если это знаменитость. |
instances |
Экземпляры, где лицо появилось в данном диапазоне времени. У каждого экземпляра также есть значение thumbnailsIds . |
"faces": [{
"id": 2002,
"name": "Xam 007",
"confidence": 0.93844,
"description": null,
"thumbnailId": "00000000-aee4-4be2-a4d5-d01817c07955",
"knownPersonId": "8340004b-5cf5-4611-9cc4-3b13cca10634",
"referenceId": null,
"title": null,
"imageUrl": null,
"instances": [{
"thumbnailsIds": ["00000000-9f68-4bb2-ab27-3b4d9f2d998e",
"cef03f24-b0c7-4145-94d4-a84f81bb588c"],
"adjustedStart": "00:00:07.2400000",
"adjustedEnd": "00:00:45.6780000",
"start": "00:00:07.2400000",
"end": "00:00:45.6780000"
},
{
"thumbnailsIds": ["00000000-51e5-4260-91a5-890fa05c68b0"],
"adjustedStart": "00:10:23.9570000",
"adjustedEnd": "00:10:39.2390000",
"start": "00:10:23.9570000",
"end": "00:10:39.2390000"
}]
}]
меток.
Имя | Описание |
---|---|
id |
Идентификатор метки. |
name |
Имя метки. Пример: Computer или TV . |
language |
Язык имени метки (при переводе) в виде строки BCP-47. |
instances |
Список диапазонов времени, в которых появилась эта метка. (Метка может отображаться несколько раз.) Каждый экземпляр имеет поле доверительного уровня. |
"labels": [
{
"id": 0,
"name": "person",
"language": "en-US",
"instances": [
{
"confidence": 1.0,
"start": "00: 00: 00.0000000",
"end": "00: 00: 25.6000000"
},
{
"confidence": 1.0,
"start": "00: 01: 33.8670000",
"end": "00: 01: 39.2000000"
}
]
},
{
"name": "indoor",
"language": "en-US",
"id": 1,
"instances": [
{
"confidence": 1.0,
"start": "00: 00: 06.4000000",
"end": "00: 00: 07.4670000"
},
{
"confidence": 1.0,
"start": "00: 00: 09.6000000",
"end": "00: 00: 10.6670000"
},
{
"confidence": 1.0,
"start": "00: 00: 11.7330000",
"end": "00: 00: 20.2670000"
},
{
"confidence": 1.0,
"start": "00: 00: 21.3330000",
"end": "00: 00: 25.6000000"
}
]
}
]
scenes
Имя | Описание |
---|---|
id |
Идентификатор сцены. |
instances |
Список диапазонов времени этой сцены. (Сцена может иметь только один экземпляр.) |
"scenes":[
{
"id":0,
"instances":[
{
"start":"0:00:00",
"end":"0:00:06.34",
"duration":"0:00:06.34"
}
]
},
{
"id":1,
"instances":[
{
"start":"0:00:06.34",
"end":"0:00:47.047",
"duration":"0:00:40.707"
}
]
},
]
shots
Имя | Описание |
---|---|
id |
Идентификатор съемки. |
keyFrames |
Список ключевых кадров в съемке. Каждый из них имеет идентификатор и список диапазонов времени экземпляра. Каждый экземпляр ключевого кадра имеет поле thumbnailId , которое содержит идентификатор эскиза ключевого кадра. |
instances |
Список диапазонов времени этой съемки. (Съемка может иметь только один экземпляр.) |
"shots":[
{
"id":0,
"keyFrames":[
{
"id":0,
"instances":[
{
"thumbnailId":"00000000-0000-0000-0000-000000000000",
"start":"0:00:00.209",
"end":"0:00:00.251",
"duration":"0:00:00.042"
}
]
},
{
"id":1,
"instances":[
{
"thumbnailId":"00000000-0000-0000-0000-000000000000",
"start":"0:00:04.755",
"end":"0:00:04.797",
"duration":"0:00:00.042"
}
]
}
],
"instances":[
{
"start":"0:00:00",
"end":"0:00:06.34",
"duration":"0:00:06.34"
}
]
},
]
brands
Индексатор видео в Azure AI обнаруживает названия бизнес-и продуктов в транскрибировании речи в тексте и /или видео OCR. Эта информация не включает визуальное распознавание брендов или обнаружения логотипов.
Имя | Описание |
---|---|
id |
Идентификатор торговой марки. |
name |
Наименование торговой марки. |
referenceId |
Суффикс URL-адреса статьи о торговой марке в Википедии. Например, Target_Corporation является суффиксом адреса https://en.wikipedia.org/wiki/Target_Corporation. |
referenceUrl |
URL-адрес Википедии бренда, если он существует. Например: https://en.wikipedia.org/wiki/Target_Corporation. |
description |
Описание торговой марки. |
tags |
Список предопределенных тегов, которые связаны с этой торговой маркой. |
confidence |
Значение достоверности детектора фирменной символики Индексатора видео Azure (0 -1 ). |
instances |
Список диапазонов времени для этой торговой марки. Каждый экземпляр содержит значение brandType , которое указывает, появилась торговая марка при расшифровке, либо при распознавании текста. |
"brands": [
{
"id": 0,
"name": "MicrosoftExcel",
"referenceId": "Microsoft_Excel",
"referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft_Excel",
"referenceType": "Wiki",
"description": "Microsoft Excel is a sprea..",
"tags": [],
"confidence": 0.975,
"instances": [
{
"brandType": "Transcript",
"start": "00: 00: 31.3000000",
"end": "00: 00: 39.0600000"
}
]
},
{
"id": 1,
"name": "Microsoft",
"referenceId": "Microsoft",
"referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft",
"description": "Microsoft Corporation is...",
"tags": [
"competitors",
"technology"
],
"confidence": 1.0,
"instances": [
{
"brandType": "Transcript",
"start": "00: 01: 44",
"end": "00: 01: 45.3670000"
},
{
"brandType": "Ocr",
"start": "00: 01: 54",
"end": "00: 02: 45.3670000"
}
]
}
]
статистика
Имя | Описание |
---|---|
CorrespondenceCount |
Количество соответствий в видео. |
SpeakerWordCount |
Число слов каждого говорящего. |
SpeakerNumberOfFragments |
Число фрагментов в видео на определенного говорящего. |
SpeakerLongestMonolog |
Самый длинный монолог говорящего. Учитываются также паузы в монологе говорящего. Паузы в начале и конце монолога удаляются. |
SpeakerTalkToListenRatio |
Результат вычисления основан на длительности монолога говорящего (без учета пауз между монологами), деленной на общее время видео. Значение времени округляется до трех знаков после запятой. |
audioEffects (предварительная версия)
Имя | Описание |
---|---|
id |
Идентификатор звукового эффекта. |
type |
Тип звукового эффекта. |
name |
Тип звукового эффекта на языке, на котором был индексирован этот файл JSON. |
instances |
Список диапазонов времени, в которых появились эти аудиоэффекты. У каждого экземпляра есть поле достоверности. |
start + end |
Диапазон времени в исходном видео. |
adjustedStart + adjustedEnd |
Диапазон времени по сравнению со скорректированным диапазоном времени. |
audioEffects: [{
{
id: 0,
type: "Laughter",
name: "Laughter",
instances: [{
confidence: 0.8815,
adjustedStart: "0:00:10.2",
adjustedEnd: "0:00:11.2",
start: "0:00:10.2",
end: "0:00:11.2"
}, {
confidence: 0.8554,
adjustedStart: "0:00:48.26",
adjustedEnd: "0:00:49.56",
start: "0:00:48.26",
end: "0:00:49.56"
}, {
confidence: 0.8492,
adjustedStart: "0:00:59.66",
adjustedEnd: "0:01:00.66",
start: "0:00:59.66",
end: "0:01:00.66"
}
]
}
],
sentiments
Тональности объединяются по их sentimentType
полю (Positive
илиNeutral
Negative
). Например: 0-0.1
, 0.1-0.2
.
Имя | Описание |
---|---|
id |
Идентификатор тональности. |
averageScore |
Среднее значение всех оценок всех экземпляров этого типа тональности. |
instances |
Список диапазонов времени, в которых появилась эта тональность. |
sentimentType |
Тип может иметь значение Positive , Neutral или Negative . |
"sentiments": [
{
"id": 0,
"averageScore": 0.87,
"sentimentType": "Positive",
"instances": [
{
"start": "00:00:23",
"end": "00:00:41"
}
]
}, {
"id": 1,
"averageScore": 0.11,
"sentimentType": "Positive",
"instances": [
{
"start": "00:00:13",
"end": "00:00:21"
}
]
}
]
visualContentModeration
Расшифровка visualContentModeration
содержит диапазоны времени, которые индексатор видео Azure ИИ обнаружил, что потенциально имеет содержимое для взрослых. Если блок visualContentModeration
пуст, значит содержимое для взрослых не выявлено.
Видео, в которых обнаружено содержимое для взрослых или содержимое непристойного характера, могут быть доступны только для закрытого просмотра. Пользователи могут отправить запрос на проверку содержимого. В этом случае IsAdult
атрибут содержит результат проверки человека.
Имя | Описание |
---|---|
id |
Идентификатор модерации визуального контента. |
adultScore |
Результат оценки содержимого для взрослых (после модерации содержимого). |
racyScore |
Результат оценки содержимого непристойного характера (от Content Moderator). |
instances |
Список диапазонов времени, где применяется модерация контента. |
Дополнительные сведения о visualContentModeration
- Документация по службам ИИ Azure
- Примечание по прозрачности
- Варианты использования
- Возможности и ограничения
- Руководство по интеграции и ответственному использованию
- Данные, конфиденциальность и безопасность
"visualContentModeration": [
{
"id": 0,
"adultScore": 0.00069,
"racyScore": 0.91129,
"instances": [
{
"start": "00:00:25.4840000",
"end": "00:00:25.5260000"
}
]
},
{
"id": 1,
"adultScore": 0.99231,
"racyScore": 0.99912,
"instances": [
{
"start": "00:00:35.5360000",
"end": "00:00:35.5780000"
}
]
}
]
textualContentModeration
Имя | Описание |
---|---|
id |
Идентификатор модерации текстового контента. |
bannedWordsCount |
Число запрещенных слов. |
bannedWordsRatio |
Отношение запрещенных слов к общему числу слов. |
Дополнительные сведения о textualContentModeration
- Документация по службам ИИ Azure
- Поддерживаемые языки
- Возможности и ограничения
- Данные, конфиденциальность и безопасность
emotions
Индексатор видео Azure AI определяет эмоции на основе речи и звуковых подсказок.
Имя | Описание |
---|---|
id |
Идентификатор эмоции. |
type |
Тип идентифицированной эмоции: Joy , Sadness , Anger или Fear . |
instances |
Список диапазонов времени, когда проявлялась эта эмоция. |
"emotions": [{
"id": 0,
"type": "Fear",
"instances": [{
"adjustedStart": "0:00:39.47",
"adjustedEnd": "0:00:45.56",
"start": "0:00:39.47",
"end": "0:00:45.56"
},
{
"adjustedStart": "0:07:19.57",
"adjustedEnd": "0:07:23.25",
"start": "0:07:19.57",
"end": "0:07:23.25"
}]
},
{
"id": 1,
"type": "Anger",
"instances": [{
"adjustedStart": "0:03:55.99",
"adjustedEnd": "0:04:05.06",
"start": "0:03:55.99",
"end": "0:04:05.06"
},
{
"adjustedStart": "0:04:56.5",
"adjustedEnd": "0:05:04.35",
"start": "0:04:56.5",
"end": "0:05:04.35"
}]
},
{
"id": 2,
"type": "Joy",
"instances": [{
"adjustedStart": "0:12:23.68",
"adjustedEnd": "0:12:34.76",
"start": "0:12:23.68",
"end": "0:12:34.76"
},
{
"adjustedStart": "0:12:46.73",
"adjustedEnd": "0:12:52.8",
"start": "0:12:46.73",
"end": "0:12:52.8"
},
{
"adjustedStart": "0:30:11.29",
"adjustedEnd": "0:30:16.43",
"start": "0:30:11.29",
"end": "0:30:16.43"
},
{
"adjustedStart": "0:41:37.23",
"adjustedEnd": "0:41:39.85",
"start": "0:41:37.23",
"end": "0:41:39.85"
}]
},
{
"id": 3,
"type": "Sad",
"instances": [{
"adjustedStart": "0:13:38.67",
"adjustedEnd": "0:13:41.3",
"start": "0:13:38.67",
"end": "0:13:41.3"
},
{
"adjustedStart": "0:28:08.88",
"adjustedEnd": "0:28:18.16",
"start": "0:28:08.88",
"end": "0:28:18.16"
}]
}
],
topics
Индексатор видео azure ai делает вывод основных тем из расшифровок. По возможности включается второй уровень классификации IPTC.
Имя | Описание |
---|---|
id |
Идентификатор темы. |
name |
Имя темы. Например: Pharmaceuticals . |
referenceId |
Навигация, отражающая иерархию темы. Например: HEALTH AND WELLBEING/MEDICINE AND HEALTHCARE/PHARMACEUTICALS . |
confidence |
Оценка надежности в диапазоне 0 -1 . Чем больше значение, тем выше степень надежности. |
language |
Язык темы. |
iptcName |
Название кода мультимедиа IPTC, если таковой обнаружен. |
instances |
В настоящее время Индексатор видео Azure AI не индексирует раздел на интервалы времени. В качестве интервала используется все видео. |
"topics": [{
"id": 0,
"name": "INTERNATIONAL RELATIONS",
"referenceId": "POLITICS AND GOVERNMENT/FOREIGN POLICY/INTERNATIONAL RELATIONS",
"referenceType": "VideoIndexer",
"confidence": 1,
"language": "en-US",
"instances": [{
"adjustedStart": "0:00:00",
"adjustedEnd": "0:03:36.25",
"start": "0:00:00",
"end": "0:03:36.25"
}]
}, {
"id": 1,
"name": "Politics and Government",
"referenceType": "VideoIndexer",
"iptcName": "Politics",
"confidence": 0.9041,
"language": "en-US",
"instances": [{
"adjustedStart": "0:00:00",
"adjustedEnd": "0:03:36.25",
"start": "0:00:00",
"end": "0:03:36.25"
}]
}]
. . .
Динамики
Имя | Описание |
---|---|
id |
Идентификатор говорящего. |
name |
Наименование говорящего в формате Speaker #<number> . Например: Speaker #1 . |
instances |
Список диапазонов времени, когда проявляется этот говорящий. |
"speakers":[
{
"id":1,
"name":"Speaker #1",
"instances":[
{
"adjustedStart":"0:00:10.21",
"adjustedEnd":"0:00:12.81",
"start":"0:00:10.21",
"end":"0:00:12.81"
}
]
},
{
"id":2,
"name":"Speaker #2",
"instances":[
{
"adjustedStart":"0:00:12.81",
"adjustedEnd":"0:00:17.03",
"start":"0:00:12.81",
"end":"0:00:17.03"
}
]
},
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по