Проверка выходных данных индексатора видео Azure AI

Внимание

Из-за объявления об Службы мультимедиа Azure выхода на пенсию Индексатор видео Azure объявляет корректировки функций Индексатора видео Azure. Ознакомьтесь с изменениями, связанными с выходом на пенсию службы мультимедиа Azure (AMS), чтобы понять, что это означает для учетной записи Индексатора видео Azure. Ознакомьтесь с руководством по обновлению и миграции AMS: VI.

При индексировании видео Azure AI Video Indexer создает содержимое JSON, содержащее сведения об указанной аналитике видео. Эти аналитические сведения включают расшифровку, элементы оптического распознавания символов (OCR), лица, темы и аналогичные сведения. Каждый тип аналитических сведений содержит экземпляры диапазонов времени с отображением времени, когда такие аналитические сведения появляются в видео.

Дополнительные сведения см. в аналитических сведениях об индексаторе видео в Azure AI.

Корневые элементы аналитических сведений

Имя Описание
accountId Идентификатор учетной записи Индексатора видео, содержащей список воспроизведения.
id Идентификатор списка воспроизведения.
name Имя списка воспроизведения.
description Описание списка воспроизведения.
userName Имя пользователя, создавшего список воспроизведения.
created Время создания списка воспроизведения.
privacyMode Режим конфиденциальности списка воспроизведения (Private или Public).
state Состояние списка воспроизведения (Uploaded, Processing, Processed, Failed или Quarantined).
isOwned Указывает, был ли список воспроизведения создан текущим пользователем.
isEditable Указывает, имеет ли текущий пользователь право изменять список воспроизведения.
isBase Указывает, является ли список воспроизведения основным (одно видео) или составлен на основе других видео (производный).
durationInSeconds Общая длительность списка воспроизведения.
summarizedInsights Созданные выходные данные JSON содержат Insights и SummarizedInsights элементы. Рекомендуется использовать и не использовать InsightsSummarizedInsights (которое присутствует для обратной совместимости).
videos Список видео, которые составляют список воспроизведения.
Если этот список воспроизведения создан из диапазонов времени других видео (производных), видео в этом списке содержат только данные из включенных диапазонов времени.
{
  ...
  "accountId": "00000000-0000-0000-0000-000000000000",
  "id": "abc3454321",
  "name": "My first video",
  "description": "I am trying VI",
  "userName": "Some name",
  "created": "2018/2/2 18:00:00.000",
  "privacyMode": "Private",
  "state": "Processed",
  "isOwned": true,
  "isEditable": false,
  "isBase": false,
  "durationInSeconds": 120, 
  "summarizedInsights" : null,
  "videos": [{ . . . }]
}

Совет

Созданные выходные данные JSON содержат Insights и SummarizedInsights элементы. Настоятельно рекомендуется использовать и не использовать InsightsSummarizedInsights (которое присутствует для обратной совместимости).

Сводка аналитических сведений

В этом разделе приводится сводка аналитических сведений.

Атрибут Description
name Имя видео. Например: Azure Monitor.
id Идентификатор видео. Например: 63c6d532ff.
privacyMode Анализируемое видео может иметь один из следующих режимов: видео Public доступно для всех пользователей в вашей учетной записи и любому пользователю, у которого есть ссылка на видео. Видео Private доступно для всех пользователей в вашей учетной записи.
duration Время, когда произошло создание аналитики, в секундах.
thumbnailVideoId Идентификатор видео, из которого создан эскиз.
thumbnailId Идентификатор эскиза видео. Чтобы получить фактический эскиз, вызовите Get-Thumbnail и передайте thumbnailVideoId и thumbnailId.
faces Содержит ноль или более лиц. Дополнительные сведения см. в разделе "Лица".
keywords Содержит ноль или более ключевых слов. Дополнительные сведения см. в разделе keywords.
sentiments Содержит ноль или более тональностей. Дополнительные сведения см. в разделе sentiments.
audioEffects Содержит ноль или более звуковых эффектов. Дополнительные сведения см. в разделе audioEffects.
labels Содержит ноль или более меток. Дополнительные сведения см. в разделе labels.
brands Содержит ноль или более торговых марок. Дополнительные сведения см. в разделе brands.
statistics Дополнительные сведения см. в разделе statistics.
emotions Содержит ноль или более эмоций. Дополнительные сведения см. в разделе emotions.
topics Содержит ноль или более тем. Дополнительные сведения см. в разделе topics.

videos

Имя Описание
accountId Идентификатор учетной записи Индексатора видео, содержащей видео.
id Идентификатор видео.
name Имя видео.
state Состояние видео (Uploaded, Processing, Processed, Failed или Quarantined).
processingProgress Ход выполнения во время обработки. Например: 20%.
failureCode Код ошибки, если видео не удалось обработать. Например: UnsupportedFileType.
failureMessage Сообщение ошибки, если видео не удалось обработать.
externalId Внешний идентификатор видео (если указан пользователем).
externalUrl Внешний URL-адрес видео (если указан пользователем).
metadata Внешние метаданные видео (если указаны пользователем).
isAdult Указывает, определено ли видео как содержимое для взрослых при проверке вручную.
insights Объект insights. Дополнительные сведения см. в разделе insights.
thumbnailId Идентификатор эскиза видео. Чтобы получить фактический эскиз, вызовите Get-Thumbnail и передайте идентификатор видео и идентификатор эскиза.
publishedUrl URL-адрес для потоковой передачи видео.
publishedUrlProxy URL-адрес для потоковой передачи видео на устройства Apple.
viewToken Маркер просмотра с ограниченным сроком действия для потоковой передачи видео.
sourceLanguage Исходный язык видео.
language Фактический язык видео (язык перевода).
indexingPreset Предустановка, используемая для индексирования видео.
streamingPreset Предустановка, используемая для публикации видео.
linguisticModelId Модель настройки расшифровки (CRIS), используемая для расшифровки видео.
statistics Дополнительные сведения см. в разделе statistics.
{
    "videos": [{
        "accountId": "2cbbed36-1972-4506-9bc7-55367912df2d",
        "id": "142a356aa6",
        "state": "Processed",
        "privacyMode": "Private",
        "processingProgress": "100%",
        "failureCode": "General",
        "failureMessage": "",
        "externalId": null,
        "externalUrl": null,
        "metadata": null,
        "insights": {. . . },
        "thumbnailId": "89d7192c-1dab-4377-9872-473eac723845",
        "publishedUrl": "https://videvmediaservices.streaming.mediaservices.windows.net:443/d88a652d-334b-4a66-a294-3826402100cd/Xamarine.ism/manifest",
        "publishedProxyUrl": null,
        "viewToken": "Bearer=<token>",
        "sourceLanguage": "En-US",
        "language": "En-US",
        "indexingPreset": "Default",
        "linguisticModelId": "00000000-0000-0000-0000-000000000000"
    }],
}

insights

Каждая аналитика (например, строки расшифровки, лица или торговые марки) содержит список уникальных элементов (например, face1, face2, face3). Каждый элемент имеет собственные метаданные и список своих экземпляров, которые являются диапазонами времени с дополнительными метаданными.

Лицо может иметь идентификатор, имя, эскиз, другие метаданные и список его темпоральных экземпляров (например, 00:00:05 – 00:00:10, 00:01:00 - 00:02:30и 00:41:21 – 00:41:49). Каждый временной экземпляр может содержать дополнительные метаданные. Например, метаданные могут включать координаты прямоугольника вокруг лица (20,230,60,60).

Версия Версия кода
sourceLanguage Исходный язык видео (предполагается один основной язык) в виде строки BCP-47.
language Язык аналитики (перевод с исходного языка) в виде строки BCP-47.
transcript Аналитические сведения по расшифровке.
ocr Аналитические сведения по распознаванию символов.
keywords Аналитические сведения по ключевым словам.
transcripts Может содержать одну или несколько расшифровок.
faces Лица проницательности.
labels Аналитические сведения по меткам.
shots Аналитические сведения по снимкам.
brands Аналитические сведения по торговым маркам.
audioEffects Аналитические сведения по звуковым эффектам.
sentiments Аналитические сведения по тональности.
visualContentModeration Аналитические сведения по изменению визуального содержимого.
textualContentModeration Аналитические сведения по изменению текстового содержимого.
emotions Аналитические сведения по эмоциям.
topics Аналитические сведения по темам.
speakers Аналитические сведения по говорящим.

Пример:

{
  "version": "0.9.0.0",
  "sourceLanguage": "en-US",
  "language": "es-ES",
  "transcript": ...,
  "ocr": ...,
  "keywords": ...,
  "faces": ...,
  "labels": ...,
  "shots": ...,
  "brands": ...,
  "audioEffects": ...,
  "sentiments": ...,
  "visualContentModeration": ...,
  "textualContentModeration": ...
}

расшифровка

Имя Описание
id Идентификатор строки.
text Сама расшифровка аудиозаписи.
confidence Доверительный уровень для точности расшифровки.
speakerId Идентификатор говорящего.
language Язык расшифровки аудиозаписи. Предназначен для поддержки расшифровки, где каждая строка может быть написана на другом языке.
instances Список диапазонов времени, в которых появилась эта строка. Если экземпляр находится в расшифровке, он имеет только один экземпляр.

Пример:

"transcript":[
{
  "id":1,
  "text":"Well, good morning everyone and welcome to",
  "confidence":0.8839,
  "speakerId":1,
  "language":"en-US",
  "instances":[
     {
    "adjustedStart":"0:00:10.21",
    "adjustedEnd":"0:00:12.81",
    "start":"0:00:10.21",
    "end":"0:00:12.81"
     }
  ]
},
{
  "id":2,
  "text":"ignite 2016. Your mission at Microsoft is to empower every",
  "confidence":0.8944,
  "speakerId":2,
  "language":"en-US",
  "instances":[
     {
    "adjustedStart":"0:00:12.81",
    "adjustedEnd":"0:00:17.03",
    "start":"0:00:12.81",
    "end":"0:00:17.03"
     }
  ]
}

ocr

Имя Описание
id Идентификатор строки OCR.
text Текст OCR.
confidence Достоверность распознавания.
language Язык OCR.
instances Список диапазонов времени, в которых появилось это OCR. (Одно и то же OCR может встречаться несколько раз.)
height Высота прямоугольника OCR.
top Верхнее расположение в пикселях.
left Левое расположение в пикселях.
width Ширина прямоугольника OCR.
angle Угол прямоугольника OCR, от -180 до 180. Значение 0 означает горизонтальное письмо слева направо. Значение 90 означает вертикальное письмо сверху вниз. Значение 180 означает горизонтальное письмо справа налево. Значение -90 означает вертикальное письмо снизу вверх. Значение 30 означает письмо с левого верхнего угла в правый нижний.
"ocr": [
    {
      "id": 0,
      "text": "LIVE FROM NEW YORK",
      "confidence": 675.971,
      "height": 35,
      "language": "en-US",
      "left": 31,
      "top": 97,
      "width": 400,
      "angle": 30,
      "instances": [
        {
          "start": "00:00:26",
          "end": "00:00:52"
        }
      ]
    }
  ],

ключевые слова

Имя Описание
id Идентификатор ключевого слова.
text Текст ключевого слова.
confidence Достоверность распознавания ключевого слова.
language Язык ключевого слова (при наличии перевода).
instances Список диапазонов времени, когда проявляется это ключевое слово. (Ключевое слово может встречаться несколько раз.)
{
    id: 0,
    text: "technology",
    confidence: 1,
    language: "en-US",
    instances: [{
            adjustedStart: "0:05:15.782",
            adjustedEnd: "0:05:16.249",
            start: "0:05:15.782",
            end: "0:05:16.249"
    },
    {
            adjustedStart: "0:04:54.761",
            adjustedEnd: "0:04:55.228",
            start: "0:04:54.761",
            end: "0:04:55.228"
    }]
}

faces

Если лица присутствуют, Индексатор видео Azure ИИ использует API распознавания лиц во всех кадрах видео для обнаружения лиц и знаменитостей.

Имя Описание
id Идентификатор лица.
name Имя лица. Это может быть Unknown #0, идентифицированная знаменитость или заданный клиентом человек.
confidence Доверительный уровень идентификации лиц.
description Текстовое описание знаменитости.
thumbnailId Идентификатор эскиза лица.
knownPersonId Внутренний идентификатор, если это известный человек.
referenceId Идентификатор Bing, если это знаменитость из Bing.
referenceType В настоящее время только Bing.
title Если это знаменитость, род деятельности. Например: Microsoft's CEO.
imageUrl URL-адрес изображения, если это знаменитость.
instances Экземпляры, где лицо появилось в данном диапазоне времени. У каждого экземпляра также есть значение thumbnailsIds.
"faces": [{
    "id": 2002,
    "name": "Xam 007",
    "confidence": 0.93844,
    "description": null,
    "thumbnailId": "00000000-aee4-4be2-a4d5-d01817c07955",
    "knownPersonId": "8340004b-5cf5-4611-9cc4-3b13cca10634",
    "referenceId": null,
    "title": null,
    "imageUrl": null,
    "instances": [{
        "thumbnailsIds": ["00000000-9f68-4bb2-ab27-3b4d9f2d998e",
        "cef03f24-b0c7-4145-94d4-a84f81bb588c"],
        "adjustedStart": "00:00:07.2400000",
        "adjustedEnd": "00:00:45.6780000",
        "start": "00:00:07.2400000",
        "end": "00:00:45.6780000"
    },
    {
        "thumbnailsIds": ["00000000-51e5-4260-91a5-890fa05c68b0"],
        "adjustedStart": "00:10:23.9570000",
        "adjustedEnd": "00:10:39.2390000",
        "start": "00:10:23.9570000",
        "end": "00:10:39.2390000"
    }]
}]

меток.

Имя Описание
id Идентификатор метки.
name Имя метки. Пример: Computer или TV.
language Язык имени метки (при переводе) в виде строки BCP-47.
instances Список диапазонов времени, в которых появилась эта метка. (Метка может отображаться несколько раз.) Каждый экземпляр имеет поле доверительного уровня.
"labels": [
    {
      "id": 0,
      "name": "person",
      "language": "en-US",
      "instances": [
        {
          "confidence": 1.0,
          "start": "00: 00: 00.0000000",
          "end": "00: 00: 25.6000000"
        },
        {
          "confidence": 1.0,
          "start": "00: 01: 33.8670000",
          "end": "00: 01: 39.2000000"
        }
      ]
    },
    {
      "name": "indoor",
      "language": "en-US",
      "id": 1,
      "instances": [
        {
          "confidence": 1.0,
          "start": "00: 00: 06.4000000",
          "end": "00: 00: 07.4670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 09.6000000",
          "end": "00: 00: 10.6670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 11.7330000",
          "end": "00: 00: 20.2670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 21.3330000",
          "end": "00: 00: 25.6000000"
        }
      ]
    }
  ] 

scenes

Имя Описание
id Идентификатор сцены.
instances Список диапазонов времени этой сцены. (Сцена может иметь только один экземпляр.)
"scenes":[  
    {  
      "id":0,
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },
    {  
      "id":1,
      "instances":[  
          {  
            "start":"0:00:06.34",
            "end":"0:00:47.047",
            "duration":"0:00:40.707"
          }
      ]
    },

]

shots

Имя Описание
id Идентификатор съемки.
keyFrames Список ключевых кадров в съемке. Каждый из них имеет идентификатор и список диапазонов времени экземпляра. Каждый экземпляр ключевого кадра имеет поле thumbnailId, которое содержит идентификатор эскиза ключевого кадра.
instances Список диапазонов времени этой съемки. (Съемка может иметь только один экземпляр.)
"shots":[  
    {  
      "id":0,
      "keyFrames":[  
          {  
            "id":0,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:00.209",
                  "end":"0:00:00.251",
                  "duration":"0:00:00.042"
                }
            ]
          },
          {  
            "id":1,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:04.755",
                  "end":"0:00:04.797",
                  "duration":"0:00:00.042"
                }
            ]
          }
      ],
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },

]

brands

Индексатор видео в Azure AI обнаруживает названия бизнес-и продуктов в транскрибировании речи в тексте и /или видео OCR. Эта информация не включает визуальное распознавание брендов или обнаружения логотипов.

Имя Описание
id Идентификатор торговой марки.
name Наименование торговой марки.
referenceId Суффикс URL-адреса статьи о торговой марке в Википедии. Например, Target_Corporation является суффиксом адреса https://en.wikipedia.org/wiki/Target_Corporation.
referenceUrl URL-адрес Википедии бренда, если он существует. Например: https://en.wikipedia.org/wiki/Target_Corporation.
description Описание торговой марки.
tags Список предопределенных тегов, которые связаны с этой торговой маркой.
confidence Значение достоверности детектора фирменной символики Индексатора видео Azure (0-1).
instances Список диапазонов времени для этой торговой марки. Каждый экземпляр содержит значение brandType, которое указывает, появилась торговая марка при расшифровке, либо при распознавании текста.
"brands": [
{
    "id": 0,
    "name": "MicrosoftExcel",
    "referenceId": "Microsoft_Excel",
    "referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft_Excel",
    "referenceType": "Wiki",
    "description": "Microsoft Excel is a sprea..",
    "tags": [],
    "confidence": 0.975,
    "instances": [
    {
        "brandType": "Transcript",
        "start": "00: 00: 31.3000000",
        "end": "00: 00: 39.0600000"
    }
    ]
},
{
    "id": 1,
    "name": "Microsoft",
    "referenceId": "Microsoft",
    "referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft",
    "description": "Microsoft Corporation is...",
    "tags": [
    "competitors",
    "technology"
    ],
    "confidence": 1.0,
    "instances": [
    {
        "brandType": "Transcript",
        "start": "00: 01: 44",
        "end": "00: 01: 45.3670000"
    },
    {
        "brandType": "Ocr",
        "start": "00: 01: 54",
        "end": "00: 02: 45.3670000"
    }
    ]
}
]

статистика

Имя Описание
CorrespondenceCount Количество соответствий в видео.
SpeakerWordCount Число слов каждого говорящего.
SpeakerNumberOfFragments Число фрагментов в видео на определенного говорящего.
SpeakerLongestMonolog Самый длинный монолог говорящего. Учитываются также паузы в монологе говорящего. Паузы в начале и конце монолога удаляются.
SpeakerTalkToListenRatio Результат вычисления основан на длительности монолога говорящего (без учета пауз между монологами), деленной на общее время видео. Значение времени округляется до трех знаков после запятой.

audioEffects (предварительная версия)

Имя Описание
id Идентификатор звукового эффекта.
type Тип звукового эффекта.
name Тип звукового эффекта на языке, на котором был индексирован этот файл JSON.
instances Список диапазонов времени, в которых появились эти аудиоэффекты. У каждого экземпляра есть поле достоверности.
start + end Диапазон времени в исходном видео.
adjustedStart + adjustedEnd Диапазон времени по сравнению со скорректированным диапазоном времени.
audioEffects: [{
 {
        id: 0,
        type: "Laughter",
        name: "Laughter",
        instances: [{
                confidence: 0.8815,
                adjustedStart: "0:00:10.2",
                adjustedEnd: "0:00:11.2",
                start: "0:00:10.2",
                end: "0:00:11.2"
            }, {
                confidence: 0.8554,
                adjustedStart: "0:00:48.26",
                adjustedEnd: "0:00:49.56",
                start: "0:00:48.26",
                end: "0:00:49.56"
            }, {
                confidence: 0.8492,
                adjustedStart: "0:00:59.66",
                adjustedEnd: "0:01:00.66",
                start: "0:00:59.66",
                end: "0:01:00.66"
            }
        ]
    }
],

sentiments

Тональности объединяются по их sentimentType полю (PositiveилиNeutralNegative). Например: 0-0.1, 0.1-0.2.

Имя Описание
id Идентификатор тональности.
averageScore Среднее значение всех оценок всех экземпляров этого типа тональности.
instances Список диапазонов времени, в которых появилась эта тональность.
sentimentType Тип может иметь значение Positive, Neutral или Negative.
"sentiments": [
{
    "id": 0,
    "averageScore": 0.87,
    "sentimentType": "Positive",
    "instances": [
    {
        "start": "00:00:23",
        "end": "00:00:41"
    }
    ]
}, {
    "id": 1,
    "averageScore": 0.11,
    "sentimentType": "Positive",
    "instances": [
    {
        "start": "00:00:13",
        "end": "00:00:21"
    }
    ]
}
]

visualContentModeration

Расшифровка visualContentModeration содержит диапазоны времени, которые индексатор видео Azure ИИ обнаружил, что потенциально имеет содержимое для взрослых. Если блок visualContentModeration пуст, значит содержимое для взрослых не выявлено.

Видео, в которых обнаружено содержимое для взрослых или содержимое непристойного характера, могут быть доступны только для закрытого просмотра. Пользователи могут отправить запрос на проверку содержимого. В этом случае IsAdult атрибут содержит результат проверки человека.

Имя Описание
id Идентификатор модерации визуального контента.
adultScore Результат оценки содержимого для взрослых (после модерации содержимого).
racyScore Результат оценки содержимого непристойного характера (от Content Moderator).
instances Список диапазонов времени, где применяется модерация контента.

Дополнительные сведения о visualContentModeration

"visualContentModeration": [
{
    "id": 0,
    "adultScore": 0.00069,
    "racyScore": 0.91129,
    "instances": [
    {
        "start": "00:00:25.4840000",
        "end": "00:00:25.5260000"
    }
    ]
},
{
    "id": 1,
    "adultScore": 0.99231,
    "racyScore": 0.99912,
    "instances": [
    {
        "start": "00:00:35.5360000",
        "end": "00:00:35.5780000"
    }
    ]
}
] 

textualContentModeration

Имя Описание
id Идентификатор модерации текстового контента.
bannedWordsCount Число запрещенных слов.
bannedWordsRatio Отношение запрещенных слов к общему числу слов.
Дополнительные сведения о textualContentModeration

emotions

Индексатор видео Azure AI определяет эмоции на основе речи и звуковых подсказок.

Имя Описание
id Идентификатор эмоции.
type Тип идентифицированной эмоции: Joy, Sadness, Anger или Fear.
instances Список диапазонов времени, когда проявлялась эта эмоция.
"emotions": [{
    "id": 0,
    "type": "Fear",
    "instances": [{
      "adjustedStart": "0:00:39.47",
      "adjustedEnd": "0:00:45.56",
      "start": "0:00:39.47",
      "end": "0:00:45.56"
    },
    {
      "adjustedStart": "0:07:19.57",
      "adjustedEnd": "0:07:23.25",
      "start": "0:07:19.57",
      "end": "0:07:23.25"
    }]
  },
  {
    "id": 1,
    "type": "Anger",
    "instances": [{
      "adjustedStart": "0:03:55.99",
      "adjustedEnd": "0:04:05.06",
      "start": "0:03:55.99",
      "end": "0:04:05.06"
    },
    {
      "adjustedStart": "0:04:56.5",
      "adjustedEnd": "0:05:04.35",
      "start": "0:04:56.5",
      "end": "0:05:04.35"
    }]
  },
  {
    "id": 2,
    "type": "Joy",
    "instances": [{
      "adjustedStart": "0:12:23.68",
      "adjustedEnd": "0:12:34.76",
      "start": "0:12:23.68",
      "end": "0:12:34.76"
    },
    {
      "adjustedStart": "0:12:46.73",
      "adjustedEnd": "0:12:52.8",
      "start": "0:12:46.73",
      "end": "0:12:52.8"
    },
    {
      "adjustedStart": "0:30:11.29",
      "adjustedEnd": "0:30:16.43",
      "start": "0:30:11.29",
      "end": "0:30:16.43"
    },
    {
      "adjustedStart": "0:41:37.23",
      "adjustedEnd": "0:41:39.85",
      "start": "0:41:37.23",
      "end": "0:41:39.85"
    }]
  },
  {
    "id": 3,
    "type": "Sad",
    "instances": [{
      "adjustedStart": "0:13:38.67",
      "adjustedEnd": "0:13:41.3",
      "start": "0:13:38.67",
      "end": "0:13:41.3"
    },
    {
      "adjustedStart": "0:28:08.88",
      "adjustedEnd": "0:28:18.16",
      "start": "0:28:08.88",
      "end": "0:28:18.16"
    }]
  }
],

topics

Индексатор видео azure ai делает вывод основных тем из расшифровок. По возможности включается второй уровень классификации IPTC.

Имя Описание
id Идентификатор темы.
name Имя темы. Например: Pharmaceuticals.
referenceId Навигация, отражающая иерархию темы. Например: HEALTH AND WELLBEING/MEDICINE AND HEALTHCARE/PHARMACEUTICALS.
confidence Оценка надежности в диапазоне 0-1. Чем больше значение, тем выше степень надежности.
language Язык темы.
iptcName Название кода мультимедиа IPTC, если таковой обнаружен.
instances В настоящее время Индексатор видео Azure AI не индексирует раздел на интервалы времени. В качестве интервала используется все видео.
"topics": [{
    "id": 0,
    "name": "INTERNATIONAL RELATIONS",
    "referenceId": "POLITICS AND GOVERNMENT/FOREIGN POLICY/INTERNATIONAL RELATIONS",
    "referenceType": "VideoIndexer",
    "confidence": 1,
    "language": "en-US",
    "instances": [{
        "adjustedStart": "0:00:00",
        "adjustedEnd": "0:03:36.25",
        "start": "0:00:00",
        "end": "0:03:36.25"
    }]
}, {
    "id": 1,
    "name": "Politics and Government",
    "referenceType": "VideoIndexer",
    "iptcName": "Politics",
    "confidence": 0.9041,
    "language": "en-US",
    "instances": [{
        "adjustedStart": "0:00:00",
        "adjustedEnd": "0:03:36.25",
        "start": "0:00:00",
        "end": "0:03:36.25"
    }]
}]
. . .

Динамики

Имя Описание
id Идентификатор говорящего.
name Наименование говорящего в формате Speaker #<number>. Например: Speaker #1.
instances Список диапазонов времени, когда проявляется этот говорящий.
"speakers":[
{
  "id":1,
  "name":"Speaker #1",
  "instances":[
     {
    "adjustedStart":"0:00:10.21",
    "adjustedEnd":"0:00:12.81",
    "start":"0:00:10.21",
    "end":"0:00:12.81"
     }
  ]
},
{
  "id":2,
  "name":"Speaker #2",
  "instances":[
     {
    "adjustedStart":"0:00:12.81",
    "adjustedEnd":"0:00:17.03",
    "start":"0:00:12.81",
    "end":"0:00:17.03"
     }
  ]
},