Examen de la salida de Video Analyzer for Media

Cuando se indexa un vídeo, Azure Video Analyzer for Media (anteriormente, Video Indexer) genera el contenido JSON que contiene los detalles de la información detallada de vídeo especificada. La información detallada incluye transcripciones, OCR, rostros, temas o bloques, entre otras. Cada tipo de conclusión incluye instancias de intervalos de tiempo que se muestran cuando aparece la conclusión en el vídeo.

Puede examinar visualmente la información detallada del vídeo. Para ello, presione el botón Reproducir que hay encima del vídeo en el sitio web de Video Analyzer for Media.

También puede usar la API si llama a Get Video Index API y el estado de la respuesta es correcto. Obtendrá una salida JSON detallada como contenido de la respuesta.

Información detallada

En este artículo se examina la salida de Video Analyzer for Media (contenido JSON).
Para información acerca de qué características e información detallada están disponibles, consulte Información de Video Analyzer for Media.

Nota

La expiración de todos los tokens de acceso en Video Analyzer for Media es de una hora.

Obtenga la información detallada

Información detallada o salida producida en el portal o sitio web

  1. Vaya al sitio web de Video Analyzer for Media e inicie sesión.
  2. Busque un vídeo con la salida que desee examinar.
  3. Presione Reproducir.
  4. Seleccione la pestaña Insights (información resumida) o la pestaña Escala de tiempo (permite filtrar la información pertinente).
  5. Descargue los artefactos y sus elementos.

Para más información, consulte Visualización y edición de la información detallada de un vídeo.

Información detallada o salida generada por la API

  1. Para recuperar el archivo JSON, llame a Get Video Index API.

  2. Si también está interesado en artefactos específicos, llame a Get Video Artifact Download URL API.

    En la llamada API, especifique el tipo de artefacto solicitado (OCR, caras, fotogramas clave, etc.).

Elementos raíz de la información detallada

Nombre Descripción
accountId Identificador de la cuenta de Video Indexer de la lista de reproducción.
id Identificador de la lista de reproducción.
name Nombre de la lista de reproducción.
description Descripción de la lista de reproducción.
userName Nombre del usuario que creó la lista de reproducción.
created Hora de creación de la lista de reproducción.
privacyMode Modo de privacidad de la lista de reproducción (privada/pública).
state Estado de la lista de reproducción (cargada, en proceso, procesada, error, en cuarentena).
isOwned Indica si la lista de reproducción la creó el usuario actual.
isEditable Indica si el usuario actual está autorizado para editar la lista de reproducción.
isBase Indica si la lista de reproducción es una lista de reproducción base (un vídeo) o una lista de reproducción formada por otros vídeos (derivada).
durationInSeconds Duración total de la lista de reproducción.
summarizedInsights Contiene la sección summarizedInsights con información detallada.
videos Lista de vídeos que forman la lista de reproducción.
Si esta lista de reproducción está compuesta por intervalos de tiempo de otros vídeos (derivados), los vídeos de esta lista contienen los datos únicamente de los intervalos de tiempo incluidos.
{
  "accountId": "bca61527-1221-bca6-1527-a90000002000",
  "id": "abc3454321",
  "name": "My first video",
  "description": "I am trying VI",
  "userName": "Some name",
  "created": "2018/2/2 18:00:00.000",
  "privacyMode": "Private",
  "state": "Processed",
  "isOwned": true,
  "isEditable": false,
  "isBase": false,
  "durationInSeconds": 120, 
  "summarizedInsights" : { . . . }
  "videos": [{ . . . }]
}

summarizedInsights

En esta sección se muestra el resumen de la información detallada.

Atributo Descripción
name Nombre del vídeo. Por ejemplo, Azure Monitor.
id Identificador del vídeo. Por ejemplo, 63c6d532ff.
privacyMode El desglose puede tener uno de los siguientes modos: Privado, Público. Público: el vídeo es visible para todos los usuarios de la cuenta y cualquiera que tenga un vínculo al vídeo. Privado: el vídeo es visible para todos los usuarios de la cuenta.
duration Duración que describe el momento del tiempo en el que se ha producido la información. La duración se mide en segundos.
thumbnailVideoId Identificador del vídeo del que se tomó la miniatura.
thumbnailId Identificador de la miniatura del vídeo. Para obtener la miniatura real, llame a Get-Thumbnail y pase los valores de thumbnailVideoId y thumbnailId.
faces/animatedCharacters Puede contener cero o más rostros. Para información más detallada, consulte faces/animatedCharacters.
keywords Puede contener cero o más palabras clave. Para más información, consulte keywords.
sentiments Puede contener cero o más opiniones. Para más información, consulte sentiments.
audioEffects Puede contener cero o más efectos de audio. Para más información, consulte audioEffects.
labels Puede contener cero o más etiquetas. Para más información, consulte labels.
brands Puede contener cero o más marcas. Para más información, consulte brands.
estadísticas Para más información, consulte statistics.
emotions Puede contener cero o más emociones. Para más información, consulte emotions.
topics Puede contener cero o más temas. Las conclusiones de los temas.

videos

Nombre Descripción
accountId Identificador de la cuenta de Video Indexer del vídeo.
id Identificador del vídeo.
name Nombre del vídeo.
state Estado del vídeo (cargado, en proceso, procesado, error, en cuarentena).
processingProgress Progreso del procesamiento (por ejemplo, 20 %).
failureCode Código de error si no se pudo procesar (por ejemplo, "UnsupportedFileType").
failureMessage Mensaje de error si no se pudo procesar.
externalId Identificador externo del vídeo (si lo especifica el usuario).
externalUrl URL externa del vídeo (si la especifica el usuario).
metadata Metadatos externos del vídeo (si los especifica el usuario).
isAdult Indica si el vídeo se ha revisado manualmente y se ha identificado como un vídeo para adultos.
insights Objeto de información detallada. Para más información, consulte insights.
thumbnailId Identificador de la miniatura del vídeo. Para obtener la miniatura real, llame a Get-Thumbnail y pase el identificador del vídeo y el valor de thumbnailId.
publishedUrl Dirección URL para transmitir el vídeo.
publishedUrlProxy Dirección URL desde la que se transmitirá el vídeo (para dispositivos de Apple).
viewToken Un token de visualización de corta duración para transmitir el vídeo.
sourceLanguage Idioma de origen del vídeo.
language Idioma real del vídeo (traducción).
indexingPreset Valor predeterminado utilizado para indexar el vídeo.
streamingPreset Valor predeterminado utilizado para publicar el vídeo.
linguisticModelId Modelo CRIS utilizado para transcribir el vídeo.
estadísticas Para más información, consulte statistics.
{
    "videos": [{
        "accountId": "2cbbed36-1972-4506-9bc7-55367912df2d",
        "id": "142a356aa6",
        "state": "Processed",
        "privacyMode": "Private",
        "processingProgress": "100%",
        "failureCode": "General",
        "failureMessage": "",
        "externalId": null,
        "externalUrl": null,
        "metadata": null,
        "insights": {. . . },
        "thumbnailId": "89d7192c-1dab-4377-9872-473eac723845",
        "publishedUrl": "https://videvmediaservices.streaming.mediaservices.windows.net:443/d88a652d-334b-4a66-a294-3826402100cd/Xamarine.ism/manifest",
        "publishedProxyUrl": null,
        "viewToken": "Bearer=<token>",
        "sourceLanguage": "En-US",
        "language": "En-US",
        "indexingPreset": "Default",
        "linguisticModelId": "00000000-0000-0000-0000-000000000000"
    }],
}

insights

Cada conclusión (por ejemplo, líneas de transcripción, rostros, marcas, etc.) contiene una lista de elementos únicos (por ejemplo, face1, face2, face3) y cada elemento tiene sus propios metadatos y una lista de sus instancias (que son intervalos de tiempo con metadatos opcionales adicionales).

Un rostro podría tener un identificador, un nombre, una miniatura, otros metadatos y una lista de sus instancias temporales (por ejemplo: 00:00:05: 00:00:10, 00:01:00: 00:02:30 y 00:41:21: 00:41:49). Cada instancia temporal puede tener metadatos adicionales. Por ejemplo, las coordenadas del rectángulo del rostro (20,230,60,60).

Versión Versión del código
sourceLanguage Idioma de origen del vídeo (suponiendo que hay un idioma principal). Con el formato de cadena BCP-47.
language Idioma de la información detallada (traducida del idioma de origen). Con el formato de cadena BCP-47.
transcript La conclusión transcript.
ocr La conclusión OCR.
keywords La conclusión keywords.
blocks Puede contener uno o más dimensiones blocks.
faces/animatedCharacters La información de faces/animatedCharacters.
labels La conclusión labels.
shots La conclusión shots.
brands La conclusión brands.
audioEffects La conclusión audioEffects.
sentiments La conclusión sentiments.
visualContentModeration La conclusión visualContentModeration.
textualContentModeration La conclusión visualContentModeration.
emotions La conclusión emotions.
topics Las conclusiones de los temas.
speakers La conclusión speakers.

Ejemplo:

{
  "version": "0.9.0.0",
  "sourceLanguage": "en-US",
  "language": "es-ES",
  "transcript": ...,
  "ocr": ...,
  "keywords": ...,
  "faces": ...,
  "labels": ...,
  "shots": ...,
  "brands": ...,
  "audioEffects": ...,
  "sentiments": ...,
  "visualContentModeration": ...,
  "textualContentModeration": ...
}

blocks

Atributo Descripción
id Identificador del bloque
instances Lista de intervalos de tiempo de este bloque.

transcript

Nombre Descripción
id Identificador de la línea.
text La transcripción en sí.
confidence Confianza de la precisión de la transcripción.
speakerId Identificador del orador.
language Idioma de la transcripción. Diseñado para admitir la transcripción, donde cada línea puede tener un idioma distinto.
instances Lista de los intervalos de tiempo donde apareció esta línea. Si la instancia es una transcripción, solo tendrá 1 instancia.

Ejemplo:

"transcript":[
{
  "id":1,
  "text":"Well, good morning everyone and welcome to",
  "confidence":0.8839,
  "speakerId":1,
  "language":"en-US",
  "instances":[
     {
    "adjustedStart":"0:00:10.21",
    "adjustedEnd":"0:00:12.81",
    "start":"0:00:10.21",
    "end":"0:00:12.81"
     }
  ]
},
{
  "id":2,
  "text":"ignite 2016. Your mission at Microsoft is to empower every",
  "confidence":0.8944,
  "speakerId":2,
  "language":"en-US",
  "instances":[
     {
    "adjustedStart":"0:00:12.81",
    "adjustedEnd":"0:00:17.03",
    "start":"0:00:12.81",
    "end":"0:00:17.03"
     }
  ]
},

ocr

Nombre Descripción
id Identificador de la línea OCR.
text Texto OCR.
confidence Confiabilidad del reconocimiento.
language Idioma de OCR.
instances Lista de los intervalos de tiempo donde apareció este OCR (el mismo OCR puede aparecer varias veces).
height El alto del rectángulo de OCR
top La ubicación superior en px
izquierda La ubicación izquierda en px
width El ancho del rectángulo de OCR
"ocr": [
    {
      "id": 0,
      "text": "LIVE FROM NEW YORK",
      "confidence": 675.971,
      "height": 35,
      "language": "en-US",
      "left": 31,
      "top": 97,
      "width": 400,      
      "instances": [
        {
          "start": "00:00:26",
          "end": "00:00:52"
        }
      ]
    }
  ],

keywords

Nombre Descripción
id Identificador de la palabra clave.
text Texto de la palabra clave.
confidence Confiabilidad del reconocimiento de la palabra clave.
language Idioma de la palabra clave (cuando se traduce).
instances Lista de los intervalos de tiempo donde apareció esta palabra clave (una palabra clave puede aparecer varias veces).
{
    id: 0,
    text: "technology",
    confidence: 1,
    language: "en-US",
    instances: [{
            adjustedStart: "0:05:15.782",
            adjustedEnd: "0:05:16.249",
            start: "0:05:15.782",
            end: "0:05:16.249"
    },
    {
            adjustedStart: "0:04:54.761",
            adjustedEnd: "0:04:55.228",
            start: "0:04:54.761",
            end: "0:04:55.228"
    }]
}

faces/animatedCharacters

El elemento animatedCharacters reemplaza faces en caso de que el vídeo se indexara con un modelo de caracteres animados. Para ello, se usa un modelo personalizado en Custom Vision. Video Analyzer for Media lo ejecuta en los fotogramas clave.

Si hay caras (no personajes animados), Video Analyzer for Media usa Face API en todos los fotogramas del vídeo para detectar los rostros y las celebridades.

Nombre Descripción
id Identificador del rostro.
name Nombre del rostro. Puede ser "Unknown #0", una celebridad identificada o una persona capacitada del cliente.
confidence Confidencialidad de la identificación facial.
description Descripción de la celebridad.
thumbnailId Identificador de la miniatura del rostro en cuestión.
knownPersonId Si es alguien conocido, su identificador interno.
referenceId Si es una celebridad de Bing, su identificador de Bing.
referenceType Actualmente, solo Bing.
title Si es una celebridad, su cargo (por ejemplo, "CEO de Microsoft").
imageUrl Si es una celebridad, la dirección URL de su imagen.
instances Instancias de cuándo apareció el rostro en el intervalo de tiempo determinado. Cada instancia también tiene su thumbnailsId.
"faces": [{
    "id": 2002,
    "name": "Xam 007",
    "confidence": 0.93844,
    "description": null,
    "thumbnailId": "00000000-aee4-4be2-a4d5-d01817c07955",
    "knownPersonId": "8340004b-5cf5-4611-9cc4-3b13cca10634",
    "referenceId": null,
    "title": null,
    "imageUrl": null,
    "instances": [{
        "thumbnailsIds": ["00000000-9f68-4bb2-ab27-3b4d9f2d998e",
        "cef03f24-b0c7-4145-94d4-a84f81bb588c"],
        "adjustedStart": "00:00:07.2400000",
        "adjustedEnd": "00:00:45.6780000",
        "start": "00:00:07.2400000",
        "end": "00:00:45.6780000"
    },
    {
        "thumbnailsIds": ["00000000-51e5-4260-91a5-890fa05c68b0"],
        "adjustedStart": "00:10:23.9570000",
        "adjustedEnd": "00:10:39.2390000",
        "start": "00:10:23.9570000",
        "end": "00:10:39.2390000"
    }]
}]

labels

Nombre Descripción
id Identificador de la etiqueta.
name Nombre de la etiqueta (por ejemplo, "Equipo", "TV").
language Idioma del nombre de la etiqueta (cuando se traduce). BCP-47
instances Lista de los intervalos de tiempo donde apareció esta etiqueta (una etiqueta puede aparecer varias veces). Cada instancia tiene un campo de confiabilidad.
"labels": [
    {
      "id": 0,
      "name": "person",
      "language": "en-US",
      "instances": [
        {
          "confidence": 1.0,
          "start": "00: 00: 00.0000000",
          "end": "00: 00: 25.6000000"
        },
        {
          "confidence": 1.0,
          "start": "00: 01: 33.8670000",
          "end": "00: 01: 39.2000000"
        }
      ]
    },
    {
      "name": "indoor",
      "language": "en-US",
      "id": 1,
      "instances": [
        {
          "confidence": 1.0,
          "start": "00: 00: 06.4000000",
          "end": "00: 00: 07.4670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 09.6000000",
          "end": "00: 00: 10.6670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 11.7330000",
          "end": "00: 00: 20.2670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 21.3330000",
          "end": "00: 00: 25.6000000"
        }
      ]
    }
  ] 

scenes

Nombre Descripción
id Identificador de la escena.
instances Lista de intervalos de tiempo de esta escena (una escena puede tener solo 1 instancia).
"scenes":[  
    {  
      "id":0,
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },
    {  
      "id":1,
      "instances":[  
          {  
            "start":"0:00:06.34",
            "end":"0:00:47.047",
            "duration":"0:00:40.707"
          }
      ]
    },

]

shots

Nombre Descripción
id Identificador de la toma.
keyFrames Lista de los fotogramas clave dentro de la toma (cada uno con un identificador y una lista de intervalos de tiempo de instancias). Cada instancia de fotograma clave tiene un campo thumbnailId que contiene el identificador de la miniatura del fotograma clave.
instances Lista de intervalos de tiempo de este corte (un corte puede tener solo 1 instancia).
"shots":[  
    {  
      "id":0,
      "keyFrames":[  
          {  
            "id":0,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:00.209",
                  "end":"0:00:00.251",
                  "duration":"0:00:00.042"
                }
            ]
          },
          {  
            "id":1,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:04.755",
                  "end":"0:00:04.797",
                  "duration":"0:00:00.042"
                }
            ]
          }
      ],
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },

]

brands

Nombres de empresas y marcas de productos detectados en la transcripción de voz a texto o de OCR de vídeo. No incluye el reconocimiento visual de marcas ni la detección de logotipos.

Nombre Descripción
id Identificador de marca.
name Nombre de la marca.
referenceId Sufijo de la dirección URL de la wikipedia de la marca. Por ejemplo, "Target_Corporation" es el sufijo de https://en.wikipedia.org/wiki/Target_Corporation.
referenceUrl Dirección url de la wikipedia de la marca, si existe. Por ejemplo, https://en.wikipedia.org/wiki/Target_Corporation.
description Descripción de la marca.
etiquetas Lista de etiquetas predefinidas asociadas a esta marca.
confidence Valor de la confianza del detector de marcas de Video Analyzer for Media (0-1).
instances Lista de intervalos de tiempo de esta marca. Cada instancia tiene un atributo brandType, que indica si esta marca apareció en la transcripción o en el reconocimiento óptico de caracteres.
"brands": [
{
    "id": 0,
    "name": "MicrosoftExcel",
    "referenceId": "Microsoft_Excel",
    "referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft_Excel",
    "referenceType": "Wiki",
    "description": "Microsoft Excel is a sprea..",
    "tags": [],
    "confidence": 0.975,
    "instances": [
    {
        "brandType": "Transcript",
        "start": "00: 00: 31.3000000",
        "end": "00: 00: 39.0600000"
    }
    ]
},
{
    "id": 1,
    "name": "Microsoft",
    "referenceId": "Microsoft",
    "referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft",
    "description": "Microsoft Corporation is...",
    "tags": [
    "competitors",
    "technology"
    ],
    "confidence": 1.0,
    "instances": [
    {
        "brandType": "Transcript",
        "start": "00: 01: 44",
        "end": "00: 01: 45.3670000"
    },
    {
        "brandType": "Ocr",
        "start": "00: 01: 54",
        "end": "00: 02: 45.3670000"
    }
    ]
}
]

estadísticas

Nombre Descripción
CorrespondenceCount Número de correspondencias en el vídeo.
SpeakerWordCount Número de palabras por orador.
SpeakerNumberOfFragments Cantidad de fragmentos que el orador tiene en un vídeo.
SpeakerLongestMonolog Monólogo más largo del orador. Si el orador tiene períodos de silencio dentro del monólogo, se incluyen. Los silencios al principio y al final del monólogo se eliminan.
SpeakerTalkToListenRatio El cálculo se basa en el tiempo invertido en el monólogo del orador (sin los silencios intermedios) dividido por el tiempo total del vídeo. El tiempo se redondea a tres decimales.

audioEffects (versión preliminar)

Nombre Descripción
id Identificador del efecto de audio.
type Tipo de efecto de audio.
name Tipo de efecto de audio en el idioma en el que se indexó el código JSON.
instances Lista de los intervalos de tiempo donde apareció este efecto de audio. Cada instancia tiene un campo de confiabilidad.
start + end Intervalo de tiempo del vídeo original.
adjustedStart + adjustedEnd Intervalo de tiempo frente a intervalo de tiempo ajustado
audioEffects: [{
 {
        id: 0,
        type: "Laughter",
        name: "Laughter",
        instances: [{
                confidence: 0.8815,
                adjustedStart: "0:00:10.2",
                adjustedEnd: "0:00:11.2",
                start: "0:00:10.2",
                end: "0:00:11.2"
            }, {
                confidence: 0.8554,
                adjustedStart: "0:00:48.26",
                adjustedEnd: "0:00:49.56",
                start: "0:00:48.26",
                end: "0:00:49.56"
            }, {
                confidence: 0.8492,
                adjustedStart: "0:00:59.66",
                adjustedEnd: "0:01:00.66",
                start: "0:00:59.66",
                end: "0:01:00.66"
            }
        ]
    }
],

sentiments

Las opiniones se agregan según su campo sentimentType (Positive/Neutral/Negative). Por ejemplo, 0-0,1, 0,1-0,2.

Nombre Descripción
id Identificador de la opinión.
averageScore Promedio de todas las puntuaciones de todas las instancias de ese tipo de opinión: Positive/Neutral/Negative.
instances Lista de los intervalos de tiempo donde apareció esta opinión.
sentimentType El tipo puede ser "Positive", "Neutral" o "Negative".
"sentiments": [
{
    "id": 0,
    "averageScore": 0.87,
    "sentimentType": "Positive",
    "instances": [
    {
        "start": "00:00:23",
        "end": "00:00:41"
    }
    ]
}, {
    "id": 1,
    "averageScore": 0.11,
    "sentimentType": "Positive",
    "instances": [
    {
        "start": "00:00:13",
        "end": "00:00:21"
    }
    ]
}
]

visualContentModeration

El bloque visualContentModeration contiene intervalos de tiempo en los que Video Analyzer for Media ha detectado que podría haber contenido para adultos. Si visualContentModeration está vacío, no se ha identificado ningún contenido para adultos.

Los vídeos en los que se encuentre contenido para adultos o subido de tono podrían estar disponibles solo para visualización privada. Los usuarios tienen la opción de enviar una solicitud de revisión humana del contenido, en cuyo caso el atributo IsAdult contendrá el resultado de la revisión humana.

Nombre Descripción
id Identificador de la moderación del contenido visual.
adultScore Puntuación de contenido para adultos (del moderador de contenido).
racyScore Puntuación de contenido subido de tono (del moderador de contenido).
instances Lista de intervalos de tiempo donde apareció esta moderación de contenido visual.
"VisualContentModeration": [
{
    "id": 0,
    "adultScore": 0.00069,
    "racyScore": 0.91129,
    "instances": [
    {
        "start": "00:00:25.4840000",
        "end": "00:00:25.5260000"
    }
    ]
},
{
    "id": 1,
    "adultScore": 0.99231,
    "racyScore": 0.99912,
    "instances": [
    {
        "start": "00:00:35.5360000",
        "end": "00:00:35.5780000"
    }
    ]
}
] 

textualContentModeration

Nombre Descripción
id Identificador de la moderación de contenido textual.
bannedWordsCount Número de palabras no permitidas.
bannedWordsRatio Proporción respecto al número total de palabras.

emotions

Video Analyzer for Media identifica emociones en función de las indicaciones para voz y audio. La emoción identificada podría ser: felicidad, tristeza, ira o miedo.

Nombre Descripción
id Identificador de la emoción.
type Momento de la emoción que se identificó en función de las indicaciones para voz y audio. La emoción podría ser: felicidad, tristeza, ira o miedo.
instances Lista de los intervalos de tiempo donde apareció esta emoción.
"emotions": [{
    "id": 0,
    "type": "Fear",
    "instances": [{
      "adjustedStart": "0:00:39.47",
      "adjustedEnd": "0:00:45.56",
      "start": "0:00:39.47",
      "end": "0:00:45.56"
    },
    {
      "adjustedStart": "0:07:19.57",
      "adjustedEnd": "0:07:23.25",
      "start": "0:07:19.57",
      "end": "0:07:23.25"
    }]
  },
  {
    "id": 1,
    "type": "Anger",
    "instances": [{
      "adjustedStart": "0:03:55.99",
      "adjustedEnd": "0:04:05.06",
      "start": "0:03:55.99",
      "end": "0:04:05.06"
    },
    {
      "adjustedStart": "0:04:56.5",
      "adjustedEnd": "0:05:04.35",
      "start": "0:04:56.5",
      "end": "0:05:04.35"
    }]
  },
  {
    "id": 2,
    "type": "Joy",
    "instances": [{
      "adjustedStart": "0:12:23.68",
      "adjustedEnd": "0:12:34.76",
      "start": "0:12:23.68",
      "end": "0:12:34.76"
    },
    {
      "adjustedStart": "0:12:46.73",
      "adjustedEnd": "0:12:52.8",
      "start": "0:12:46.73",
      "end": "0:12:52.8"
    },
    {
      "adjustedStart": "0:30:11.29",
      "adjustedEnd": "0:30:16.43",
      "start": "0:30:11.29",
      "end": "0:30:16.43"
    },
    {
      "adjustedStart": "0:41:37.23",
      "adjustedEnd": "0:41:39.85",
      "start": "0:41:37.23",
      "end": "0:41:39.85"
    }]
  },
  {
    "id": 3,
    "type": "Sad",
    "instances": [{
      "adjustedStart": "0:13:38.67",
      "adjustedEnd": "0:13:41.3",
      "start": "0:13:38.67",
      "end": "0:13:41.3"
    },
    {
      "adjustedStart": "0:28:08.88",
      "adjustedEnd": "0:28:18.16",
      "start": "0:28:08.88",
      "end": "0:28:18.16"
    }]
  }
],

topics

Video Analyzer for Media realiza la inferencia de los temas principales de las transcripciones. Cuando es posible, se incluye la taxonomía IPTC de segundo nivel.

Nombre Descripción
id Identificador del tema.
name El nombre del tema, por ejemplo: "productos farmacéuticos".
referenceId Rutas de navegación que reflejan la jerarquía de temas. Por ejemplo: "Salud y bienestar / Medicina y salud / Productos farmacéuticos".
confidence Puntuación de confianza en el intervalo [0,1]. Cuanto mayor es, más segura es.
language Idioma que se usa en el tema.
iptcName Nombre del código multimedia IPTC, si se detecta.
instances Actualmente, Video Analyzer for Media no indexa ningún tema en intervalos de tiempo, por lo que se usa el vídeo completo como intervalo.
"topics": [{
    "id": 0,
    "name": "INTERNATIONAL RELATIONS",
    "referenceId": "POLITICS AND GOVERNMENT/FOREIGN POLICY/INTERNATIONAL RELATIONS",
    "referenceType": "VideoIndexer",
    "confidence": 1,
    "language": "en-US",
    "instances": [{
        "adjustedStart": "0:00:00",
        "adjustedEnd": "0:03:36.25",
        "start": "0:00:00",
        "end": "0:03:36.25"
    }]
}, {
    "id": 1,
    "name": "Politics and Government",
    "referenceType": "VideoIndexer",
    "iptcName": "Politics",
    "confidence": 0.9041,
    "language": "en-US",
    "instances": [{
        "adjustedStart": "0:00:00",
        "adjustedEnd": "0:03:36.25",
        "start": "0:00:00",
        "end": "0:03:36.25"
    }]
}]
. . .

speakers

Nombre Descripción
id Id. del orador.
name Nombre del orador en forma de "Speaker # <number> ", por ejemplo: "Speaker #1".
instances Lista de los intervalos de tiempo donde apareció este orador.
"speakers":[
{
  "id":1,
  "name":"Speaker #1",
  "instances":[
     {
    "adjustedStart":"0:00:10.21",
    "adjustedEnd":"0:00:12.81",
    "start":"0:00:10.21",
    "end":"0:00:12.81"
     }
  ]
},
{
  "id":2,
  "name":"Speaker #2",
  "instances":[
     {
    "adjustedStart":"0:00:12.81",
    "adjustedEnd":"0:00:17.03",
    "start":"0:00:12.81",
    "end":"0:00:17.03"
     }
  ]
},
` ` `

Pasos siguientes

Portal para desarrolladores de Video Analyzer for Media

Para más información sobre cómo insertar widgets en una aplicación, consulte Inserción de widgets de Video Analyzer for Media en las aplicaciones.