Scener, klipp och nyckelbilder

Azure Video Analyzer for Media (tidigare Video Indexer) stöder segmentering av videor i temporala enheter baserat på strukturella och semantiska egenskaper. Den här funktionen gör det möjligt för kunder att enkelt bläddra, hantera och redigera videoinnehåll baserat på varierande kornighet. Till exempel, baserat på scener, bilder och nyckelbilder, som beskrivs i det här avsnittet.

Scener, klipp och nyckelbilder

Scenidentifiering

Video Analyzer for Media avgör när en scen ändras i video baserat på visuella tips. En scen visar en enda händelse och den består av en serie efterföljande bilder som är semantiskt relaterade. En scenminiatyr är den första nyckelbild av dess underliggande bild. Video Analyzer for Media segmenterar en video i scener baserat på färgkonsekvens i flera på varandra följande bilder och hämtar början och sluttiden för varje scen. Scenidentifiering anses vara en utmanande uppgift eftersom den omfattar kvantifiering av semantiska aspekter av videor.

Anteckning

Gäller för videor som innehåller minst 3 scener.

Identifiering av skärmdumpar

Video Analyzer for Media avgör när en bild ändras i videon baserat på visuella tips, genom att spåra både plötsliga och gradvisa övergångar i färgschemat för intilliggande bildrutor. Skärmdumpens metadata innehåller en start- och sluttid, samt en lista över nyckelbildrutor som ingår i den bilden. Bilderna är på varandra följande bildrutor som tas från samma kamera samtidigt.

Identifiering av nyckelbild

Video Analyzer för media väljer de bildruteramar som bäst representerar varje bild. Nyckelbilder är representativa bildrutor som väljs ut från hela videon baserat på estetiska egenskaper (till exempel kontrast och stabilitet). Video Analyzer for Media hämtar en lista över nyckelbilds-ID:n som en del av videons metadata, baserat på vilka kunder kan extrahera nyckelbildrutan som en högupplöst bild.

Extrahera nyckeldatorer

Om du vill extrahera högupplösta nyckelbildrutor för videon måste du först ladda upp och indexera videon.

Nyckelrutor

Med webbplatsen Video Analyzer for Media

Om du vill extrahera nyckelbildrutor med hjälp av webbplatsen Video Analyzer for Media laddar du upp och indexerar videon. När indexeringsjobbet är klart klickar du på knappen Ladda ned och väljer Artefakter (ZIP). Då laddas mappen artifacts ned till datorn.

Skärmbild som visar listrutan "Ladda ned" med "Artefakter" valt.

Packa upp och öppna mappen. I _KeyframeThumbnail mappen hittar du alla nyckelbildrutor som extraherades från videon.

Med Video Analyzer för media-API

Om du vill hämta nyckeldatorer med hjälp Video Indexer API:et laddar du upp och indexerar videon med hjälp av anropet Överför video. När indexeringsjobbet är klart anropar du Hämta videoindex. På så sätt får du alla insikter som Video Indexer extraherat från ditt innehåll i en JSON-fil.

Du får en lista över nyckelbilds-ID:n som en del av varje bilds metadata.

"shots":[  
    {  
      "id":0,
      "keyFrames":[  
          {  
            "id":0,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:00.209",
                  "end":"0:00:00.251",
                  "duration":"0:00:00.042"
                }
            ]
          },
          {  
            "id":1,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:04.755",
                  "end":"0:00:04.797",
                  "duration":"0:00:00.042"
                }
            ]
          }
      ],
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },

]

Du måste nu köra var och en av dessa nyckelbilds-ID:er i anropet Hämta miniatyrer. Då laddas var och en av nyckelbildbilderna ned till datorn.

Identifiering av redigeringsbildtyper

Nyckeldatorer är associerade med bilder i JSON-utdata.

Den typ av skärmdump som är associerad med en enskild bild i insights JSON representerar dess redigeringstyp. Dessa egenskaper för skärmdumpar kan vara användbara när du redigerar videor till klipp, vagnar eller när du söker efter en specifik typ av nyckelbild i särskilda syften. De olika typerna bestäms baserat på analys av den första nyckelbildrutan för varje bild. Bilder identifieras med hjälp av skalan, storleken och platsen för ansiktena som visas i den första nyckelrutan.

Bildens storlek och skala bestäms baserat på avståndet mellan kameran och ansiktena som visas i bilden. Med hjälp av dessa egenskaper identifierar Video Analyzer för media följande bildtyper:

  • Bred: visar en hel persons brödtext.
  • Medel: visar en persons övre brödtext och ansikte.
  • När närmare: visar främst en persons ansikte.
  • Extrem närbild: visar en persons ansikte på skärmen.

Bildtyper kan också fastställas genom placeringen av ämnestecken i förhållande till mitten av bildrutan. Den här egenskapen definierar följande typer av skärmdumpar i Video Analyzer för media:

  • Vänster ansikte: en person visas på vänster sida av ramen.
  • Mitt ansikte: en person visas i den centrala delen av ramen.
  • Höger ansikte: en person visas på höger sida av ramen.
  • Utomhus: en person visas i en utomhusmiljö.
  • Inomhus: en person visas i en inomhusmiljö.

Ytterligare egenskaper:

  • Två bilder: visar två personers ansikten med medelstorlek.
  • Flera ansikten: fler än två personer.

Nästa steg

Granska videoanalysen för medieutdata som produceras av API:et