Aracılığıyla paylaş


Sahneler, çekimler, ana kareler

Önemli

Azure Media Services kullanımdan kaldırma duyurusu nedeniyle Azure AI Video Indexer, Azure AI Video Indexer özelliklerinde yapılan ayarlamaları duyurur. Bunun Azure AI Video Indexer hesabınız için ne anlama geldiğini anlamak için bkz . Azure Media Service 'in (AMS) kullanımdan kaldırılmasıyla ilgili değişiklikler. AMS'yi kullanımdan kaldırmaya hazırlanma: VI güncelleştirme ve geçiş kılavuzuna bakın.

Azure AI Video Indexer, videoları yapısal ve anlamsal özelliklere göre zamansal birimler halinde segmentlere ayırmayı destekler. Bu özellik, müşterilerin çeşitli ayrıntı düzeylerine göre video içeriklerine kolayca göz atmalarına, bunları yönetmelerine ve düzenlemelerine olanak tanır. Örneğin, bu konuda açıklanan sahnelere, çekimlere ve ana karelere göre.

Sahneler, çekimler, ana kareler

Sahne algılama

Azure AI Video Indexer, görsel ipuçlarına göre videoda bir sahnenin ne zaman değiştiğini belirler. Bir sahne tek bir olayı gösterir ve semantik olarak ilişkili bir dizi ardışık çekimden oluşur. Sahne küçük resmi, temel alınan çekimin ilk ana karesidir. Azure AI Video Indexer, arka arkaya çekimlerde renk tutarlılığına göre bir videoyu sahneler halinde bölümlere ayırır ve her sahnenin başlangıç ve bitiş saatini alır. Videoların anlamsal yönlerini ölçmeyi içerdiğinden, sahne algılama zorlu bir görev olarak kabul edilir.

Not

En az 3 sahne içeren videolar için geçerlidir.

Çekim algılama

Azure AI Video Indexer, bitişik karelerin renk düzeninde hem ani hem de aşamalı geçişleri izleyerek görsel ipuçlarına göre videodaki bir çekimin ne zaman değiştiğini belirler. Çekimin meta verileri bir başlangıç ve bitiş saatinin yanı sıra bu çekime dahil edilen ana karelerin listesini içerir. Çekimler aynı kameradan aynı anda alınan art arda karelerdir.

Ana bilgisayar algılama

Azure AI Video Indexer her çekimi en iyi temsil eden çerçeveleri seçer. Ana kareler, estetik özelliklere (örneğin, karşıtlık ve kararlılığa) göre videonun tamamından seçilen temsili çerçevelerdir. Azure AI Video Indexer, müşterilerin ana kareyi yüksek çözünürlüklü bir görüntü olarak ayıkladığı ana bilgisayar kimliklerinin listesini çekimin meta verilerinin bir parçası olarak alır.

Ana Çerçeveleri Ayıklama

Videonuzun yüksek çözünürlüklü ana karelerini ayıklamak için önce videoyu karşıya yüklemeniz ve dizine eklemeniz gerekir.

Ana Kareler

Azure AI Video Indexer web sitesiyle

Azure AI Video Indexer web sitesini kullanarak ana kareleri ayıklamak için videonuzu karşıya yükleyin ve dizine ekleyin. Dizin oluşturma işi tamamlandıktan sonra İndir düğmesine tıklayın ve Yapıtlar (ZIP) öğesini seçin. Bu işlem artifacts klasörünü bilgisayarınıza indirir (aşağıdaki yapıtlarla ilgili uyarıyı görüntülediğinizden emin olun). Sıkıştırmayı açın ve klasörü açın. _KeyframeThumbnail klasöründe, videonuzdan ayıklanan tüm ana kareleri bulursunuz.

Uyarı

Üretim amacıyla doğrudan artifacts klasöründeki verileri kullanmanızı önermeyiz. Yapıtlar, dizin oluşturma işleminin ara çıkışlarıdır. Bunlar temelde videoları analiz eden çeşitli yapay zeka motorlarının ham çıkışlarıdır; yapıt şeması zaman içinde değişebilir. API tarafından üretilen içgörüleri ve yapıtları alma bölümünde açıklandığı gibi Video Dizini Al API'sini kullanmanız önerilir.

Azure AI Video Indexer API'siyle

Video Indexer API'sini kullanarak ana kareler almak için, Videoyu Karşıya Yükle çağrısını kullanarak videonuzu karşıya yükleyin ve dizine ekleyin. Dizin oluşturma işi tamamlandıktan sonra Video Dizini Al'ı çağırın. Bu size Video Indexer'ın bir JSON dosyasındaki içeriğinizden ayıkladığınız tüm içgörüleri sağlar.

Her bir çekimin meta verilerinin bir parçası olarak ana bilgisayar kimliklerinin listesini alırsınız.

"shots":[  
    {  
      "id":0,
      "keyFrames":[  
          {  
            "id":0,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:00.209",
                  "end":"0:00:00.251",
                  "duration":"0:00:00.042"
                }
            ]
          },
          {  
            "id":1,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:04.755",
                  "end":"0:00:04.797",
                  "duration":"0:00:00.042"
                }
            ]
          }
      ],
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },

]

Şimdi Bu ana bilgisayar kimliklerinin her birini Küçük Resim Al çağrısında çalıştırmanız gerekir. Bu işlem, ana kare görüntülerinin her birini bilgisayarınıza indirir.

Editoryal çekim türü algılama

Ana kareler çıkış JSON'sindeki çekimlerle ilişkilendirilir.

İçgörüler JSON'sindeki tek bir çekimle ilişkili çekim türü, kendi editoryal türünü temsil eder. Videoları klipler, fragmanlar halinde düzenlerken veya artistik amaçlarla belirli bir ana bilgisayar stili ararken bu çekim türü özelliklerini yararlı bulabilirsiniz. Farklı türler, her bir çekimin ilk ana karesinin analizine göre belirlenir. Çekimler, ilk ana karelerinde görünen yüzlerin ölçeğine, boyutuna ve konumuna göre tanımlanır.

Çekim boyutu ve ölçeği, kamera ile çerçevede görünen yüzler arasındaki mesafeye göre belirlenir. Azure AI Video Indexer bu özellikleri kullanarak aşağıdaki çekim türlerini algılar:

  • Geniş: Bir kişinin tüm vücudunu gösterir.
  • Orta: Bir kişinin üst gövdesini ve yüzünü gösterir.
  • Yakından: Çoğunlukla bir kişinin yüzünü gösterir.
  • Aşırı yakın resim: Bir kişinin yüzünün ekranı doldurduğu gösterilir.

Çekim türleri, çerçevenin merkezine göre konu karakterlerinin konumuna göre de belirlenebilir. Bu özellik, Azure AI Video Indexer'da aşağıdaki çekim türlerini tanımlar:

  • Sol yüz: Çerçevenin sol tarafında bir kişi görünür.
  • Orta yüz: Bir kişi çerçevenin merkezi bölgesinde görünür.
  • Sağ yüz: Çerçevenin sağ tarafında bir kişi görünür.
  • Dış mekan: Bir kişi dış mekan ortamında görünür.
  • İç mekan: bir kişi iç mekan ortamında görünür.

Ek özellikler:

  • İki atış: orta büyüklükte iki kişinin yüzlerini gösterir.
  • Birden çok yüz: ikiden fazla kişi.