Azure Blob Depolama verilerini dizine alın

Makale
03/18/2024

Bu makalede, Azure Blob Depolama içeriği içeri aktaran ve Azure AI Search'te aranabilir hale getiren bir dizin oluşturucu yapılandırmayı öğrenin. Dizin oluşturucuya girişler, tek bir kapsayıcıdaki bloblarınızdır. Çıktı, aranabilir içerik ve meta verilerin tek tek alanlarda depolandığı bir arama dizinidir.

Bu makalede, Blob Depolama'a özgü bilgilerle dizin oluşturucu oluşturma ekleri verilmiştir. Rest API'lerini kullanarak tüm dizin oluşturucular için ortak olan üç parçalı bir iş akışını gösterir: veri kaynağı oluşturma, dizin oluşturma, dizin oluşturucu oluşturma. Dizin Oluşturucu Oluştur isteğini gönderdiğinizde veri ayıklama gerçekleşir.

Blob dizin oluşturucuları hem yapay zeka zenginleştirme hem de metin tabanlı işleme için sıklıkla kullanılır. Bu makale, tam metin arama senaryoları için yalnızca metin içeriğinin ve meta verilerinin alındığı metin tabanlı dizin oluşturma için dizin oluşturuculara odaklanır.

Önkoşullar

Azure Blob Depolama, Standart performans (genel amaçlı v2).
Blob Depolama erişim katmanları Sık Erişimli, Seyrek Erişimli ve Arşiv'i içerir. Yalnızca Sık Erişimli ve Seyrek Erişimli arama dizin oluşturucuları tarafından erişilebilir.
Metin içeriği ve meta veriler sağlayan bloblar. Bloblar ikili içerik veya yapılandırılmamış metin içeriyorsa, görüntü ve doğal dil işleme için yapay zeka zenginleştirmesi eklemeyi göz önünde bulundurun. Blob içeriği, arama hizmeti katmanınız için dizin oluşturucu sınırlarını aşamaz.
Desteklenen bir ağ yapılandırması ve veri erişimi. Azure Depolama'da en azından okuma izinlerine ihtiyacınız vardır. Erişim anahtarı içeren bir depolama bağlantı dizesi, depolama içeriğine okuma erişimi sağlar. Bunun yerine Microsoft Entra oturum açma bilgilerini ve rollerini kullanıyorsanız, arama hizmetinin yönetilen kimliğinin Depolama Blob Veri Okuyucusu izinlerine sahip olduğundan emin olun.

Varsayılan olarak, hem arama hem de depolama genel IP adreslerinden gelen istekleri kabul eder. Ağ güvenliği acil bir sorun değilse yalnızca bağlantı dizesi ve okuma izinlerini kullanarak blob verilerini dizine alabilirsiniz. Ağ korumaları eklemeye hazır olduğunuzda veri erişimi hakkında yönergeler için bkz . Azure ağ güvenliği özellikleri tarafından korunan içeriğe dizin oluşturucu erişimi.
REST çağrılarını bu makalede gösterilene benzer şekilde formüle etmek için REST istemcisini kullanın.

Desteklenen belge biçimleri

Blob dizin oluşturucu aşağıdaki belge biçimlerinden metin ayıklayabilir:

CSV (bkz. CSV bloblarının dizinini oluşturma)
EML
EPUB
GZ
HTML
JSON (bkz. JSON bloblarını dizinleme)
KML (coğrafi gösterimler için XML)
Microsoft Office biçimleri: DOCX/DOC/DOCM, XLSX/XLS/XLSM, PPTX/PPT/PPTM, MSG (Outlook e-postaları), XML (hem 2003 hem de 2006 WORD XML)
Belge biçimlerini açma: ODT, ODS, ODP
PDF
Düz metin dosyaları (ayrıca bkz. Düz metin dizini oluşturma)
RTF
XML
ZIP

Dizine eklemek istediğiniz blobları belirleme

Dizin oluşturmayı ayarlamadan önce, herhangi bir değişikliğin önceden yapılıp yapılmayacağını belirlemek için kaynak verilerinizi gözden geçirin. Dizin oluşturucu bir kerede bir kapsayıcıdaki içeriği dizine alabilir. Varsayılan olarak, kapsayıcıdaki tüm bloblar işlenir. Daha seçmeli işleme için çeşitli seçenekleriniz vardır:

Blobları bir sanal klasöre yerleştirin. Dizin oluşturucu veri kaynağı tanımı , sanal klasör alabilen bir "sorgu" parametresi içerir. Bir sanal klasör belirtirseniz, yalnızca klasördeki bloblar dizine eklenir.
Blobları dosya türüne göre dahil edin veya hariç tutun. Desteklenen belge biçimleri listesi , dışlamanız gereken blobları belirlemenize yardımcı olabilir. Örneğin, aranabilir metin sağlamayan görüntü veya ses dosyalarını dışlamak isteyebilirsiniz. Bu özellik, dizin oluşturucudaki yapılandırma ayarları aracılığıyla denetlenilir.

Rastgele blobları dahil edin veya hariç tutun. Belirli bir blobu her nedenden dolayı atlamak istiyorsanız, Blob Depolama bloblara aşağıdaki meta veri özelliklerini ve değerlerini ekleyebilirsiniz. Dizin oluşturucu bu özellik ile karşılaştığında, dizin oluşturma çalıştırmasında blobu veya içeriğini atlar.

Özellik adı	Özellik değeri	Açıklama
"AzureSearch_Skip"	`"true"`	Blob dizin oluşturucusunun blobu tamamen atlamasını sağlar. Meta veriler veya içerik ayıklama denenemez. Bu, belirli bir blob tekrar tekrar başarısız olduğunda ve dizin oluşturma işlemini kestiğinde kullanışlıdır.
"AzureSearch_SkipContent"	`"true"`	İçeriği atlar ve yalnızca meta verileri ayıklar. bu, yalnızca belirli bir blob kapsamındaki `"dataToExtract" : "allMetadata"`yapılandırma ayarlarında açıklanan ayara eşdeğerdir.

Ekleme veya dışlama ölçütlerini ayarlamazsanız, dizin oluşturucu uygun olmayan bir blobu hata olarak bildirir ve devam eder. Yeterli hata oluşursa işlem durdurulabilir. Dizin oluşturucu yapılandırma ayarlarında hataya dayanıklılık belirtebilirsiniz.

Dizin oluşturucu genellikle blob başına bir arama belgesi oluşturur ve burada metin içeriği ve meta veriler bir dizinde aranabilir alanlar olarak yakalanır. Bloblar tam dosyaysa, bunları birden çok arama belgesine ayrıştırabilirsiniz. Örneğin, bir CSV dosyasındaki satırları ayrıştırarak satır başına bir arama belgesi oluşturabilirsiniz.

Bileşik veya eklenmiş belge (ZIP arşivi, ekleri içeren eklenmiş Outlook e-postası içeren bir Word belgesi veya gibi). Ekleri olan MSG dosyası) da tek bir belge olarak dizine alınır. Örneğin, eklerinden ayıklanan tüm görüntüler. MSG dosyası normalized_images alanında döndürülür. Resimleriniz varsa bu içerikten daha fazla arama yardımcı programı elde etmek için yapay zeka zenginleştirmesi eklemeyi göz önünde bulundurun.

Belgenin metin içeriği "content" adlı bir dize alanına ayıklanır. Standart ve kullanıcı tanımlı meta verileri de ayıklayabilirsiniz.

Blob meta verilerini dizinleme

Blob meta verileri de dizine eklenebilir ve standart veya özel meta veri özelliklerinden herhangi birinin filtreler ve sorgularda yararlı olduğunu düşünüyorsanız bu yararlı olur.

Kullanıcı tarafından belirtilen meta veri özellikleri ayrıntılı olarak ayıklanır. Değerleri almak için, türündeki arama dizininde Edm.Stringblobun meta veri anahtarıyla aynı ada sahip bir alan tanımlamanız gerekir. Örneğin, bir blobun değeri Higholan bir meta veri anahtarı Sensitivity varsa, arama dizininizde adlı Sensitivity bir alan tanımlamanız gerekir ve değeriyle Highdoldurulur.

Standart blob meta veri özellikleri, aşağıda listelendiği gibi benzer adlandırılmış ve yazılan alanlara ayıklanabilir. Blob dizin oluşturucu, bu blob meta veri özellikleri için iç alan eşlemelerini otomatik olarak oluşturur ve özgün kısa çizgili adı ("metadata-storage-name") alt çizgili eşdeğer ada ("metadata_storage_name") dönüştürür.

Yine de dizin tanımına alt puanlanmış alanları eklemeniz gerekir, ancak dizin oluşturucu ilişkilendirmeyi otomatik olarak yapacağından alan eşlemelerini atlayabilirsiniz.

metadata_storage_name (Edm.String) - blobun dosya adı. Örneğin, bir blob /my-container/my-folder/subfolder/resume.pdf varsa, bu alanın değeri olur resume.pdf.
metadata_storage_path (Edm.String) - depolama hesabı dahil olmak üzere blobun tam URI'si. Örneğin https://myaccount.blob.core.windows.net/my-container/my-folder/subfolder/resume.pdf
metadata_storage_content_type (Edm.String) - blobu karşıya yüklemek için kullandığınız kod tarafından belirtilen içerik türü. Örneğin, application/octet-stream.
metadata_storage_last_modified (Edm.DateTimeOffset) - blob için son değiştirilen zaman damgası. Azure AI Search, ilk dizin oluşturma işleminden sonra her şeyin yeniden dizine alınmasını önlemek için değiştirilen blobları tanımlamak için bu zaman damgasını kullanır.
metadata_storage_size (Edm.Int64) - bayt cinsinden blob boyutu.
metadata_storage_content_md5 (Edm.String) - Varsa blob içeriğinin MD5 karması.
metadata_storage_sas_token (Edm.String) - Bloba erişim elde etmek için özel beceriler tarafından kullanılabilecek geçici bir SAS belirteci. Bu belirtecin süresi dolabileceği için daha sonra kullanılmak üzere depolanmaması gerekir.

Son olarak, dizine eklediğiniz blobların belge biçimine özgü tüm meta veri özellikleri de dizin şemasında gösterilebilir. İçeriğe özgü meta veriler hakkında daha fazla bilgi için bkz . İçerik meta veri özellikleri.

Arama dizininizde yukarıdaki özelliklerin tümü için alan tanımlamanıza gerek olmadığını belirtmek önemlidir. Yalnızca uygulamanız için ihtiyacınız olan özellikleri yakalayın.

Şu anda blob dizin etiketlerinin dizinlenmesi bu dizin oluşturucu tarafından desteklenmiyor.

Veri kaynağını tanımlama

Veri kaynağı tanımı, verilerdeki değişiklikleri tanımlamak için dizine eklenecek verileri, kimlik bilgilerini ve ilkeleri belirtir. Veri kaynağı, birden çok dizin oluşturucu tarafından kullanılabilmesi için bağımsız bir kaynak olarak tanımlanır.

Tanımını ayarlamak için bir veri kaynağı oluşturun veya güncelleştirin:

{
    "name" : "my-blob-datasource",
    "type" : "azureblob",
    "credentials" : { "connectionString" : "DefaultEndpointsProtocol=https;AccountName=<account name>;AccountKey=<account key>;" },
    "container" : { "name" : "my-container", "query" : "<optional-virtual-directory-name>" }
}

"type" değerini (gerekli) olarak "azureblob" ayarlayın.
"Kimlik bilgilerini" bir Azure Depolama bağlantı dizesi olarak ayarlayın. Sonraki bölümde desteklenen biçimler açıklanmaktadır.
Blob kapsayıcısına "kapsayıcı" ayarlayın ve alt klasörleri belirtmek için "query" kullanın.

Kaynak belge silinmek üzere işaretlendiğinde dizin oluşturucunun bir arama belgesini silmesini istiyorsanız, veri kaynağı tanımı geçici silme ilkeleri de içerebilir.

Desteklenen kimlik bilgileri ve bağlantı dizesi

Dizin oluşturucular aşağıdaki bağlantıları kullanarak bir blob kapsayıcısına bağlanabilir.

Tam erişimli depolama hesabı bağlantı dizesi
`{ "connectionString" : "DefaultEndpointsProtocol=https;AccountName=<your storage account>;AccountKey=<your account key>;" }`
Sol gezinti bölmesinde Erişim anahtarları'nı seçerek Azure portalındaki Depolama hesabı sayfasından bağlantı dizesi alabilirsiniz. Yalnızca bir anahtar değil tam bir bağlantı dizesi seçtiğinizden emin olun.

Yönetilen kimlik bağlantı dizesi
`{ "connectionString" : "ResourceId=/subscriptions/<your subscription ID>/resourceGroups/<your resource group name>/providers/Microsoft.Storage/storageAccounts/<your storage account name>/;" }`
Bu bağlantı dizesi hesap anahtarı gerektirmez, ancak daha önce yönetilen kimlik kullanarak bağlanmak için bir arama hizmeti yapılandırmış olmanız gerekir.

Depolama hesabı paylaşılan erişim imzası** (SAS) bağlantı dizesi
`{ "connectionString" : "BlobEndpoint=https://<your account>.blob.core.windows.net/;SharedAccessSignature=?sv=2016-05-31&sig=<the signature>&spr=https&se=<the validity end time>&srt=co&ss=b&sp=rl;" }`
SAS, kapsayıcılar ve nesneler (bu örnekte bloblar) üzerinde liste ve okuma izinlerine sahip olmalıdır.

Kapsayıcı paylaşılan erişim imzası
`{ "connectionString" : "ContainerSharedAccessUri=https://<your storage account>.blob.core.windows.net/<container name>?sv=2016-05-31&sr=c&sig=<the signature>&se=<the validity end time>&sp=rl;" }`
SAS,kapsayıcı üzerinde liste ve okuma izinlerine sahip olmalıdır. Daha fazla bilgi için bkz . Paylaşılan Erişim İmzalarını Kullanma.

Not

SAS kimlik bilgilerini kullanıyorsanız, sürelerinin dolmasını önlemek için veri kaynağı kimlik bilgilerini düzenli aralıklarla yenilenen imzalarla güncelleştirmeniz gerekir. SAS kimlik bilgilerinin süresi dolarsa, dizin oluşturucu "bağlantı dizesi sağlanan kimlik bilgileri geçersiz veya süresi dolmuş" gibi bir hata iletisiyle başarısız olur.

Dizine arama alanları ekleme

Arama dizininde, Azure bloblarınızın içeriğini ve meta verilerini kabul etmek için alanlar ekleyin.

Blob içeriğini ve meta verileri depolayacak arama alanlarını tanımlamak için bir dizin oluşturun veya güncelleştirin:

POST https://[service name].search.windows.net/indexes?api-version=2020-06-30
{
    "name" : "my-search-index",
    "fields": [
        { "name": "ID", "type": "Edm.String", "key": true, "searchable": false },
        { "name": "content", "type": "Edm.String", "searchable": true, "filterable": false },
        { "name": "metadata_storage_name", "type": "Edm.String", "searchable": false, "filterable": true, "sortable": true  },
        { "name": "metadata_storage_size", "type": "Edm.Int64", "searchable": false, "filterable": true, "sortable": true  },
        { "name": "metadata_storage_content_type", "type": "Edm.String", "searchable": false, "filterable": true, "sortable": true },        
    ]
}

Belge anahtarı alanı oluşturma ("anahtar": true). Blob içeriği için en iyi adaylar meta veri özellikleridir.
- metadata_storage_path (varsayılan) nesnenin veya dosyanın tam yolu. Bu örnekteki anahtar alanı ("Kimlik") varsayılan değer olduğundan metadata_storage_path değerleriyle doldurulur.
- metadata_storage_name, yalnızca adlar benzersizse kullanılabilir. Bu alanın anahtar olarak olmasını istiyorsanız, bu alan tanımına gidin "key": true .
- Bloblara eklediğiniz özel meta veri özelliği. Bu seçenek, blob karşıya yükleme işleminizin bu meta veri özelliğini tüm bloblara eklemesini gerektirir. Anahtar gerekli bir özellik olduğundan, değeri eksik olan tüm bloblar dizine alınamaz. Anahtar olarak özel meta veri özelliği kullanıyorsanız, bu özellikte değişiklik yapmaktan kaçının. Anahtar özelliği değişirse dizin oluşturucular aynı blob için yinelenen belgeler ekler.
Meta veri özellikleri genellikle belge anahtarları için geçersiz olan ve -gibi / karakterler içerir. Dizin oluşturucunun "base64EncodeKeys" özelliği (varsayılan olarak true) olduğundan, meta veri özelliğini otomatik olarak kodlar; yapılandırma veya alan eşlemesi gerekmez.
Blob'un "content" özelliği aracılığıyla her dosyadan ayıklanan metni depolamak için bir "içerik" alanı ekleyin. Bu adı kullanmanız gerekmez, ancak bunu yaptığınızda örtük alan eşlemelerinden yararlanabilirsiniz.
Standart meta veri özellikleri için alanlar ekleyin. Dizin oluşturucu özel meta veri özelliklerini, standart meta veri özelliklerini ve içeriğe özgü meta veri özelliklerini okuyabilir.

Blob dizin oluşturucusunu yapılandırma ve çalıştırma

Dizin ve veri kaynağı oluşturulduktan sonra dizin oluşturucuyu oluşturmaya hazır olursunuz. Dizin oluşturucu yapılandırması, çalışma zamanı davranışlarını denetleen girişleri, parametreleri ve özellikleri belirtir. Bir blobun hangi bölümlerinin dizine ekleneceğini de belirtebilirsiniz.

Dizin oluşturucuya bir ad verip veri kaynağına ve hedef dizine başvurarak dizin oluşturucu oluşturun veya güncelleştirin:

POST https://[service name].search.windows.net/indexers?api-version=2020-06-30
{
  "name" : "my-blob-indexer",
  "dataSourceName" : "my-blob-datasource",
  "targetIndexName" : "my-search-index",
  "parameters": {
      "batchSize": null,
      "maxFailedItems": null,
      "maxFailedItemsPerBatch": null,
      "base64EncodeKeys": null,
      "configuration": {
          "indexedFileNameExtensions" : ".pdf,.docx",
          "excludedFileNameExtensions" : ".png,.jpeg",
          "dataToExtract": "contentAndMetadata",
          "parsingMode": "default"
      }
  },
  "schedule" : { },
  "fieldMappings" : [ ]
}

Varsayılan (10 belge) kullanılabilir kaynakları az kullanıyor veya bunaltıyorsa ayarlayın batchSize . Varsayılan toplu iş boyutları veri kaynağına özeldir. Blob dizin oluşturma, daha büyük ortalama belge boyutunun tanınması için toplu iş boyutunu 10 belgede ayarlar.
"yapılandırma" altında, hangi blobların dosya türüne göre dizine alınıp alınacığını denetleyin veya tüm blobları almak için belirtilmemiş bırakın.

için "indexedFileNameExtensions", dosya uzantılarının virgülle ayrılmış bir listesini sağlayın (baştaki noktayla). Hangi uzantıların atlanması gerektiğini belirtmek için "excludedFileNameExtensions" de aynısını yapın. Her iki listede de aynı uzantı varsa, dizin oluşturmanın dışında tutulur.
"yapılandırma" bölümünde blobların hangi bölümlerinin dizine eklendiğini denetlemek için "dataToExtract" değerini ayarlayın:
- "contentAndMetadata", blobdan ayıklanan tüm meta verilerin ve metin içeriğinin dizine alındığını belirtir. Bu varsayılan değerdir.
- "storageMetadata", yalnızca standart blob özelliklerinin ve kullanıcı tarafından belirtilen meta verilerin dizine alındığını belirtir.
- "allMetadata", standart blob özelliklerinin ve bulunan içerik türleri için meta verilerin blob içeriğinden ayıklandığını ve dizine alındığını belirtir.
"configuration" (yapılandırma) bölümünde "parsingMode" öğesini ayarlayın. Varsayılan ayrıştırma modu blob başına bir arama belgesidir. Bloblar düz metinse, düz metin ayrıştırmaya geçerek daha iyi performans elde edebilirsiniz. Blobları birden çok arama belgesine eşleyen daha ayrıntılı ayrıştırmaya ihtiyacınız varsa farklı bir mod belirtin. Aşağıdakilerden oluşan bloblar için bire çok ayrıştırma desteklenir:
- JSON belgeleri
- CSV dosyaları
Alan adında veya türünde farklılıklar varsa veya arama dizininde bir kaynak alanın birden çok sürümüne ihtiyacınız varsa alan eşlemelerini belirtin.

Blob dizin oluşturmada, dizin oluşturucunun "içerik" ve meta veri özelliklerini dizindeki benzer adlandırılmış ve yazılan alanlarla eşlemeye yönelik yerleşik desteği olduğundan, alan eşlemelerini atlayabilirsiniz. Meta veri özellikleri için dizin oluşturucu, kısa çizgileri - arama dizinindeki alt çizgilerle otomatik olarak değiştirir.
Diğer özellikler hakkında daha fazla bilgi için bkz . Dizin oluşturucu oluşturma. Parametre açıklamalarının tam listesi için bkz . REST API'deki Blob yapılandırma parametreleri .

Dizin oluşturucu oluşturulduğunda otomatik olarak çalışır. "Devre dışı" ayarını true olarak ayarlayarak bunu önleyebilirsiniz. Dizin oluşturucu yürütmesini denetlemek için isteğe bağlı olarak bir dizin oluşturucu çalıştırın veya zamanlamaya yerleştirin.

Dizin oluşturucu durumunu denetleme

Dizin oluşturucu durumunu ve yürütme geçmişini izlemek için Dizin Oluşturucu Durumunu Al isteği gönderin:

GET https://myservice.search.windows.net/indexers/myindexer/status?api-version=2020-06-30
  Content-Type: application/json  
  api-key: [admin key]

Yanıt, durumu ve işlenen öğe sayısını içerir. Aşağıdaki örneğe benzer görünmelidir:

    {
        "status":"running",
        "lastResult": {
            "status":"success",
            "errorMessage":null,
            "startTime":"2022-02-21T00:23:24.957Z",
            "endTime":"2022-02-21T00:36:47.752Z",
            "errors":[],
            "itemsProcessed":1599501,
            "itemsFailed":0,
            "initialTrackingState":null,
            "finalTrackingState":null
        },
        "executionHistory":
        [
            {
                "status":"success",
                "errorMessage":null,
                "startTime":"2022-02-21T00:23:24.957Z",
                "endTime":"2022-02-21T00:36:47.752Z",
                "errors":[],
                "itemsProcessed":1599501,
                "itemsFailed":0,
                "initialTrackingState":null,
                "finalTrackingState":null
            },
            ... earlier history items
        ]
    }

Yürütme geçmişi, en son tamamlanan yürütmelerin en son 50'sini içerir ve en son yürütme önce gelecek şekilde ters kronolojik sırada sıralanır.

Hataları işleme

Dizin oluşturma sırasında sık karşılaşılan hatalar desteklenmeyen içerik türleri, eksik içerik veya büyük harfli bloblardır.

Varsayılan olarak, blob dizin oluşturucu desteklenmeyen içerik türüne (örneğin bir ses dosyası) sahip bir blobla karşılaştığında durur. Belirli içerik türlerini atlamak için "excludedFileNameExtensions" parametresini kullanabilirsiniz. Ancak, hatalar ortaya çıksa bile devam etmek için dizin oluşturmak ve daha sonra tek tek belgelerde hata ayıklamak isteyebilirsiniz. Dizin oluşturucu hataları hakkında daha fazla bilgi için bkz . Dizin oluşturucu sorun giderme kılavuzu ve Dizin oluşturucu hataları ve uyarıları.

Hatalar oluştuğunda dizin oluşturucunun yanıtını denetleyebilen beş dizin oluşturucu özelliği vardır.

PUT /indexers/[indexer name]?api-version=2020-06-30
{
  "parameters" : { 
    "maxFailedItems" : 10, 
    "maxFailedItemsPerBatch" : 10,
    "configuration" : { 
        "failOnUnsupportedContentType" : false, 
        "failOnUnprocessableDocument" : false,
        "indexStorageMetadataOnlyForOversizedDocuments": false
      }
    }
}

Parametre	Geçerli değerler	Açıklama
"maxFailedItems"	-1, null veya 0, pozitif tamsayı	Blobları ayrıştırırken veya dizine belge eklerken herhangi bir işlem noktasında hata oluşursa dizine eklemeye devam edin. Bu özellikleri kabul edilebilir hata sayısına ayarlayın. değeri `-1` , kaç hata olursa olsun işlemeye izin verir. Aksi takdirde, değer pozitif bir tamsayıdır.
"maxFailedItemsPerBatch"	-1, null veya 0, pozitif tamsayı	Yukarıdakiyle aynıdır, ancak toplu dizin oluşturma için kullanılır.
"failOnUnsupportedContentType"	true veya false	Dizin oluşturucu içerik türünü belirleyemezse, işe devam etmek mi yoksa başarısız mı olmak istediğinizi belirtin.
"failOnUnprocessableDocument"	true veya false	Dizin oluşturucu, başka bir şekilde desteklenen içerik türündeki bir belgeyi işleyemiyorsa, işe devam edilip edilmeyeceğini veya başarısız olup olmayacağını belirtin.
"index Depolama MetadataOnlyForOversizedDocuments"	true veya false	Büyük büyük bloblar varsayılan olarak hata olarak değerlendirilir. Bu parametreyi true olarak ayarlarsanız, içerik dizine alınamıyor olsa bile dizin oluşturucu meta verilerini dizine almaya çalışır. Blob boyutuyla ilgili sınırlar için bkz . Hizmet Sınırları.