Indexes - Create Or Update

Crea un nuovo indice di ricerca o aggiorna un indice se esiste già.

PUT {endpoint}/indexes('{indexName}')?api-version=2023-11-01
PUT {endpoint}/indexes('{indexName}')?allowIndexDowntime={allowIndexDowntime}&api-version=2023-11-01

Parametri dell'URI

Nome In Necessario Tipo Descrizione
endpoint
path True

string

URL dell'endpoint del servizio di ricerca.

indexName
path True

string

Definizione dell'indice da creare o aggiornare.

api-version
query True

string

Versione api client.

allowIndexDowntime
query

boolean

Consente l'aggiunta di nuovi analizzatori, tokenizzatori, filtri token o filtri char a un indice prendendo offline l'indice per almeno alcuni secondi. Ciò causa temporaneamente l'esito negativo dell'indicizzazione e delle richieste di query. Le prestazioni e la disponibilità alla scrittura dell'indice possono risultare inferiori per vari minuti dopo che l'indice è stato aggiornato o più a lungo per gli indici molto grandi.

Intestazione della richiesta

Nome Necessario Tipo Descrizione
x-ms-client-request-id

string

uuid

ID di rilevamento inviato con la richiesta di assistenza per il debug.

If-Match

string

Definisce la condizione di If-Match. L'operazione verrà eseguita solo se il ETag nel server corrisponde a questo valore.

If-None-Match

string

Definisce la condizione If-None-Match. L'operazione verrà eseguita solo se L'ETag nel server non corrisponde a questo valore.

Prefer True

string

Per le richieste HTTP PUT, indica al servizio di restituire la risorsa creata/aggiornata in caso di esito positivo.

Corpo della richiesta

Nome Necessario Tipo Descrizione
fields True

SearchField[]

Campi dell'indice.

name True

string

Nome dell'indice.

@odata.etag

string

ETag dell'indice.

analyzers LexicalAnalyzer[]:

Analizzatori per l'indice.

charFilters CharFilter[]:

Filtri di carattere per l'indice.

corsOptions

CorsOptions

Opzioni per controllare la condivisione delle risorse tra origini (CORS) per l'indice.

defaultScoringProfile

string

Nome del profilo di assegnazione dei punteggi da usare se non è specificato nessuno nella query. Se questa proprietà non è impostata e non viene specificato alcun profilo di assegnazione dei punteggi nella query, verrà usato il punteggio predefinito (tf-idf).

encryptionKey

SearchResourceEncryptionKey

Descrizione di una chiave di crittografia creata in Azure Key Vault. Questa chiave viene usata per fornire un livello aggiuntivo di crittografia inattivi per i dati quando si vuole garantire che nessuno, non anche Microsoft, possa decrittografare i dati. Dopo aver crittografato i dati, rimarrà sempre crittografato. Il servizio di ricerca ignora i tentativi di impostare questa proprietà su Null. È possibile modificare questa proprietà in base alle esigenze se si vuole ruotare la chiave di crittografia; I dati non saranno interessati. La crittografia con chiavi gestite dal cliente non è disponibile per i servizi di ricerca gratuiti ed è disponibile solo per i servizi a pagamento creati o dopo il 1° gennaio 2019.

scoringProfiles

ScoringProfile[]

Profili di assegnazione dei punteggi per l'indice.

semantic

SemanticSettings

Definisce i parametri per un indice di ricerca che influiscono sulle funzionalità semantiche.

similarity Similarity:

Tipo di algoritmo di somiglianza da usare durante l'assegnazione dei punteggi e la classificazione dei documenti corrispondenti a una query di ricerca. L'algoritmo di somiglianza può essere definito solo in fase di creazione dell'indice e non può essere modificato negli indici esistenti. Se null, viene usato l'algoritmo ClassicSimilarity.

suggesters

Suggester[]

I suggeritori per l'indice.

tokenFilters TokenFilter[]:

Filtri token per l'indice.

tokenizers LexicalTokenizer[]:

Tokenizer per l'indice.

vectorSearch

VectorSearch

Contiene opzioni di configurazione correlate alla ricerca vettoriale.

Risposte

Nome Tipo Descrizione
200 OK

SearchIndex

201 Created

SearchIndex

Other Status Codes

SearchError

Risposta di errore.

Esempio

SearchServiceCreateOrUpdateIndex

Sample Request

PUT https://myservice.search.windows.net/indexes('hotels')?allowIndexDowntime=False&api-version=2023-11-01


{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "key": true,
      "searchable": false
    },
    {
      "name": "baseRate",
      "type": "Edm.Double"
    },
    {
      "name": "description",
      "type": "Edm.String",
      "filterable": false,
      "sortable": false,
      "facetable": false
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile",
      "searchable": true,
      "retrievable": true
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "filterable": false,
      "sortable": false,
      "facetable": false,
      "analyzer": "fr.lucene"
    },
    {
      "name": "hotelName",
      "type": "Edm.String"
    },
    {
      "name": "category",
      "type": "Edm.String"
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "analyzer": "tagsAnalyzer"
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean"
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean"
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset"
    },
    {
      "name": "rating",
      "type": "Edm.Int32"
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint"
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "type": "distance",
          "boost": 5,
          "fieldName": "location",
          "interpolation": "logarithmic",
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2"
    }
  ],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": null
  },
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.ClassicSimilarity"
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myExhaustive"
      }
    ],
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "m": 4,
          "metric": "cosine"
        }
      },
      {
        "name": "myExhaustive",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ]
  }
}

Sample Response

{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "baseRate",
      "type": "Edm.Double",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile",
      "synonymMaps": []
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "fr.lucene",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "hotelName",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": false,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "tagsAnalyzer",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "rating",
      "type": "Edm.Int32",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "type": "distance",
          "boost": 5,
          "fieldName": "location",
          "interpolation": "logarithmic",
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2"
    }
  ],
  "tokenizers": [],
  "tokenFilters": [],
  "charFilters": [],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": null
  },
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.ClassicSimilarity"
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "myExhaustive",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ],
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myExhaustive"
      }
    ]
  }
}
{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "baseRate",
      "type": "Edm.Double",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile",
      "synonymMaps": []
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "fr.lucene",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "hotelName",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": false,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "tagsAnalyzer",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "rating",
      "type": "Edm.Int32",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "type": "distance",
          "boost": 5,
          "fieldName": "location",
          "interpolation": "logarithmic",
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2"
    }
  ],
  "tokenizers": [],
  "tokenFilters": [],
  "charFilters": [],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": null
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "myExhaustive",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ],
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myExhaustive"
      }
    ]
  }
}

Definizioni

Nome Descrizione
AsciiFoldingTokenFilter

Converte caratteri Unicode alfabetici, numerici e simbolici che non sono nei primi 127 caratteri ASCII (il blocco Unicode "Basic Latin" ) nei relativi equivalenti ASCII, se tali equivalenti esistono. Questo filtro token viene implementato usando Apache Lucene.

AzureActiveDirectoryApplicationCredentials

Credenziali di un'applicazione registrata creata per il servizio di ricerca, usata per l'accesso autenticato alle chiavi di crittografia archiviate in Azure Key Vault.

BM25Similarity

Funzione di classificazione basata sull'algoritmo di somiglianza Okapi BM25. BM25 è un algoritmo simile a TF-IDF che include la normalizzazione della lunghezza (controllata dal parametro 'b'), nonché la saturazione della frequenza dei termini (controllata dal parametro 'k1').

CharFilterName

Definisce i nomi di tutti i filtri di caratteri supportati dal motore di ricerca.

CjkBigramTokenFilter

Forma bigrams di termini CJK generati dal tokenizer standard. Questo filtro token viene implementato usando Apache Lucene.

CjkBigramTokenFilterScripts

Script che possono essere ignorati da CjkBigramTokenFilter.

ClassicSimilarity

Algoritmo di somiglianza legacy che usa l'implementazione Lucene TFIDFSimilarity di TF-IDF. Questa variante di TF-IDF introduce la normalizzazione della lunghezza dei documenti statici, nonché i fattori di coordinamento che penalizzano i documenti che corrispondono solo parzialmente alle query sottoposte a ricerca.

ClassicTokenizer

Tokenizer basato su grammatica adatto per l'elaborazione della maggior parte dei documenti in lingua europea. Questo tokenizer viene implementato usando Apache Lucene.

CommonGramTokenFilter

Costruisce digrammi per i termini frequenti durante l'indicizzazione. Anche i termini singoli continuano a essere indicizzati, con i digrammi sovrapposti. Questo filtro token viene implementato usando Apache Lucene.

CorsOptions

Definisce le opzioni per controllare la condivisione delle risorse tra origini (CORS) per un indice.

CustomAnalyzer

Consente di controllare il processo di conversione del testo in token indicizzabili/ricercabili. Si tratta di una configurazione definita dall'utente costituita da un singolo tokenizzatore predefinito e uno o più filtri. Il tokenizer è responsabile dell'interruzione del testo nei token e dei filtri per la modifica dei token generati dal tokenizer.

DictionaryDecompounderTokenFilter

Scompone le parole composte presenti in molte lingue germaniche. Questo filtro token viene implementato usando Apache Lucene.

DistanceScoringFunction

Definisce una funzione che aumenta i punteggi in base alla distanza da una posizione geografica.

DistanceScoringParameters

Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi a distanza.

EdgeNGramTokenFilter

Genera n-grammi delle dimensioni specificate a partire dalla parte anteriore o dal retro di un token di input. Questo filtro token viene implementato usando Apache Lucene.

EdgeNGramTokenFilterSide

Specifica il lato dell'input da cui deve essere generato un n-gram.

EdgeNGramTokenFilterV2

Genera n-grammi delle dimensioni specificate a partire dalla parte anteriore o dal retro di un token di input. Questo filtro token viene implementato usando Apache Lucene.

EdgeNGramTokenizer

Tokenzza l'input da un bordo in n grammi delle dimensioni specificate. Questo tokenizer viene implementato usando Apache Lucene.

ElisionTokenFilter

Rimuove le elisioni. Ad esempio, "l'avion" (il piano) verrà convertito in "avion" (piano). Questo filtro token viene implementato usando Apache Lucene.

ExhaustiveKnnParameters

Contiene i parametri specifici dell'algoritmo KNN completo.

ExhaustiveKnnVectorSearchAlgorithmConfiguration

Contiene opzioni di configurazione specifiche dell'algoritmo KNN completo usato durante l'esecuzione di query, che eseguirà la ricerca di forza bruta nell'intero indice vettore.

FreshnessScoringFunction

Definisce una funzione che aumenta i punteggi in base al valore di un campo di data e ora.

FreshnessScoringParameters

Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi di freschezza.

HnswParameters

Contiene i parametri specifici dell'algoritmo HNSW.

HnswVectorSearchAlgorithmConfiguration

Contiene opzioni di configurazione specifiche per l'algoritmo HNSW approssimativo più vicino usato durante l'indicizzazione e la query. L'algoritmo HNSW offre un compromesso tra velocità di ricerca e accuratezza.

KeepTokenFilter

Filtro token che mantiene solo i token con testo contenuto in un elenco specificato di parole. Questo filtro token viene implementato usando Apache Lucene.

KeywordMarkerTokenFilter

Contrassegna i termini come parole chiave. Questo filtro token viene implementato usando Apache Lucene.

KeywordTokenizer

Genera l'intero input come token singolo. Questo tokenizzatore viene implementato usando Apache Lucene.

KeywordTokenizerV2

Genera l'intero input come token singolo. Questo tokenizzatore viene implementato usando Apache Lucene.

LengthTokenFilter

Rimuove le parole troppo lunghe o troppo corte. Questo filtro token viene implementato usando Apache Lucene.

LexicalAnalyzerName

Definisce i nomi di tutti gli analizzatori di testo supportati dal motore di ricerca.

LexicalTokenizerName

Definisce i nomi di tutti i tokenizer supportati dal motore di ricerca.

LimitTokenFilter

Limita il numero di token durante l'indicizzazione. Questo filtro token viene implementato usando Apache Lucene.

LuceneStandardAnalyzer

Analizzatore Apache Lucene standard; Composto dal tokenizer standard, dal filtro minuscolo e dal filtro di arresto.

LuceneStandardTokenizer

Suddivide il testo in base alle regole di segmentazione del testo Unicode. Questo tokenizzatore viene implementato usando Apache Lucene.

LuceneStandardTokenizerV2

Suddivide il testo in base alle regole di segmentazione del testo Unicode. Questo tokenizzatore viene implementato usando Apache Lucene.

MagnitudeScoringFunction

Definisce una funzione che aumenta i punteggi in base alla grandezza di un campo numerico.

MagnitudeScoringParameters

Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi di grandezza.

MappingCharFilter

Filtro di caratteri che applica i mapping definiti con l'opzione mapping. La corrispondenza è greedy. I criteri di ricerca più lunghi in un determinato punto hanno la precedenza. È consentita la sostituzione con una stringa vuota. Questo filtro di caratteri viene implementato usando Apache Lucene.

MicrosoftLanguageStemmingTokenizer

Divide il testo usando regole specifiche della lingua e riduce le parole alle relative forme di base.

MicrosoftLanguageTokenizer

Divide il testo usando le regole specifiche della lingua.

MicrosoftStemmingTokenizerLanguage

Elenchi le lingue supportate dal tokenizer di stemming della lingua Microsoft.

MicrosoftTokenizerLanguage

Elenchi le lingue supportate dal tokenizzatore di lingua Microsoft.

NGramTokenFilter

Genera n-grammi delle dimensioni specificate. Questo filtro token viene implementato usando Apache Lucene.

NGramTokenFilterV2

Genera n-grammi delle dimensioni specificate. Questo filtro token viene implementato usando Apache Lucene.

NGramTokenizer

Suddivide in token l'input in n-grammi di determinate dimensioni. Questo tokenizzatore viene implementato usando Apache Lucene.

PathHierarchyTokenizerV2

Tokenizer per le gerarchie di tipo percorso. Questo tokenizzatore viene implementato usando Apache Lucene.

PatternAnalyzer

Separa in modo flessibile il testo in termini tramite un modello di espressione regolare. Questo analizzatore viene implementato usando Apache Lucene.

PatternCaptureTokenFilter

Usa regexes Java per generare più token, uno per ogni gruppo di acquisizione in uno o più modelli. Questo filtro token viene implementato usando Apache Lucene.

PatternReplaceCharFilter

Filtro di caratteri che sostituisce i caratteri nella stringa di input. Usa un'espressione regolare per identificare le sequenze di caratteri da conservare e un criterio di sostituzione per identificare i caratteri da sostituire. Ad esempio, dato il testo di input "aa bb aa bb", pattern "(aa)\s+(bb)" e sostituzione "$1#$2", il risultato sarà "aa#bb aa#bb". Questo filtro di caratteri viene implementato usando Apache Lucene.

PatternReplaceTokenFilter

Filtro di caratteri che sostituisce i caratteri nella stringa di input. Usa un'espressione regolare per identificare le sequenze di caratteri da conservare e un criterio di sostituzione per identificare i caratteri da sostituire. Ad esempio, dato il testo di input "aa bb aa bb", pattern "(aa)\s+(bb)" e sostituzione "$1#$2", il risultato sarà "aa#bb aa#bb aa#bb". Questo filtro token viene implementato usando Apache Lucene.

PatternTokenizer

Tokenizer che usa il modello regex corrispondente per costruire token distinti. Questo tokenizzatore viene implementato usando Apache Lucene.

PhoneticEncoder

Identifica il tipo di codificatore fonetico da usare con phoneticTokenFilter.

PhoneticTokenFilter

Crea i token per le corrispondenze fonetiche. Questo filtro token viene implementato usando Apache Lucene.

PrioritizedFields

Descrive i campi titolo, contenuto e parole chiave da usare per la classificazione semantica, le didascalie, le evidenziazioni e le risposte.

RegexFlags

Definisce i flag che possono essere combinati per controllare la modalità di utilizzo delle espressioni regolari nell'analizzatore dei criteri e nel tokenizer di criteri.

ScoringFunctionAggregation

Definisce la funzione di aggregazione usata per combinare i risultati di tutte le funzioni di assegnazione dei punteggi in un profilo di punteggio.

ScoringFunctionInterpolation

Definisce la funzione usata per interpolare l'aumento del punteggio in un intervallo di documenti.

ScoringProfile

Definisce i parametri per un indice di ricerca che influisce sul punteggio nelle query di ricerca.

SearchError

Descrive una condizione di errore per l'API.

SearchField

Rappresenta un campo in una definizione di indice, che descrive il nome, il tipo di dati e il comportamento di ricerca di un campo.

SearchFieldDataType

Definisce il tipo di dati di un campo in un indice di ricerca.

SearchIndex

Rappresenta una definizione dell'indice di ricerca, che descrive i campi e il comportamento di ricerca di un indice.

SearchResourceEncryptionKey

Chiave di crittografia gestita dal cliente in Azure Key Vault. Le chiavi create e gestite possono essere usate per crittografare o decrittografare i dati inattivi nel servizio di ricerca, ad esempio indici e mappe sinonimi.

SemanticConfiguration

Definisce una configurazione specifica da usare nel contesto delle funzionalità semantiche.

SemanticField

Campo utilizzato come parte della configurazione semantica.

SemanticSettings

Definisce i parametri per un indice di ricerca che influiscono sulle funzionalità semantiche.

ShingleTokenFilter

Crea combinazioni di token come token singolo. Questo filtro token viene implementato usando Apache Lucene.

SnowballTokenFilter

Filtro che deriva le parole usando uno stemmer generato da Snowball. Questo filtro di token viene implementato usando Apache Lucene.

SnowballTokenFilterLanguage

Lingua da usare per un filtro di token Snowball.

StemmerOverrideTokenFilter

Consente di eseguire l'override di altri filtri di stemming con stemming basato su dizionario personalizzato. Tutti i termini con stemmy vengono contrassegnati come parole chiave in modo che non vengano stemmati lungo la catena. Da inserire prima dei filtri di stemming. Questo filtro di token viene implementato usando Apache Lucene.

StemmerTokenFilter

Filtro di stemming specifico della lingua. Questo filtro di token viene implementato usando Apache Lucene.

StemmerTokenFilterLanguage

Lingua da usare per un filtro token stemmer.

StopAnalyzer

Divide il testo in corrispondenza di non lettere; Applica i filtri token minuscoli e non significative. Questo analizzatore viene implementato usando Apache Lucene.

StopwordsList

Identifica un elenco predefinito di parole non significative specifiche della lingua.

StopwordsTokenFilter

Rimuove le parole non significative da un flusso di token. Questo filtro di token viene implementato usando Apache Lucene.

Suggester

Definisce il modo in cui l'API Suggerisci deve essere applicata a un gruppo di campi nell'indice.

SuggesterSearchMode

Valore che indica le funzionalità del suggerimento.

SynonymTokenFilter

Trova la corrispondenza di sinonimi con una o più parole in un flusso di token. Questo filtro di token viene implementato usando Apache Lucene.

TagScoringFunction

Definisce una funzione che aumenta i punteggi di documenti con valori stringa corrispondenti a un determinato elenco di tag.

TagScoringParameters

Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi tag.

TextWeights

Definisce i pesi nei campi di indice per i quali le corrispondenze devono aumentare il punteggio nelle query di ricerca.

TokenCharacterKind

Rappresenta le classi di caratteri in cui può funzionare un filtro token.

TokenFilterName

Definisce i nomi di tutti i filtri di token supportati dal motore di ricerca.

TruncateTokenFilter

Tronca i termini a una lunghezza specifica. Questo filtro di token viene implementato usando Apache Lucene.

UaxUrlEmailTokenizer

Suddivide in token gli URL e gli indirizzi di posta elettronica come un unico token. Questo tokenizzatore viene implementato usando Apache Lucene.

UniqueTokenFilter

Filtra i token con lo stesso testo del token precedente. Questo filtro di token viene implementato usando Apache Lucene.

VectorSearch

Contiene opzioni di configurazione correlate alla ricerca vettoriale.

VectorSearchAlgorithmKind

Algoritmo usato per l'indicizzazione e la query.

VectorSearchAlgorithmMetric

Metrica di somiglianza da usare per i confronti vettoriali.

VectorSearchProfile

Definisce una combinazione di configurazioni da usare con la ricerca vettoriale.

WordDelimiterTokenFilter

Suddivide le parole in sottoparole ed esegue trasformazioni facoltative sui gruppi di sottoparole. Questo filtro di token viene implementato usando Apache Lucene.

AsciiFoldingTokenFilter

Converte caratteri Unicode alfabetici, numerici e simbolici che non sono nei primi 127 caratteri ASCII (il blocco Unicode "Basic Latin" ) nei relativi equivalenti ASCII, se tali equivalenti esistono. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.AsciiFoldingTokenFilter

Un frammento URI che specifica il tipo di filtro del token.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

preserveOriginal

boolean

False

Valore che indica se il token originale verrà mantenuto. L'impostazione predefinita è false.

AzureActiveDirectoryApplicationCredentials

Credenziali di un'applicazione registrata creata per il servizio di ricerca, usata per l'accesso autenticato alle chiavi di crittografia archiviate in Azure Key Vault.

Nome Tipo Descrizione
applicationId

string

ID applicazione AAD a cui sono state concesse le autorizzazioni di accesso necessarie per l'Key Vault di Azure da usare durante la crittografia dei dati inattivi. L'ID applicazione non deve essere confuso con l'ID oggetto per l'applicazione AAD.

applicationSecret

string

Chiave di autenticazione dell'applicazione AAD specificata.

BM25Similarity

Funzione di classificazione basata sull'algoritmo di somiglianza Okapi BM25. BM25 è un algoritmo simile a TF-IDF che include la normalizzazione della lunghezza (controllata dal parametro 'b'), nonché la saturazione della frequenza dei termini (controllata dal parametro 'k1').

Nome Tipo Descrizione
@odata.type string:

#Microsoft.Azure.Search.BM25Similarity

b

number

Questa proprietà controlla il modo in cui la lunghezza di un documento influisce sul punteggio di pertinenza. Per impostazione predefinita, viene usato un valore pari a 0,75. Un valore pari a 0,0 indica che non viene applicata alcuna normalizzazione della lunghezza, mentre un valore pari a 1,0 indica che il punteggio è completamente normalizzato in base alla lunghezza del documento.

k1

number

Questa proprietà controlla la funzione di ridimensionamento tra la frequenza dei termini di ogni termine e il punteggio di pertinenza finale di una coppia di query di documenti. Per impostazione predefinita, viene usato un valore pari a 1,2. Un valore pari a 0,0 indica che il punteggio non viene ridimensionato con un aumento della frequenza di termine.

CharFilterName

Definisce i nomi di tutti i filtri di caratteri supportati dal motore di ricerca.

Nome Tipo Descrizione
html_strip

string

Filtro di caratteri che tenta di rimuovere i costrutti HTML. Vedere https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

CjkBigramTokenFilter

Forma bigrams di termini CJK generati dal tokenizer standard. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.CjkBigramTokenFilter

Un frammento URI che specifica il tipo di filtro del token.

ignoreScripts

CjkBigramTokenFilterScripts[]

Script da ignorare.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

outputUnigrams

boolean

False

Valore che indica se restituire sia unigrammi che bigrams (se true) o solo bigrams (se false). L'impostazione predefinita è false.

CjkBigramTokenFilterScripts

Script che possono essere ignorati da CjkBigramTokenFilter.

Nome Tipo Descrizione
han

string

Ignorare lo script Han durante la creazione di bigram dei termini CJK.

hangul

string

Ignorare lo script Hangul durante la creazione di bigram dei termini CJK.

hiragana

string

Ignorare lo script Hiragana durante la creazione di bigram dei termini CJK.

katakana

string

Ignorare lo script Katakana durante la creazione di bigram dei termini CJK.

ClassicSimilarity

Algoritmo di somiglianza legacy che usa l'implementazione Lucene TFIDFSimilarity di TF-IDF. Questa variante di TF-IDF introduce la normalizzazione della lunghezza dei documenti statici, nonché i fattori di coordinamento che penalizzano i documenti che corrispondono solo parzialmente alle query sottoposte a ricerca.

Nome Tipo Descrizione
@odata.type string:

#Microsoft.Azure.Search.ClassicSimilarity

ClassicTokenizer

Tokenizer basato su grammatica adatto per l'elaborazione della maggior parte dei documenti in lingua europea. Questo tokenizer viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.ClassicTokenizer

Frammento URI che specifica il tipo di tokenizer.

maxTokenLength

integer

255

Lunghezza massima del token. Il valore predefinito è 255. I token con lunghezza superiore a quella massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri.

name

string

Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

CommonGramTokenFilter

Costruisce digrammi per i termini frequenti durante l'indicizzazione. Anche i termini singoli continuano a essere indicizzati, con i digrammi sovrapposti. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.CommonGramTokenFilter

Un frammento URI che specifica il tipo di filtro del token.

commonWords

string[]

Set di parole comuni.

ignoreCase

boolean

False

Valore che indica se le parole comuni corrispondenti saranno insensibili. L'impostazione predefinita è false.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

queryMode

boolean

False

Valore che indica se il filtro del token è in modalità query. Quando in modalità query, il filtro token genera bigrams e quindi rimuove parole comuni e singoli termini seguiti da una parola comune. L'impostazione predefinita è false.

CorsOptions

Definisce le opzioni per controllare la condivisione delle risorse tra origini (CORS) per un indice.

Nome Tipo Descrizione
allowedOrigins

string[]

Elenco di origini da cui verrà concesso l'accesso al codice JavaScript all'indice. Può contenere un elenco di host del modulo {protocol}://{fully-qualified-domain-name}[:{port#}], o un singolo * per consentire tutte le origini (non consigliato).

maxAgeInSeconds

integer

Durata per cui i browser devono memorizzare nella cache le risposte pre-volo CORS. Il valore predefinito è 5 minuti.

CustomAnalyzer

Consente di controllare il processo di conversione del testo in token indicizzabili/ricercabili. Si tratta di una configurazione definita dall'utente costituita da un singolo tokenizzatore predefinito e uno o più filtri. Il tokenizer è responsabile dell'interruzione del testo nei token e dei filtri per la modifica dei token generati dal tokenizer.

Nome Tipo Descrizione
@odata.type string:

#Microsoft.Azure.Search.CustomAnalyzer

Frammento URI che specifica il tipo di analizzatore.

charFilters

CharFilterName[]

Elenco di filtri di caratteri usati per preparare il testo di input prima che venga elaborato dal tokenizer. ad esempio per sostituire determinati caratteri o simboli. I filtri vengono eseguiti nell'ordine in cui sono elencati.

name

string

Nome dell'analizzatore. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

tokenFilters

TokenFilterName[]

Elenco di filtri token usati per filtrare o modificare i token generati da un tokenizer. È possibile, ad esempio, specificare un filtro lowercase che converte tutti i caratteri in lettere minuscole. I filtri vengono eseguiti nell'ordine in cui sono elencati.

tokenizer

LexicalTokenizerName

Nome del tokenizer da usare per dividere il testo continuo in una sequenza di token, ad esempio suddividendo una frase in parole.

DictionaryDecompounderTokenFilter

Scompone le parole composte presenti in molte lingue germaniche. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter

Un frammento URI che specifica il tipo di filtro del token.

maxSubwordSize

integer

15

Dimensione massima della sottoword. Vengono restituite solo le parole secondarie più brevi di questa operazione. L'impostazione predefinita è 15. Il massimo è 300.

minSubwordSize

integer

2

Dimensione minima della sottoword. Vengono restituite solo parole secondarie più lunghe di questa. Il valore predefinito è 2. Il massimo è 300.

minWordSize

integer

5

Dimensione minima delle parole. Solo parole più lunghe di questa elaborazione. Il valore predefinito è 5. Il massimo è 300.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

onlyLongestMatch

boolean

False

Valore che indica se aggiungere solo la sottoword corrispondente più lunga all'output. L'impostazione predefinita è false.

wordList

string[]

Elenco di parole da associare.

DistanceScoringFunction

Definisce una funzione che aumenta i punteggi in base alla distanza da una posizione geografica.

Nome Tipo Descrizione
boost

number

Moltiplicatore per il punteggio non elaborato. Deve essere un numero positivo diverso da 1,0.

distance

DistanceScoringParameters

Valori dei parametri per la funzione di assegnazione dei punteggi della distanza.

fieldName

string

Nome del campo utilizzato come input per la funzione di assegnazione dei punteggi.

interpolation

ScoringFunctionInterpolation

Valore che indica come verrà interpolato il boosting tra i punteggi del documento; il valore predefinito è "Lineare".

type string:

distance

Indica il tipo di funzione da usare. I valori validi includono magnitude, freshness, distance e tag. Il tipo di funzione deve essere minuscolo.

DistanceScoringParameters

Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi a distanza.

Nome Tipo Descrizione
boostingDistance

number

Distanza in chilometri dalla posizione di riferimento in cui termina l'intervallo di aumento.

referencePointParameter

string

Nome del parametro passato nelle query di ricerca per specificare il percorso di riferimento.

EdgeNGramTokenFilter

Genera n-grammi delle dimensioni specificate a partire dalla parte anteriore o dal retro di un token di input. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenFilter

Un frammento URI che specifica il tipo di filtro del token.

maxGram

integer

2

Lunghezza massima n-gram. Il valore predefinito è 2.

minGram

integer

1

Lunghezza minima n-gram. Il valore predefinito è 1. Deve essere minore del valore di maxGram.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

side

EdgeNGramTokenFilterSide

front

Specifica il lato dell'input da cui deve essere generato n-gram. Il valore predefinito è "front".

EdgeNGramTokenFilterSide

Specifica il lato dell'input da cui deve essere generato un n-gram.

Nome Tipo Descrizione
back

string

Specifica che il n-gram deve essere generato dalla parte posteriore dell'input.

front

string

Specifica che il n-gram deve essere generato dalla parte anteriore dell'input.

EdgeNGramTokenFilterV2

Genera n-grammi delle dimensioni specificate a partire dalla parte anteriore o dal retro di un token di input. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenFilterV2

Un frammento URI che specifica il tipo di filtro del token.

maxGram

integer

2

Lunghezza massima n-gram. Il valore predefinito è 2. Il massimo è 300.

minGram

integer

1

Lunghezza minima n-gram. Il valore predefinito è 1. Il massimo è 300. Deve essere minore del valore di maxGram.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

side

EdgeNGramTokenFilterSide

front

Specifica il lato dell'input da cui deve essere generato n-gram. Il valore predefinito è "front".

EdgeNGramTokenizer

Tokenzza l'input da un bordo in n grammi delle dimensioni specificate. Questo tokenizer viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenizer

Un frammento URI che specifica il tipo di tokenizer.

maxGram

integer

2

Lunghezza massima n-gram. Il valore predefinito è 2. Il massimo è 300.

minGram

integer

1

Lunghezza minima n-gram. Il valore predefinito è 1. Il massimo è 300. Deve essere minore del valore di maxGram.

name

string

Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

tokenChars

TokenCharacterKind[]

Classi di caratteri da mantenere nei token.

ElisionTokenFilter

Rimuove le elisioni. Ad esempio, "l'avion" (il piano) verrà convertito in "avion" (piano). Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Descrizione
@odata.type string:

#Microsoft.Azure.Search.ElisionTokenFilter

Un frammento URI che specifica il tipo di filtro del token.

articles

string[]

Set di articoli da rimuovere.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

ExhaustiveKnnParameters

Contiene i parametri specifici dell'algoritmo KNN completo.

Nome Tipo Descrizione
metric

VectorSearchAlgorithmMetric

Metrica di somiglianza da usare per i confronti vettoriali.

ExhaustiveKnnVectorSearchAlgorithmConfiguration

Contiene opzioni di configurazione specifiche dell'algoritmo KNN completo usato durante l'esecuzione di query, che eseguirà la ricerca di forza bruta nell'intero indice vettore.

Nome Tipo Descrizione
exhaustiveKnnParameters

ExhaustiveKnnParameters

Contiene i parametri specifici dell'algoritmo KNN completo.

kind string:

exhaustiveKnn

Nome del tipo di algoritmo configurato per l'uso con la ricerca vettoriale.

name

string

Nome da associare a questa specifica configurazione.

FreshnessScoringFunction

Definisce una funzione che aumenta i punteggi in base al valore di un campo di data e ora.

Nome Tipo Descrizione
boost

number

Moltiplicatore per il punteggio non elaborato. Deve essere un numero positivo diverso da 1,0.

fieldName

string

Nome del campo utilizzato come input per la funzione di assegnazione dei punteggi.

freshness

FreshnessScoringParameters

Valori dei parametri per la funzione di assegnazione dei punteggi di aggiornamento.

interpolation

ScoringFunctionInterpolation

Valore che indica come verrà interpolato il boosting tra i punteggi del documento; il valore predefinito è "Lineare".

type string:

freshness

Indica il tipo di funzione da usare. I valori validi includono magnitude, freshness, distance e tag. Il tipo di funzione deve essere minuscolo.

FreshnessScoringParameters

Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi di freschezza.

Nome Tipo Descrizione
boostingDuration

string

Periodo di scadenza dopo il quale l'aumento si arresterà per un documento specifico.

HnswParameters

Contiene i parametri specifici dell'algoritmo HNSW.

Nome Tipo Valore predefinito Descrizione
efConstruction

integer

400

Dimensioni dell'elenco dinamico contenente i vicini più vicini, usati durante il tempo di indice. L'aumento di questo parametro può migliorare la qualità dell'indice, a spese di un aumento del tempo di indicizzazione. A un certo punto, l'aumento di questo parametro comporta una riduzione dei restituiti.

efSearch

integer

500

Dimensioni dell'elenco dinamico contenente i vicini più vicini, usati durante il periodo di ricerca. L'aumento di questo parametro può migliorare i risultati della ricerca, a spese della ricerca più lenta. A un certo punto, l'aumento di questo parametro comporta una riduzione dei restituiti.

m

integer

4

Numero di collegamenti bidirezionali creati per ogni nuovo elemento durante la costruzione. L'aumento di questo valore di parametro può migliorare il richiamo e ridurre i tempi di recupero per i set di dati con un'elevata dimensione intrinseca a spese di un maggiore consumo di memoria e un tempo di indicizzazione più lungo.

metric

VectorSearchAlgorithmMetric

Metrica di somiglianza da usare per i confronti vettoriali.

HnswVectorSearchAlgorithmConfiguration

Contiene opzioni di configurazione specifiche per l'algoritmo HNSW approssimativo più vicino usato durante l'indicizzazione e la query. L'algoritmo HNSW offre un compromesso tra velocità di ricerca e accuratezza.

Nome Tipo Descrizione
hnswParameters

HnswParameters

Contiene i parametri specifici dell'algoritmo HNSW.

kind string:

hnsw

Nome del tipo di algoritmo configurato per l'uso con la ricerca vettoriale.

name

string

Nome da associare a questa specifica configurazione.

KeepTokenFilter

Filtro token che mantiene solo i token con testo contenuto in un elenco specificato di parole. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.KeepTokenFilter

Un frammento URI che specifica il tipo di filtro del token.

keepWords

string[]

Elenco di parole da mantenere.

keepWordsCase

boolean

False

Valore che indica se in minuscolo tutte le parole prima. L'impostazione predefinita è false.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

KeywordMarkerTokenFilter

Contrassegna i termini come parole chiave. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.KeywordMarkerTokenFilter

Un frammento URI che specifica il tipo di filtro del token.

ignoreCase

boolean

False

Valore che indica se ignorare il caso. Se true, tutte le parole vengono convertite prima in minuscolo. L'impostazione predefinita è false.

keywords

string[]

Elenco di parole da contrassegnare come parole chiave.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

KeywordTokenizer

Genera l'intero input come token singolo. Questo tokenizzatore viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.KeywordTokenizer

Un frammento URI che specifica il tipo di tokenizer.

bufferSize

integer

256

Dimensioni del buffer di lettura in byte. Il valore predefinito è 256.

name

string

Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

KeywordTokenizerV2

Genera l'intero input come token singolo. Questo tokenizzatore viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.KeywordTokenizerV2

Un frammento URI che specifica il tipo di tokenizer.

maxTokenLength

integer

256

Lunghezza massima del token. Il valore predefinito è 256. I token con lunghezza superiore a quella massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri.

name

string

Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

LengthTokenFilter

Rimuove le parole troppo lunghe o troppo corte. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.LengthTokenFilter

Un frammento URI che specifica il tipo di filtro del token.

max

integer

300

Lunghezza massima in caratteri. Il valore predefinito e massimo è 300.

min

integer

0

Lunghezza minima in caratteri. Il valore predefinito è 0. Il massimo è 300. Deve essere minore del valore massimo.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

LexicalAnalyzerName

Definisce i nomi di tutti gli analizzatori di testo supportati dal motore di ricerca.

Nome Tipo Descrizione
ar.lucene

string

Analizzatore Lucene per l'arabo.

ar.microsoft

string

Analizzatore Microsoft per l'arabo.

bg.lucene

string

Analizzatore Lucene per bulgaro.

bg.microsoft

string

Analizzatore Microsoft per bulgaro.

bn.microsoft

string

Analizzatore Microsoft per Bangla.

ca.lucene

string

Analizzatore Lucene per catalano.

ca.microsoft

string

Analizzatore Microsoft per catalano.

cs.lucene

string

Analizzatore Lucene per ceco.

cs.microsoft

string

Analizzatore Microsoft per ceco.

da.lucene

string

Analizzatore Lucene per danese.

da.microsoft

string

Analizzatore Microsoft per danese.

de.lucene

string

Analizzatore Lucene per tedesco.

de.microsoft

string

Analizzatore Microsoft per tedesco.

el.lucene

string

Analizzatore Lucene per greco.

el.microsoft

string

Analizzatore Microsoft per greco.

en.lucene

string

Analizzatore Lucene per l'inglese.

en.microsoft

string

Analizzatore Microsoft per l'inglese.

es.lucene

string

Analizzatore Lucene per spagnolo.

es.microsoft

string

Analizzatore Microsoft per spagnolo.

et.microsoft

string

Analizzatore Microsoft per Estonian.

eu.lucene

string

Analizzatore Lucene per basco.

fa.lucene

string

Analizzatore Lucene per Persiano.

fi.lucene

string

Analizzatore Lucene per finlandese.

fi.microsoft

string

Analizzatore Microsoft per finlandese.

fr.lucene

string

Analizzatore Lucene per francese.

fr.microsoft

string

Analizzatore Microsoft per francese.

ga.lucene

string

Analizzatore Lucene per irlandese.

gl.lucene

string

Analizzatore Lucene per la Galizia.

gu.microsoft

string

Analizzatore Microsoft per Gujarati.

he.microsoft

string

Analizzatore Microsoft per l'ebraico.

hi.lucene

string

Analizzatore Lucene per Hindi.

hi.microsoft

string

Analizzatore Microsoft per Hindi.

hr.microsoft

string

Analizzatore Microsoft per croato.

hu.lucene

string

Analizzatore Lucene per ungherese.

hu.microsoft

string

Analizzatore Microsoft per ungherese.

hy.lucene

string

Analizzatore Lucene per armeno.

id.lucene

string

Analizzatore Lucene per indonesiano.

id.microsoft

string

Analizzatore Microsoft per indonesiano (Bahasa).

is.microsoft

string

Analizzatore Microsoft per islandese.

it.lucene

string

Analizzatore Lucene per italiano.

it.microsoft

string

Analizzatore Microsoft per italiano.

ja.lucene

string

Analizzatore Lucene per il giapponese.

ja.microsoft

string

Analizzatore Microsoft per il giapponese.

keyword

string

Considera l'intero contenuto di un campo come token singolo. Ciò è utile per i dati come i codici postali, ID e alcuni nomi di prodotto. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html

kn.microsoft

string

Analizzatore Microsoft per Kannada.

ko.lucene

string

Analizzatore Lucene per coreano.

ko.microsoft

string

Analizzatore Microsoft per il coreano.

lt.microsoft

string

Analizzatore Microsoft per lituano.

lv.lucene

string

Analizzatore Lucene per lettonia.

lv.microsoft

string

Analizzatore Microsoft per lettonia.

ml.microsoft

string

Analizzatore Microsoft per Malayalam.

mr.microsoft

string

Analizzatore Microsoft per Marathi.

ms.microsoft

string

Analizzatore Microsoft per la malay (alfabeto latino).

nb.microsoft

string

Analizzatore Microsoft per Norvegese (Bokmål).

nl.lucene

string

Analizzatore Lucene per olandese.

nl.microsoft

string

Analizzatore Microsoft per olandese.

no.lucene

string

Analizzatore Lucene per norvegese.

pa.microsoft

string

Analizzatore Microsoft per Punjabi.

pattern

string

Separa in modo flessibile il testo in termini tramite un modello di espressione regolare. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html

pl.lucene

string

Analizzatore Lucene per polacco.

pl.microsoft

string

Analizzatore Microsoft per polacco.

pt-BR.lucene

string

Analizzatore Lucene per portoghese (Brasile).

pt-BR.microsoft

string

Analizzatore Microsoft per portoghese (Brasile).

pt-PT.lucene

string

Analizzatore Lucene per portoghese (Portogallo).

pt-PT.microsoft

string

Analizzatore Microsoft per portoghese (Portogallo).

ro.lucene

string

Analizzatore Lucene per romeno.

ro.microsoft

string

Analizzatore Microsoft per romeno.

ru.lucene

string

Analizzatore Lucene per russo.

ru.microsoft

string

Analizzatore Microsoft per russo.

simple

string

Divide il testo in corrispondenza di elementi diversi da lettere e li converte in lettere minuscole. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html

sk.microsoft

string

Analizzatore Microsoft per slovacco.

sl.microsoft

string

Analizzatore Microsoft per sloveno.

sr-cyrillic.microsoft

string

Analizzatore Microsoft per serbo (cirillico).

sr-latin.microsoft

string

Analizzatore Microsoft per serbo (alfabeto latino).

standard.lucene

string

Analizzatore Lucene standard.

standardasciifolding.lucene

string

Analizzatore Lucene con riduzione ASCII standard. Vedere https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers

stop

string

Divide il testo in corrispondenza di non lettere; Applica i filtri token minuscoli e non significative. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html

sv.lucene

string

Analizzatore Lucene per svedese.

sv.microsoft

string

Analizzatore Microsoft per svedese.

ta.microsoft

string

Analizzatore Microsoft per Tamil.

te.microsoft

string

Analizzatore Microsoft per Telugu.

th.lucene

string

Analizzatore Lucene per Thai.

th.microsoft

string

Analizzatore Microsoft per Thai.

tr.lucene

string

Analizzatore Lucene per turco.

tr.microsoft

string

Analizzatore Microsoft per turco.

uk.microsoft

string

Analizzatore Microsoft per ucraino.

ur.microsoft

string

Analizzatore Microsoft per Urdu.

vi.microsoft

string

Analizzatore Microsoft per vietnamiti.

whitespace

string

Analizzatore che usa il tokenizer whitespace. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html

zh-Hans.lucene

string

Analizzatore Lucene per il cinese (semplificato).

zh-Hans.microsoft

string

Analizzatore Microsoft per il cinese (semplificato).

zh-Hant.lucene

string

Analizzatore Lucene per cinese (tradizionale).

zh-Hant.microsoft

string

Analizzatore Microsoft per il cinese (tradizionale).

LexicalTokenizerName

Definisce i nomi di tutti i tokenizer supportati dal motore di ricerca.

Nome Tipo Descrizione
classic

string

Tokenizer basato su grammatica adatto per l'elaborazione della maggior parte dei documenti in lingua europea. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html

edgeNGram

string

Tokenzza l'input da un bordo in n grammi delle dimensioni specificate. Vedere https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html

keyword_v2

string

Genera l'intero input come token singolo. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html

letter

string

Divide il testo in corrispondenza di elementi diversi da lettere. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html

lowercase

string

Divide il testo in corrispondenza di elementi diversi da lettere e li converte in lettere minuscole. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html

microsoft_language_stemming_tokenizer

string

Divide il testo usando regole specifiche della lingua e riduce le parole alle relative forme di base.

microsoft_language_tokenizer

string

Divide il testo usando le regole specifiche della lingua.

nGram

string

Suddivide in token l'input in n-grammi di determinate dimensioni. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html

path_hierarchy_v2

string

Tokenizer per le gerarchie di tipo percorso. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html

pattern

string

Tokenizer che usa criteri regex corrispondenti per costruire token distinti. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html

standard_v2

string

Analizzatore Lucene standard; Composto dal tokenizer standard, dal filtro minuscolo e dal filtro di arresto. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html

uax_url_email

string

Suddivide in token gli URL e gli indirizzi di posta elettronica come un unico token. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html

whitespace

string

Divide il testo in corrispondenza degli spazi vuoti. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

LimitTokenFilter

Limita il numero di token durante l'indicizzazione. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.LimitTokenFilter

Un frammento URI che specifica il tipo di filtro del token.

consumeAllTokens

boolean

False

Valore che indica se tutti i token dell'input devono essere utilizzati anche se viene raggiunto maxTokenCount. L'impostazione predefinita è false.

maxTokenCount

integer

1

Numero massimo di token da produrre. Il valore predefinito è 1.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

LuceneStandardAnalyzer

Analizzatore Apache Lucene standard; Composto dal tokenizer standard, dal filtro minuscolo e dal filtro di arresto.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.StandardAnalyzer

Frammento URI che specifica il tipo di analizzatore.

maxTokenLength

integer

255

Lunghezza massima del token. Il valore predefinito è 255. I token con lunghezza superiore a quella massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri.

name

string

Nome dell'analizzatore. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

stopwords

string[]

Elenco di parole non significative.

LuceneStandardTokenizer

Suddivide il testo in base alle regole di segmentazione del testo Unicode. Questo tokenizzatore viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.StandardTokenizer

Un frammento URI che specifica il tipo di tokenizer.

maxTokenLength

integer

255

Lunghezza massima del token. Il valore predefinito è 255. I token con lunghezza superiore a quella massima vengono suddivisi.

name

string

Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

LuceneStandardTokenizerV2

Suddivide il testo in base alle regole di segmentazione del testo Unicode. Questo tokenizzatore viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.StandardTokenizerV2

Un frammento URI che specifica il tipo di tokenizer.

maxTokenLength

integer

255

Lunghezza massima del token. Il valore predefinito è 255. I token con lunghezza superiore a quella massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri.

name

string

Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

MagnitudeScoringFunction

Definisce una funzione che aumenta i punteggi in base alla grandezza di un campo numerico.

Nome Tipo Descrizione
boost

number

Moltiplicatore per il punteggio non elaborato. Deve essere un numero positivo diverso da 1,0.

fieldName

string

Nome del campo utilizzato come input per la funzione di assegnazione dei punteggi.

interpolation

ScoringFunctionInterpolation

Valore che indica come verrà interpolato il boosting tra i punteggi del documento; il valore predefinito è "Lineare".

magnitude

MagnitudeScoringParameters

Valori dei parametri per la funzione di assegnazione dei punteggi di grandezza.

type string:

magnitude

Indica il tipo di funzione da usare. I valori validi includono magnitude, freshness, distance e tag. Il tipo di funzione deve essere minuscolo.

MagnitudeScoringParameters

Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi di grandezza.

Nome Tipo Descrizione
boostingRangeEnd

number

Valore del campo in corrispondenza del quale termina l'aumento.

boostingRangeStart

number

Valore del campo in corrispondenza del quale viene avviata l'aumento.

constantBoostBeyondRange

boolean

Valore che indica se applicare un aumento costante per i valori di campo oltre il valore finale dell'intervallo; il valore predefinito è false.

MappingCharFilter

Filtro di caratteri che applica i mapping definiti con l'opzione mapping. La corrispondenza è greedy. I criteri di ricerca più lunghi in un determinato punto hanno la precedenza. È consentita la sostituzione con una stringa vuota. Questo filtro di caratteri viene implementato usando Apache Lucene.

Nome Tipo Descrizione
@odata.type string:

#Microsoft.Azure.Search.MappingCharFilter

Frammento URI che specifica il tipo di filtro char.

mappings

string[]

Elenco di mapping del formato seguente: "a=>b" (tutte le occorrenze del carattere "a" verranno sostituite con il carattere "b").

name

string

Nome del filtro char. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

MicrosoftLanguageStemmingTokenizer

Divide il testo usando regole specifiche della lingua e riduce le parole alle relative forme di base.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer

Un frammento URI che specifica il tipo di tokenizer.

isSearchTokenizer

boolean

False

Valore che indica come viene usato il tokenizer. Impostare su true se usato come tokenizer di ricerca, impostare su false se usato come tokenizzatore di indicizzazione. L'impostazione predefinita è false.

language

MicrosoftStemmingTokenizerLanguage

Lingua da usare. Il valore predefinito è inglese.

maxTokenLength

integer

255

Lunghezza massima del token. I token con lunghezza superiore a quella massima vengono suddivisi. Lunghezza massima del token che può essere usata è di 300 caratteri. I token più lunghi di 300 caratteri vengono prima suddivisi in token di lunghezza 300 e quindi ognuno di questi token viene suddiviso in base al set di lunghezza massima del token. Il valore predefinito è 255.

name

string

Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

MicrosoftLanguageTokenizer

Divide il testo usando le regole specifiche della lingua.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.MicrosoftLanguageTokenizer

Un frammento URI che specifica il tipo di tokenizer.

isSearchTokenizer

boolean

False

Valore che indica come viene usato il tokenizer. Impostare su true se usato come tokenizer di ricerca, impostare su false se usato come tokenizzatore di indicizzazione. L'impostazione predefinita è false.

language

MicrosoftTokenizerLanguage

Lingua da usare. Il valore predefinito è inglese.

maxTokenLength

integer

255

Lunghezza massima del token. I token con lunghezza superiore a quella massima vengono suddivisi. Lunghezza massima del token che può essere usata è di 300 caratteri. I token più lunghi di 300 caratteri vengono prima suddivisi in token di lunghezza 300 e quindi ognuno di questi token viene suddiviso in base al set di lunghezza massima del token. Il valore predefinito è 255.

name

string

Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

MicrosoftStemmingTokenizerLanguage

Elenchi le lingue supportate dal tokenizer di stemming della lingua Microsoft.

Nome Tipo Descrizione
arabic

string

Seleziona il tokenizer di stemming Microsoft per l'arabo.

bangla

string

Seleziona il tokenizer di stemming Microsoft per Bangla.

bulgarian

string

Seleziona il tokenizer di stemming Microsoft per bulgaro.

catalan

string

Seleziona il tokenizer di stemming Microsoft per catalano.

croatian

string

Seleziona il tokenizzatore di stemming Microsoft per croato.

czech

string

Seleziona il tokenizer di stemming Microsoft per ceco.

danish

string

Seleziona il tokenizer di stemming Microsoft per danese.

dutch

string

Seleziona il tokenizer di stemming Microsoft per olandese.

english

string

Seleziona il tokenizer di stemming Microsoft per l'inglese.

estonian

string

Seleziona il tokenizer di stemming Microsoft per Estonian.

finnish

string

Seleziona il tokenizer di stemming Microsoft per finlandese.

french

string

Seleziona il tokenizer di stemming Microsoft per francese.

german

string

Seleziona il tokenizer di stemming Microsoft per il tedesco.

greek

string

Seleziona il tokenizer di stemming Microsoft per greco.

gujarati

string

Seleziona il tokenizer di stemming Microsoft per Gujarati.

hebrew

string

Seleziona il tokenizer di stemming Microsoft per l'ebraico.

hindi

string

Seleziona il tokenizer di stemming Microsoft per Hindi.

hungarian

string

Seleziona il tokenizer di stemming Microsoft per ungherese.

icelandic

string

Seleziona il tokenizer di stemming Microsoft per islandese.

indonesian

string

Seleziona il tokenizer di stemming Microsoft per indonesiano.

italian

string

Seleziona il tokenizer di stemming Microsoft per italiano.

kannada

string

Seleziona il tokenizer di stemming Microsoft per Kannada.

latvian

string

Seleziona il tokenizer di stemming Microsoft per lettonia.

lithuanian

string

Seleziona il tokenizer di stemming Microsoft per lituano.

malay

string

Seleziona il tokenizer di stemming Microsoft per La malay.

malayalam

string

Seleziona il tokenizer di stemming Microsoft per Malayalam.

marathi

string

Seleziona il tokenizer di stemming Microsoft per Marathi.

norwegianBokmaal

string

Seleziona il tokenizer di stemming Microsoft per Norvegese (Bokmål).

polish

string

Seleziona il tokenizzatore di stemming Microsoft per polacco.

portuguese

string

Seleziona il tokenizer di stemming Microsoft per il portoghese.

portugueseBrazilian

string

Seleziona il tokenizer di stemming Microsoft per portoghese (Brasile).

punjabi

string

Seleziona il tokenizer di stemming Microsoft per Punjabi.

romanian

string

Seleziona il tokenizzatore di stemming Microsoft per romeno.

russian

string

Seleziona il tokenizer di stemming Microsoft per russo.

serbianCyrillic

string

Seleziona il tokenizzatore di stemming Microsoft per serbo (cirillico).

serbianLatin

string

Seleziona il tokenizer di stemming Microsoft per serbo (alfabeto latino).

slovak

string

Seleziona il tokenizer di stemming Microsoft per slovacco.

slovenian

string

Seleziona il tokenizer di stemming Microsoft per sloveno.

spanish

string

Seleziona il tokenizer di stemming Microsoft per spagnolo.

swedish

string

Seleziona il tokenizer di stemming Microsoft per svedese.

tamil

string

Seleziona il tokenizer di stemming Microsoft per Tamil.

telugu

string

Seleziona il tokenizer di stemming Microsoft per Telugu.

turkish

string

Seleziona il tokenizer di stemming Microsoft per turco.

ukrainian

string

Seleziona il tokenizer di stemming Microsoft per ucraino.

urdu

string

Seleziona il tokenizer di stemming Microsoft per Urdu.

MicrosoftTokenizerLanguage

Elenchi le lingue supportate dal tokenizzatore di lingua Microsoft.

Nome Tipo Descrizione
bangla

string

Seleziona il tokenizer Microsoft per Bangla.

bulgarian

string

Seleziona il tokenizer Microsoft per bulgaro.

catalan

string

Seleziona il tokenizer Microsoft per catalano.

chineseSimplified

string

Seleziona il tokenizer Microsoft per cinese (semplificato).

chineseTraditional

string

Seleziona il tokenizer Microsoft per cinese (tradizionale).

croatian

string

Seleziona il tokenizer Microsoft per croato.

czech

string

Seleziona il tokenizer Microsoft per ceco.

danish

string

Seleziona il tokenizer Microsoft per danese.

dutch

string

Seleziona il tokenizer Microsoft per olandese.

english

string

Seleziona il tokenizer Microsoft per la lingua inglese.

french

string

Seleziona il tokenizer Microsoft per francese.

german

string

Seleziona il tokenizer Microsoft per tedesco.

greek

string

Seleziona il tokenizer Microsoft per greco.

gujarati

string

Seleziona il tokenizer Microsoft per Gujarati.

hindi

string

Seleziona il tokenizer Microsoft per Hindi.

icelandic

string

Seleziona il tokenizer Microsoft per Islanda.

indonesian

string

Seleziona il tokenizer Microsoft per indonesiano.

italian

string

Seleziona il tokenizer Microsoft per italiano.

japanese

string

Seleziona il tokenizer Microsoft per il giapponese.

kannada

string

Seleziona il tokenizer Microsoft per Kannada.

korean

string

Seleziona il tokenizer Microsoft per coreano.

malay

string

Seleziona il tokenizer Microsoft per La malay.

malayalam

string

Seleziona il tokenizer Microsoft per Malayalam.

marathi

string

Seleziona il tokenizer Microsoft per Marathi.

norwegianBokmaal

string

Seleziona il tokenizer Microsoft per Norvegese (Bokmål).

polish

string

Seleziona il tokenizer Microsoft per polacco.

portuguese

string

Seleziona il tokenizer Microsoft per portoghese.

portugueseBrazilian

string

Seleziona il tokenizer Microsoft per portoghese (Brasile).

punjabi

string

Seleziona il tokenizer Microsoft per Punjabi.

romanian

string

Seleziona il tokenizer Microsoft per romeno.

russian

string

Seleziona il tokenizer Microsoft per russo.

serbianCyrillic

string

Seleziona il tokenizer Microsoft per serbo (cirillico).

serbianLatin

string

Seleziona il tokenizer Microsoft per serbo (alfabeto latino).

slovenian

string

Seleziona il tokenizer Microsoft per sloveno.

spanish

string

Seleziona il tokenizer Microsoft per spagnolo.

swedish

string

Seleziona il tokenizer Microsoft per svedese.

tamil

string

Seleziona il tokenizer Microsoft per Tamil.

telugu

string

Seleziona il tokenizer Microsoft per Telugu.

thai

string

Seleziona il tokenizer Microsoft per Thai.

ukrainian

string

Seleziona il tokenizer Microsoft per ucraino.

urdu

string

Seleziona il tokenizer Microsoft per Urdu.

vietnamese

string

Seleziona il tokenizer Microsoft per vietnamita.

NGramTokenFilter

Genera n-grammi delle dimensioni specificate. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.NGramTokenFilter

Un frammento URI che specifica il tipo di filtro del token.

maxGram

integer

2

Lunghezza massima n-gram. Il valore predefinito è 2.

minGram

integer

1

Lunghezza minima n-gram. Il valore predefinito è 1. Deve essere minore del valore di maxGram.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

NGramTokenFilterV2

Genera n-grammi delle dimensioni specificate. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.NGramTokenFilterV2

Un frammento URI che specifica il tipo di filtro del token.

maxGram

integer

2

Lunghezza massima n-gram. Il valore predefinito è 2. Il massimo è 300.

minGram

integer

1

Lunghezza minima n-gram. Il valore predefinito è 1. Il massimo è 300. Deve essere minore del valore di maxGram.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

NGramTokenizer

Suddivide in token l'input in n-grammi di determinate dimensioni. Questo tokenizzatore viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.NGramTokenizer

Un frammento URI che specifica il tipo di tokenizer.

maxGram

integer

2

Lunghezza massima n-gram. Il valore predefinito è 2. Il massimo è 300.

minGram

integer

1

Lunghezza minima n-gram. Il valore predefinito è 1. Il massimo è 300. Deve essere minore del valore di maxGram.

name

string

Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

tokenChars

TokenCharacterKind[]

Classi di caratteri da mantenere nei token.

PathHierarchyTokenizerV2

Tokenizer per le gerarchie di tipo percorso. Questo tokenizzatore viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.PathHierarchyTokenizerV2

Un frammento URI che specifica il tipo di tokenizer.

delimiter

string

/

Carattere delimitatore da usare. Il valore predefinito è "/".

maxTokenLength

integer

300

Lunghezza massima del token. Il valore predefinito e massimo è 300.

name

string

Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

replacement

string

/

Valore che, se impostato, sostituisce il carattere delimitatore. Il valore predefinito è "/".

reverse

boolean

False

Valore che indica se generare token in ordine inverso. L'impostazione predefinita è false.

skip

integer

0

Numero di token iniziali da ignorare. Il valore predefinito è 0.

PatternAnalyzer

Separa in modo flessibile il testo in termini tramite un modello di espressione regolare. Questo analizzatore viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.PatternAnalyzer

Frammento URI che specifica il tipo di analizzatore.

flags

RegexFlags

Flag di espressione regolare.

lowercase

boolean

True

Valore che indica se i termini devono essere minuscoli. Il valore predefinito è true.

name

string

Nome dell'analizzatore. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

pattern

string

\W+

Modello di espressione regolare per trovare la corrispondenza con i separatori di token. Il valore predefinito è un'espressione che corrisponde a uno o più caratteri non di parola.

stopwords

string[]

Elenco di parole non significative.

PatternCaptureTokenFilter

Usa regexes Java per generare più token, uno per ogni gruppo di acquisizione in uno o più modelli. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.PatternCaptureTokenFilter

Un frammento URI che specifica il tipo di filtro del token.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

patterns

string[]

Elenco di modelli da associare a ogni token.

preserveOriginal

boolean

True

Valore che indica se restituire il token originale anche se uno dei modelli corrisponde. Il valore predefinito è true.

PatternReplaceCharFilter

Filtro di caratteri che sostituisce i caratteri nella stringa di input. Usa un'espressione regolare per identificare le sequenze di caratteri da conservare e un criterio di sostituzione per identificare i caratteri da sostituire. Ad esempio, dato il testo di input "aa bb aa bb", pattern "(aa)\s+(bb)" e sostituzione "$1#$2", il risultato sarà "aa#bb aa#bb". Questo filtro di caratteri viene implementato usando Apache Lucene.

Nome Tipo Descrizione
@odata.type string:

#Microsoft.Azure.Search.PatternReplaceCharFilter

Frammento URI che specifica il tipo di filtro char.

name

string

Nome del filtro char. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

pattern

string

Modello di espressione regolare.

replacement

string

Testo di sostituzione.

PatternReplaceTokenFilter

Filtro di caratteri che sostituisce i caratteri nella stringa di input. Usa un'espressione regolare per identificare le sequenze di caratteri da conservare e un criterio di sostituzione per identificare i caratteri da sostituire. Ad esempio, dato il testo di input "aa bb aa bb", pattern "(aa)\s+(bb)" e sostituzione "$1#$2", il risultato sarà "aa#bb aa#bb aa#bb". Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Descrizione
@odata.type string:

#Microsoft.Azure.Search.PatternReplaceTokenFilter

Un frammento URI che specifica il tipo di filtro del token.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

pattern

string

Modello di espressione regolare.

replacement

string

Testo di sostituzione.

PatternTokenizer

Tokenizer che usa il modello regex corrispondente per costruire token distinti. Questo tokenizzatore viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.PatternTokenizer

Un frammento URI che specifica il tipo di tokenizer.

flags

RegexFlags

Flag di espressioni regolari.

group

integer

-1

Ordinale in base zero del gruppo di corrispondenza nel modello di espressione regolare da estrarre in token. Usare -1 se si vuole usare l'intero modello per suddividere l'input in token, indipendentemente dai gruppi corrispondenti. Il valore predefinito è -1.

name

string

Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

pattern

string

\W+

Modello di espressione regolare per corrispondere ai separatori di token. Il valore predefinito è un'espressione che corrisponde a uno o più caratteri non di parola.

PhoneticEncoder

Identifica il tipo di codificatore fonetico da usare con phoneticTokenFilter.

Nome Tipo Descrizione
beiderMorse

string

Codifica un token in un valore Beider-Morse.

caverphone1

string

Codifica un token in un valore Caverphone 1.0.

caverphone2

string

Codifica un token in un valore Caverphone 2.0.

cologne

string

Codifica un token in un valore fonetico di Colonia.

doubleMetaphone

string

Codifica un token in un valore metaphone doppio.

haasePhonetik

string

Codifica un token usando il perfezionamento di Haase dell'algoritmo Kölner Phonetik.

koelnerPhonetik

string

Codifica un token usando l'algoritmo Kölner Phonetik.

metaphone

string

Codifica un token in un valore Metaphone.

nysiis

string

Codifica un token in un valore NYSIIS.

refinedSoundex

string

Codifica un token in un valore Soundex raffinato.

soundex

string

Codifica un token in un valore Soundex.

PhoneticTokenFilter

Crea i token per le corrispondenze fonetiche. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.PhoneticTokenFilter

Un frammento URI che specifica il tipo di filtro del token.

encoder

PhoneticEncoder

metaphone

Codificatore fonetico da usare. Il valore predefinito è "metaphone".

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

replace

boolean

True

Valore che indica se i token codificati devono sostituire i token originali. Se false, i token codificati vengono aggiunti come sinonimi. Il valore predefinito è true.

PrioritizedFields

Descrive i campi titolo, contenuto e parole chiave da usare per la classificazione semantica, le didascalie, le evidenziazioni e le risposte.

Nome Tipo Descrizione
prioritizedContentFields

SemanticField[]

Definisce i campi di contenuto da usare per classificazione semantica, didascalie, evidenziazioni e risposte. Per ottenere il risultato migliore, i campi selezionati devono contenere testo nel formato del linguaggio naturale. L'ordine dei campi nella matrice rappresenta la priorità. I campi con priorità inferiore possono essere troncati se il contenuto è lungo.

prioritizedKeywordsFields

SemanticField[]

Definisce i campi delle parole chiave da usare per la classificazione semantica, le didascalie, le evidenziazioni e le risposte. Per il risultato migliore, i campi selezionati devono contenere un elenco di parole chiave. L'ordine dei campi nella matrice rappresenta la priorità. I campi con priorità inferiore possono essere troncati se il contenuto è lungo.

titleField

SemanticField

Definisce il campo titolo da usare per la classificazione semantica, le didascalie, le evidenziazioni e le risposte. Se non si dispone di un campo titolo nell'indice, lasciare vuoto questo campo.

RegexFlags

Definisce i flag che possono essere combinati per controllare la modalità di utilizzo delle espressioni regolari nell'analizzatore dei criteri e nel tokenizer di criteri.

Nome Tipo Descrizione
CANON_EQ

string

Abilita l'equivalenza canonica.

CASE_INSENSITIVE

string

Abilita la corrispondenza senza distinzione tra maiuscole e minuscole.

COMMENTS

string

Consente spazi vuoti e commenti nel modello.

DOTALL

string

Abilita la modalità dotall.

LITERAL

string

Abilita l'analisi letterale del criterio.

MULTILINE

string

Abilita la modalità multilinea.

UNICODE_CASE

string

Abilita la riduzione del case compatibile con Unicode.

UNIX_LINES

string

Abilita la modalità righe Unix.

ScoringFunctionAggregation

Definisce la funzione di aggregazione usata per combinare i risultati di tutte le funzioni di assegnazione dei punteggi in un profilo di punteggio.

Nome Tipo Descrizione
average

string

Aumentare i punteggi in base alla media di tutti i risultati della funzione di assegnazione dei punteggi.

firstMatching

string

Aumentare i punteggi usando la prima funzione di assegnazione dei punteggi applicabile nel profilo di punteggio.

maximum

string

Incrementare i punteggi in base al massimo di tutti i risultati della funzione di assegnazione dei punteggi.

minimum

string

Incrementare i punteggi in base al minimo di tutti i risultati della funzione di assegnazione dei punteggi.

sum

string

Aumentare i punteggi in base alla somma di tutti i risultati della funzione di assegnazione dei punteggi.

ScoringFunctionInterpolation

Definisce la funzione usata per interpolare l'aumento del punteggio in un intervallo di documenti.

Nome Tipo Descrizione
constant

string

Aumenta i punteggi in base a un fattore costante.

linear

string

Aumenta i punteggi in base a una quantità di riduzione lineare. Si tratta dell'interpolazione predefinita per le funzioni di assegnazione dei punteggi.

logarithmic

string

Aumenta i punteggi per una quantità che riduce la logaritmica. Aumenta rapidamente i punteggi più elevati e più lentamente, man mano che i punteggi diminuiscono. Questa opzione di interpolazione non è consentita nelle funzioni di assegnazione di punteggio in base a tag.

quadratic

string

Aumenta i punteggi per una quantità che riduce quadraticamente. Aumenta lentamente i punteggi più alti e più rapidamente quando i punteggi diminuiscono. Questa opzione di interpolazione non è consentita nelle funzioni di assegnazione di punteggio in base a tag.

ScoringProfile

Definisce i parametri per un indice di ricerca che influisce sul punteggio nelle query di ricerca.

Nome Tipo Descrizione
functionAggregation

ScoringFunctionAggregation

Valore che indica come devono essere combinati i risultati delle singole funzioni di assegnazione dei punteggi. Il valore predefinito è "Sum". Ignorato se non sono presenti funzioni di assegnazione dei punteggi.

functions ScoringFunction[]:

Raccolta di funzioni che influiscono sul punteggio dei documenti.

name

string

Nome del profilo di assegnazione dei punteggi.

text

TextWeights

Parametri che aumentano il punteggio in base alle corrispondenze di testo in determinati campi di indice.

SearchError

Descrive una condizione di errore per l'API.

Nome Tipo Descrizione
code

string

Uno dei set definiti dal server di codici di errore.

details

SearchError[]

Matrice di dettagli sugli errori specifici che hanno causato questo errore segnalato.

message

string

Rappresentazione leggibile dell'errore.

SearchField

Rappresenta un campo in una definizione di indice, che descrive il nome, il tipo di dati e il comportamento di ricerca di un campo.

Nome Tipo Descrizione
analyzer

LexicalAnalyzerName

Nome dell'analizzatore da usare per il campo. Questa opzione può essere usata solo con campi ricercabili e non può essere impostata con searchAnalyzer o indexAnalyzer. Una volta scelto, l'analizzatore non può essere cambiato per il campo. Deve essere Null per i campi complessi.

dimensions

integer

Dimensione del campo vettore.

facetable

boolean

Valore che indica se abilitare il campo a cui fare riferimento nelle query facet. In genere usato in una presentazione dei risultati della ricerca che includono il numero di hit per categoria (ad esempio, cercare fotocamere digitali e vedere le hit per marchio, da megalie, per prezzo e così via). Questa proprietà deve essere null per i campi complessi. I campi di tipo Edm.GeographyPoint o Collection(Edm.GeographyPoint) non possono essere visibili. Il valore predefinito è true per tutti gli altri campi semplici.

fields

SearchField[]

Elenco di campi secondari se si tratta di un campo di tipo Edm.ComplexType o Collection(Edm.ComplexType). Deve essere null o vuoto per i campi semplici.

filterable

boolean

Valore che indica se abilitare il campo a cui fare riferimento nelle query $filter. filtrabile differisce dalla modalità di gestione delle stringhe. I campi di tipo Edm.String o Collection(Edm.String) che sono filtrabili non subiscono interruzioni di parole, quindi i confronti sono solo per corrispondenze esatte. Ad esempio, se si imposta un campo f su "giorno sole", $filter=f eq 'sunny' non troverà corrispondenze, ma $filter=f eq 'sunny day' will. Questa proprietà deve essere null per i campi complessi. Il valore predefinito è true per i campi semplici e Null per i campi complessi.

indexAnalyzer

LexicalAnalyzerName

Nome dell'analizzatore usato in fase di indicizzazione per il campo. Questa opzione può essere usata solo con campi ricercabili. Deve essere impostato insieme a searchAnalyzer e non può essere impostato insieme all'opzione analizzatore. Questa proprietà non può essere impostata sul nome di un analizzatore del linguaggio; usare invece la proprietà analizzatore se è necessario un analizzatore del linguaggio. Una volta scelto, l'analizzatore non può essere cambiato per il campo. Deve essere Null per i campi complessi.

key

boolean

Valore che indica se il campo identifica in modo univoco i documenti nell'indice. È necessario scegliere esattamente un campo di primo livello in ogni indice come campo chiave e deve essere di tipo Edm.String. I campi chiave possono essere usati per cercare i documenti direttamente ed aggiornare o eliminare documenti specifici. Il valore predefinito è false per i campi semplici e Null per i campi complessi.

name

string

Nome del campo, che deve essere univoco all'interno dell'insieme campi del campo indice o padre.

retrievable

boolean

Valore che indica se il campo può essere restituito in un risultato di ricerca. È possibile disabilitare questa opzione se si vuole usare un campo (ad esempio, margine) come filtro, ordinamento o meccanismo di assegnazione dei punteggi, ma non si vuole che il campo sia visibile all'utente finale. Questa proprietà deve essere true per i campi chiave e deve essere Null per i campi complessi. Questa proprietà può essere modificata nei campi esistenti. L'abilitazione di questa proprietà non comporta alcun aumento dei requisiti di archiviazione dell'indice. Il valore predefinito è true per i campi semplici e Null per i campi complessi.

searchAnalyzer

LexicalAnalyzerName

Nome dell'analizzatore usato in fase di ricerca per il campo. Questa opzione può essere usata solo con campi ricercabili. Deve essere impostato insieme a indexAnalyzer e non può essere impostato insieme all'opzione analizzatore. Questa proprietà non può essere impostata sul nome di un analizzatore del linguaggio; usare invece la proprietà analizzatore se è necessario un analizzatore del linguaggio. Questo analizzatore può essere aggiornato per un campo esistente. Deve essere Null per i campi complessi.

searchable

boolean

Valore che indica se il campo è ricercabile in full-text. Ciò significa che verrà sottoposto ad analisi, ad esempio la suddivisione in parole durante l'indicizzazione. Se si imposta un campo ricercabile su un valore come "sunny day", questo viene suddiviso internamente nei singoli token "sunny" e "day". È così possibile eseguire ricerche full-text di questi termini. I campi di tipo Edm.String o Collection(Edm.String) sono ricercabili per impostazione predefinita. Questa proprietà deve essere false per i campi semplici di altri tipi di dati non stringa e deve essere Null per i campi complessi. Nota: i campi ricercabili usano spazio aggiuntivo nell'indice per supportare versioni tokenizzate aggiuntive del valore del campo per le ricerche full-text. Se si vuole risparmiare spazio nell'indice e non è necessario includere un campo nelle ricerche, impostare searchable su false.

sortable

boolean

Valore che indica se abilitare il campo a cui fare riferimento nelle espressioni di $orderby. Per impostazione predefinita, il motore di ricerca ordina i risultati per punteggio, ma in molte esperienze gli utenti vogliono ordinare in base ai campi nei documenti. Un campo semplice può essere ordinabile solo se è a valore singolo (ha un singolo valore nell'ambito del documento padre). I campi di raccolta semplici non possono essere ordinabili, poiché sono multivalore. I campi secondari semplici delle raccolte complesse sono anche multivalore e pertanto non possono essere ordinabili. Questo è vero se si tratta di un campo padre immediato o di un campo predecessore, ovvero la raccolta complessa. I campi complessi non possono essere ordinabili e la proprietà ordinabile deve essere null per tali campi. Il valore predefinito per ordinabile è true per i campi semplici con valori singoli, false per i campi semplici con più valori e Null per i campi complessi.

synonymMaps

string[]

Elenco dei nomi delle mappe sinonimi da associare a questo campo. Questa opzione può essere usata solo con campi ricercabili. Attualmente è supportata solo una mappa sinonimo per campo. L'assegnazione di un mapping sinonimo a un campo garantisce che i termini di query destinati al campo vengano espansi in fase di query usando le regole nella mappa sinonimia. Questo attributo può essere modificato nei campi esistenti. Deve essere null o una raccolta vuota per campi complessi.

type

SearchFieldDataType

Tipo di dati del campo.

vectorSearchProfile

string

Nome del profilo di ricerca vettore che specifica l'algoritmo da usare durante la ricerca nel campo vettore.

SearchFieldDataType

Definisce il tipo di dati di un campo in un indice di ricerca.

Nome Tipo Descrizione
Edm.Boolean

string

Indica che un campo contiene un valore booleano (true o false).

Edm.ComplexType

string

Indica che un campo contiene uno o più oggetti complessi che a sua volta includono sottocampi di altri tipi.

Edm.DateTimeOffset

string

Indica che un campo contiene un valore di data/ora, incluse le informazioni sul fuso orario.

Edm.Double

string

Indica che un campo contiene un numero a virgola mobile a precisione doppia IEEE.

Edm.GeographyPoint

string

Indica che un campo contiene una posizione geografica in termini di longitudine e latitudine.

Edm.Int32

string

Indica che un campo contiene un intero con segno a 32 bit.

Edm.Int64

string

Indica che un campo contiene un intero con segno a 64 bit.

Edm.Single

string

Indica che un campo contiene un numero a virgola mobile e precisione singola. Questa opzione è valida solo se utilizzata con Collection(Edm.Single).

Edm.String

string

Indica che un campo contiene una stringa.

SearchIndex

Rappresenta una definizione dell'indice di ricerca, che descrive i campi e il comportamento di ricerca di un indice.

Nome Tipo Descrizione
@odata.etag

string

ETag dell'indice.

analyzers LexicalAnalyzer[]:

Analizzatori per l'indice.

charFilters CharFilter[]:

I filtri di caratteri per l'indice.

corsOptions

CorsOptions

Opzioni per controllare la condivisione di risorse tra le origini (CORS) per l'indice.

defaultScoringProfile

string

Nome del profilo di punteggio da usare se non è specificato alcuno nella query. Se questa proprietà non è impostata e nella query non viene specificato alcun profilo di punteggio, verrà usato il punteggio predefinito (tf-idf).

encryptionKey

SearchResourceEncryptionKey

Descrizione di una chiave di crittografia creata in Azure Key Vault. Questa chiave viene usata per fornire un livello aggiuntivo di crittografia dei dati inattivi quando si vuole garantire che nessuno, nemmeno Microsoft, possa decrittografare i dati. Dopo aver crittografato i dati, i dati rimarranno sempre crittografati. Il servizio di ricerca ignorerà i tentativi di impostare questa proprietà su Null. È possibile modificare questa proprietà in base alle esigenze se si vuole ruotare la chiave di crittografia; I dati non saranno interessati. La crittografia con chiavi gestite dal cliente non è disponibile per i servizi di ricerca gratuiti ed è disponibile solo per i servizi a pagamento creati il 1° gennaio 2019.

fields

SearchField[]

Campi dell'indice.

name

string

Nome dell'indice.

scoringProfiles

ScoringProfile[]

Profili di punteggio per l'indice.

semantic

SemanticSettings

Definisce i parametri per un indice di ricerca che influiscono sulle funzionalità semantiche.

similarity Similarity:

Tipo di algoritmo di somiglianza da usare per l'assegnazione dei punteggi e la classificazione dei documenti corrispondenti a una query di ricerca. L'algoritmo di somiglianza può essere definito solo in fase di creazione dell'indice e non può essere modificato negli indici esistenti. Se null, viene usato l'algoritmo ClassicSimilarity.

suggesters

Suggester[]

Suggerimenti per l'indice.

tokenFilters TokenFilter[]:

Il token filtra l'indice.

tokenizers LexicalTokenizer[]:

Tokenizer per l'indice.

vectorSearch

VectorSearch

Contiene le opzioni di configurazione correlate alla ricerca vettoriale.

SearchResourceEncryptionKey

Chiave di crittografia gestita dal cliente in Azure Key Vault. Le chiavi create e gestite possono essere usate per crittografare o decrittografare i dati inattivi nel servizio di ricerca, ad esempio indici e mappe sinonimi.

Nome Tipo Descrizione
accessCredentials

AzureActiveDirectoryApplicationCredentials

Credenziali facoltative di Azure Active Directory usate per accedere all'Key Vault di Azure. Non richiesto se si usa invece l'identità gestita.

keyVaultKeyName

string

Nome della chiave di Key Vault di Azure da usare per crittografare i dati inattivi.

keyVaultKeyVersion

string

Versione della chiave di Key Vault di Azure da usare per crittografare i dati inattivi.

keyVaultUri

string

URI dell'Key Vault di Azure, noto anche come nome DNS, che contiene la chiave da usare per crittografare i dati inattivi. Un URI di esempio potrebbe essere https://my-keyvault-name.vault.azure.net.

SemanticConfiguration

Definisce una configurazione specifica da usare nel contesto delle funzionalità semantiche.

Nome Tipo Descrizione
name

string

Nome della configurazione semantica.

prioritizedFields

PrioritizedFields

Descrive i campi titolo, contenuto e parola chiave da usare per la classificazione semantica, le didascalie, le evidenziazioni e le risposte. È necessario impostare almeno una delle tre sottoproprietà (titleField, prioritizedKeywordsFields e prioritizedContentFields).

SemanticField

Campo utilizzato come parte della configurazione semantica.

Nome Tipo Descrizione
fieldName

string

SemanticSettings

Definisce i parametri per un indice di ricerca che influiscono sulle funzionalità semantiche.

Nome Tipo Descrizione
configurations

SemanticConfiguration[]

Configurazioni semantiche per l'indice.

defaultConfiguration

string

Consente di impostare il nome di una configurazione semantica predefinita nell'indice, rendendo facoltativo passarlo come parametro di query ogni volta.

ShingleTokenFilter

Crea combinazioni di token come token singolo. Questo filtro token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.ShingleTokenFilter

Frammento URI che specifica il tipo di filtro del token.

filterToken

string

_

Stringa da inserire per ogni posizione in cui non è presente alcun token. Il valore predefinito è un carattere di sottolineatura ("_").

maxShingleSize

integer

2

Dimensione massima dello shingle. Il valore predefinito e minimo è 2.

minShingleSize

integer

2

Dimensioni minime dello shingle. Il valore predefinito e minimo è 2. Deve essere minore del valore di maxShingleSize.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

outputUnigrams

boolean

True

Valore che indica se il flusso di output conterrà i token di input (unigrammi) e gli shingles. Il valore predefinito è true.

outputUnigramsIfNoShingles

boolean

False

Valore che indica se restituire unigrammi per quei tempi in cui non sono disponibili shingles. Questa proprietà ha la precedenza quando outputUnigrams è impostato su false. L'impostazione predefinita è false.

tokenSeparator

string

Stringa da usare quando si uniscono i token adiacenti per formare uno shingle. Il valore predefinito è un singolo spazio (" ").

SnowballTokenFilter

Filtro che deriva le parole usando uno stemmer generato da Snowball. Questo filtro di token viene implementato usando Apache Lucene.

Nome Tipo Descrizione
@odata.type string:

#Microsoft.Azure.Search.SnowballTokenFilter

Frammento URI che specifica il tipo di filtro del token.

language

SnowballTokenFilterLanguage

Lingua da utilizzare.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

SnowballTokenFilterLanguage

Lingua da usare per un filtro di token Snowball.

Nome Tipo Descrizione
armenian

string

Seleziona il tokenizer di stemming Lucene Snowball per Armeno.

basque

string

Seleziona il tokenizzatore di stemma Lucene Snowball per basco.

catalan

string

Seleziona il tokenizzatore di stemma Lucene Snowball per catalano.

danish

string

Seleziona il tokenizzatore di stemma Lucene Snowball per danese.

dutch

string

Seleziona il tokenizzatore di stemma Lucene Snowball per olandese.

english

string

Seleziona il tokenizzatore di stemma Lucene Snowball per l'inglese.

finnish

string

Seleziona il tokenizzatore di stemma Lucene Snowball per finlandese.

french

string

Seleziona il tokenizzatore di stemma Lucene Snowball per francese.

german

string

Seleziona il tokenizzatore di stemma Lucene Snowball per tedesco.

german2

string

Seleziona il tokenizzatore di stemming Lucene Snowball che usa l'algoritmo variant tedesco.

hungarian

string

Seleziona il tokenizzatore di stemma Lucene Snowball per l'ungherese.

italian

string

Seleziona il token di stemma Lucene Snowball per l'italiano.

kp

string

Seleziona il tokenizzatore di stemming Lucene Snowball per olandese che usa l'algoritmo di stemming Kraaij-Pohlmann.

lovins

string

Seleziona il token di stemming Lucene Snowball per l'inglese che usa l'algoritmo di stemming Lovins.

norwegian

string

Seleziona il tokenizzatore di stemma Lucene Snowball per Norvegese.

porter

string

Seleziona il token di stemming Lucene Snowball per l'inglese che usa l'algoritmo di stemming Porter.

portuguese

string

Seleziona il tokenizzatore di stemma Lucene Snowball per il portoghese.

romanian

string

Seleziona il token di stemma Lucene Snowball per il romeno.

russian

string

Seleziona il token di stemma Lucene Snowball per russo.

spanish

string

Seleziona il tokenizzatore di stemma Lucene Snowball per spagnolo.

swedish

string

Seleziona il tokenizzatore di stemma Lucene Snowball per svedese.

turkish

string

Seleziona il tokenizzatore di stemma Lucene Snowball per turco.

StemmerOverrideTokenFilter

Consente di eseguire l'override di altri filtri di stemming con stemming basato su dizionario personalizzato. Tutti i termini con stemmy vengono contrassegnati come parole chiave in modo che non vengano stemmati lungo la catena. Da inserire prima dei filtri di stemming. Questo filtro di token viene implementato usando Apache Lucene.

Nome Tipo Descrizione
@odata.type string:

#Microsoft.Azure.Search.StemmerOverrideTokenFilter

Frammento URI che specifica il tipo di filtro del token.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

rules

string[]

Elenco di regole di stemming nel formato seguente: "word => stem", ad esempio: "ran => run".

StemmerTokenFilter

Filtro di stemming specifico della lingua. Questo filtro di token viene implementato usando Apache Lucene.

Nome Tipo Descrizione
@odata.type string:

#Microsoft.Azure.Search.StemmerTokenFilter

Frammento URI che specifica il tipo di filtro del token.

language

StemmerTokenFilterLanguage

Lingua da utilizzare.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

StemmerTokenFilterLanguage

Lingua da usare per un filtro token stemmer.

Nome Tipo Descrizione
arabic

string

Seleziona il tokenizzatore di stemming Lucene per l'arabo.

armenian

string

Seleziona il tokenizzatore di stemming Lucene per Armena.

basque

string

Seleziona il tokenizzatore di stemma Lucene per basco.

brazilian

string

Seleziona il tokenizzatore di stemming Lucene per portoghese (Brasile).

bulgarian

string

Seleziona il tokenizzatore di stemming Lucene per bulgaro.

catalan

string

Seleziona il tokenizzatore di stemma Lucene per Catalano.

czech

string

Seleziona il tokenizzatore di stemming Lucene per il ceco.

danish

string

Seleziona il tokenizzatore di stemming Lucene per danese.

dutch

string

Seleziona il tokenizzatore di stemming Lucene per olandese.

dutchKp

string

Seleziona il tokenizzatore di stemming Lucene per olandese che usa l'algoritmo di stemming Kraaij-Pohlmann.

english

string

Seleziona il tokenizzatore di stemming Lucene per l'inglese.

finnish

string

Seleziona il tokenizzatore di stemming Lucene per finlandese.

french

string

Seleziona il tokenizzatore di stemming Lucene per francese.

galician

string

Seleziona il tokenizzatore di stemma Lucene per la Galiziano.

german

string

Seleziona il tokenizzatore di stemming Lucene per tedesco.

german2

string

Seleziona il tokenizzatore di stemming Lucene che usa l'algoritmo variant tedesco.

greek

string

Seleziona il tokenizzatore di stemming Lucene per greco.

hindi

string

Seleziona il tokenizzatore di stemming Lucene per Hindi.

hungarian

string

Seleziona il tokenizzatore di stemming Lucene per l'ungherese.

indonesian

string

Seleziona il tokenizzatore di stemming Lucene per indonesiano.

irish

string

Seleziona il tokenizzatore di stemma Lucene per l'irlandese.

italian

string

Seleziona il tokenizzatore di stemming Lucene per l'italiano.

latvian

string

Seleziona il tokenizzatore di stemming Lucene per lettone.

lightEnglish

string

Seleziona il tokenizzatore di stemming Lucene per l'inglese che esegue lo stemming chiaro.

lightFinnish

string

Seleziona il tokenizzatore di stemming Lucene per finlandese che esegue lo stemming chiaro.

lightFrench

string

Seleziona il tokenizzatore di stemming Lucene per francese che esegue lo stemming chiaro.

lightGerman

string

Seleziona il tokenizzatore di stemma Lucene per tedesco che esegue lo stemming chiaro.

lightHungarian

string

Seleziona il tokenizzatore di stemming Lucene per l'ungherese che esegue lo stemming chiaro.

lightItalian

string

Seleziona il tokenizzatore di stemma Lucene per italiano che esegue lo stemming chiaro.

lightNorwegian

string

Seleziona il tokenizzatore di stemming Lucene per Norvegese (Bokmål) che esegue lo stemming chiaro.

lightNynorsk

string

Seleziona il tokenizzatore di stemma Lucene per Norvegese (Nynorsk) che esegue lo stemming chiaro.

lightPortuguese

string

Seleziona il tokenizzatore di stemming Lucene per portoghese che esegue lo stemming chiaro.

lightRussian

string

Seleziona il tokenizzatore di stemming Lucene per russo che esegue lo stemming chiaro.

lightSpanish

string

Seleziona il tokenizzatore di stemma Lucene per spagnolo che esegue lo stemming chiaro.

lightSwedish

string

Seleziona il tokenizzatore di stemma Lucene per svedese che esegue lo stemming chiaro.

lovins

string

Seleziona il tokenizzatore di stemming Lucene per l'inglese che usa l'algoritmo di stemming Lovins.

minimalEnglish

string

Seleziona il tokenizzatore di stemming Lucene per l'inglese che esegue lo stemming minimo.

minimalFrench

string

Seleziona il tokenizzatore di stemming Lucene per francese che esegue lo stemming minimo.

minimalGalician

string

Seleziona il tokenizzatore di stemma Lucene per la Galiziano che esegue lo stemming minimo.

minimalGerman

string

Seleziona il tokenizzatore di stemming Lucene per tedesco che esegue lo stemming minimo.

minimalNorwegian

string

Seleziona il tokenizzatore di stemming Lucene per Norvegese (Bokmål) che esegue lo stemming minimo.

minimalNynorsk

string

Seleziona il tokenizzatore di stemming Lucene per Norvegese (Nynorsk) che esegue lo stemming minimo.

minimalPortuguese

string

Seleziona il tokenizzatore di stemming Lucene per portoghese che esegue lo stemming minimo.

norwegian

string

Seleziona il tokenizzatore di stemming Lucene per Norvegese (Bokmål).

porter2

string

Seleziona il tokenizzatore di stemming Lucene per l'inglese che usa l'algoritmo di stemming Porter2.

portuguese

string

Seleziona il tokenizzatore di stemming Lucene per portoghese.

portugueseRslp

string

Seleziona il tokenizzatore di stemming Lucene per portoghese che usa l'algoritmo di stemming RSLP.

possessiveEnglish

string

Seleziona il tokenizzatore di stemming Lucene per l'inglese che rimuove le proprietà finali dalle parole.

romanian

string

Seleziona il tokenizzatore di stemming Lucene per il romeno.

russian

string

Seleziona il tokenizzatore di stemming Lucene per russo.

sorani

string

Seleziona il tokenizzatore di stemming Lucene per Sorani.

spanish

string

Seleziona il tokenizzatore di stemming Lucene per spagnolo.

swedish

string

Seleziona il tokenizzatore di stemming Lucene per svedese.

turkish

string

Seleziona il tokenizzatore di stemming Lucene per turco.

StopAnalyzer

Divide il testo in corrispondenza di non lettere; Applica i filtri token minuscoli e non significative. Questo analizzatore viene implementato usando Apache Lucene.

Nome Tipo Descrizione
@odata.type string:

#Microsoft.Azure.Search.StopAnalyzer

Frammento URI che specifica il tipo di analizzatore.

name

string

Nome dell'analizzatore. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

stopwords

string[]

Elenco di parole non significative.

StopwordsList

Identifica un elenco predefinito di parole non significative specifiche della lingua.

Nome Tipo Descrizione
arabic

string

Seleziona l'elenco di parole di arresto per l'arabo.

armenian

string

Seleziona l'elenco di parole di arresto per Armena.

basque

string

Seleziona l'elenco di parole di arresto per basco.

brazilian

string

Seleziona l'elenco di parole di arresto per portoghese (Brasile).

bulgarian

string

Seleziona l'elenco di parole di arresto per bulgaro.

catalan

string

Seleziona l'elenco di parole di arresto per Catalano.

czech

string

Seleziona l'elenco di parole di arresto per il ceco.

danish

string

Seleziona l'elenco di parole di arresto per danese.

dutch

string

Seleziona l'elenco di parole di arresto per olandese.

english

string

Seleziona l'elenco di parole di arresto per l'inglese.

finnish

string

Seleziona l'elenco di parole di arresto per finlandese.

french

string

Seleziona l'elenco di parole di arresto per francese.

galician

string

Seleziona l'elenco di parole di arresto per La Galiziano.

german

string

Seleziona l'elenco di parole di arresto per tedesco.

greek

string

Seleziona l'elenco di parole di arresto per greco.

hindi

string

Seleziona l'elenco di parole di arresto per Hindi.

hungarian

string

Seleziona l'elenco di parole di arresto per ungherese.

indonesian

string

Seleziona l'elenco di parole di arresto per Indonesiano.

irish

string

Seleziona l'elenco di parole di arresto per l'irlandese.

italian

string

Seleziona l'elenco di parole di arresto per l'italiano.

latvian

string

Seleziona l'elenco di parole di arresto per lettone.

norwegian

string

Seleziona l'elenco di parole di arresto per Norvegese.

persian

string

Seleziona l'elenco di parole di arresto per persiano.

portuguese

string

Seleziona l'elenco di parole di arresto per portoghese.

romanian

string

Seleziona l'elenco di parole di arresto per il romeno.

russian

string

Seleziona l'elenco di parole di arresto per russo.

sorani

string

Seleziona l'elenco stopword per Sorani.

spanish

string

Seleziona l'elenco di parole di arresto per spagnolo.

swedish

string

Seleziona l'elenco di parole di arresto per svedese.

thai

string

Seleziona l'elenco stopword per Thai.

turkish

string

Seleziona l'elenco di parole di arresto per turco.

StopwordsTokenFilter

Rimuove le parole non significative da un flusso di token. Questo filtro di token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.StopwordsTokenFilter

Frammento URI che specifica il tipo di filtro del token.

ignoreCase

boolean

False

Valore che indica se ignorare la distinzione tra maiuscole e minuscole. Se true, tutte le parole vengono convertite in lettere minuscole per prime. L'impostazione predefinita è false.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

removeTrailing

boolean

True

Valore che indica se ignorare l'ultimo termine di ricerca se si tratta di una parola di arresto. Il valore predefinito è true.

stopwords

string[]

Elenco di parole non significative. Questa proprietà e la proprietà elenco parole non significative non possono essere entrambe impostate.

stopwordsList

StopwordsList

english

Elenco predefinito di parole non significative da usare. Questa proprietà e la proprietà stopwords non possono essere entrambe impostate. Il valore predefinito è l'inglese.

Suggester

Definisce il modo in cui l'API Suggerisci deve essere applicata a un gruppo di campi nell'indice.

Nome Tipo Descrizione
name

string

Nome dello strumento suggerimenti.

searchMode

SuggesterSearchMode

Valore che indica le funzionalità del suggeritore.

sourceFields

string[]

Elenco di nomi di campi a cui si applica il suggeritore. Ogni campo deve essere ricercabile.

SuggesterSearchMode

Valore che indica le funzionalità del suggerimento.

Nome Tipo Descrizione
analyzingInfixMatching

string

Trova la corrispondenza di termini e prefissi interi consecutivi in un campo. Ad esempio, per il campo "The fastest brown fox", le query "fast" e "fastest brow" corrispondono entrambe.

SynonymTokenFilter

Trova la corrispondenza di sinonimi con una o più parole in un flusso di token. Questo filtro di token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.SynonymTokenFilter

Frammento URI che specifica il tipo di filtro del token.

expand

boolean

True

Un valore che indica se tutte le parole nell'elenco dei sinonimi (se => notazione non viene utilizzata) verranno mappate l'una all'altra. Se true, tutte le parole nell'elenco dei sinonimi (se => notazione non viene usata) verranno mappate tra loro. L'elenco seguente: incredibile, incredibile, favoloso, incredibile, incredibile, incredibile, favoloso, incredibile => incredibile, incredibile, favoloso, incredibile. Se false, l'elenco seguente: incredibile, incredibile, favoloso, incredibile, sorprendente sarà equivalente a: incredibile, incredibile, favoloso, incredibile => incredibile. Il valore predefinito è true.

ignoreCase

boolean

False

Valore che indica se inserire l'input di maiuscole e minuscole per la corrispondenza. L'impostazione predefinita è false.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

synonyms

string[]

Elenco di sinonimi in uno dei due formati seguenti: 1. incredibile, incredibile, favoloso => incredibile - tutti i termini sul lato sinistro di => simbolo verrà sostituito con tutti i termini sul lato destro; 2. incredibile, incredibile, favoloso, sorprendente - elenco delimitato da virgole di parole equivalenti. Impostare l'opzione expand per modificare la modalità di interpretazione di questo elenco.

TagScoringFunction

Definisce una funzione che aumenta i punteggi di documenti con valori stringa corrispondenti a un determinato elenco di tag.

Nome Tipo Descrizione
boost

number

Moltiplicatore per il punteggio non elaborato. Deve essere un numero positivo diverso da 1,0.

fieldName

string

Nome del campo utilizzato come input per la funzione di assegnazione dei punteggi.

interpolation

ScoringFunctionInterpolation

Valore che indica come verrà interpolato il boosting tra i punteggi del documento; il valore predefinito è "Lineare".

tag

TagScoringParameters

Valori dei parametri per la funzione di assegnazione dei punteggi tag.

type string:

tag

Indica il tipo di funzione da usare. I valori validi includono magnitude, freshness, distance e tag. Il tipo di funzione deve essere minuscolo.

TagScoringParameters

Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi tag.

Nome Tipo Descrizione
tagsParameter

string

Nome del parametro passato nelle query di ricerca per specificare l'elenco di tag da confrontare con il campo di destinazione.

TextWeights

Definisce i pesi nei campi di indice per i quali le corrispondenze devono aumentare il punteggio nelle query di ricerca.

Nome Tipo Descrizione
weights

object

Dizionario di pesi per campo per aumentare il punteggio del documento. Le chiavi sono nomi di campo e i valori sono i pesi per ogni campo.

TokenCharacterKind

Rappresenta le classi di caratteri in cui può funzionare un filtro token.

Nome Tipo Descrizione
digit

string

Mantiene le cifre nei token.

letter

string

Mantiene le lettere nei token.

punctuation

string

Mantiene la punteggiatura nei token.

symbol

string

Mantiene i simboli nei token.

whitespace

string

Mantiene gli spazi vuoti nei token.

TokenFilterName

Definisce i nomi di tutti i filtri di token supportati dal motore di ricerca.

Nome Tipo Descrizione
apostrophe

string

Rimuove tutti i caratteri dopo un apostrofo (incluso l'apostrofo stesso). Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html

arabic_normalization

string

Filtro di token che applica il normalizzatore per la lingua araba per normalizzare l'ortografia. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html

asciifolding

string

Converte caratteri Unicode alfabetici, numerici e simbolici che non sono nei primi 127 caratteri ASCII (il blocco Unicode "Alfabeto latino di base") nei rispettivi equivalenti ASCII, se tali equivalenti esistono. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

cjk_bigram

string

Forma i bigram dei termini CJK generati dal tokenizer standard. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html

cjk_width

string

Normalizza le differenze di larghezza per le lingue CJK. Piega le varianti fullwidth ASCII nell'equivalente alfabeto latino di base e le varianti Katakana a metà larghezza nell'equivalente Kana. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html

classic

string

Rimuove i possessivi inglesi e i punti dagli acronimi. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html

common_grams

string

Costruisce digrammi per i termini frequenti durante l'indicizzazione. Anche i termini singoli continuano a essere indicizzati, con i digrammi sovrapposti. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html

edgeNGram_v2

string

Genera n-grammi delle dimensioni specificate a partire dalla parte anteriore o posteriore di un token di input. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html

elision

string

Rimuove le elisioni. Ad esempio, "l'avion" (piano) verrà convertito in "avion" (piano). Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

german_normalization

string

Normalizza i caratteri tedeschi in base all'euristica dell'algoritmo snowball German2. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html

hindi_normalization

string

Normalizza il testo in hindi per rimuovere alcune differenze nelle varianti di ortografia. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html

indic_normalization

string

Normalizza la rappresentazione Unicode del testo nelle lingue indiane. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html

keyword_repeat

string

Genera ogni token in ingresso due volte, una volta come parola chiave e una volta come parola chiave non. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html

kstem

string

Filtro kstem con prestazioni elevate per l'inglese. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html

length

string

Rimuove le parole troppo lunghe o troppo corte. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html

limit

string

Limita il numero di token durante l'indicizzazione. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html

lowercase

string

Normalizza il testo del token applicando il minuscolo. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.htm

nGram_v2

string

Genera n-grammi delle dimensioni specificate. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html

persian_normalization

string

Applica la normalizzazione per il persiano. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html

phonetic

string

Crea i token per le corrispondenze fonetiche. Vedere https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html

porter_stem

string

Usa l'algoritmo di stemming Porter per trasformare il flusso di token. Vedere http://tartarus.org/~martin/PorterStemmer

reverse

string

Inverte la stringa del token. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

scandinavian_folding

string

Piega i caratteri scandinavi åÅäæÄÆ-a> e öÖøØ-o>. Discrimina anche l'uso delle vocali doppie aa, ae, ao, oe e oo, lasciando solo la prima. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html

scandinavian_normalization

string

Normalizza l'uso dei caratteri scandinavi intercambiabili. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html

shingle

string

Crea combinazioni di token come token singolo. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html

snowball

string

Filtro che deriva le parole usando uno stemmer generato da Snowball. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html

sorani_normalization

string

Normalizza la rappresentazione Unicode del testo in sorani. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html

stemmer

string

Filtro di stemming specifico della lingua. Vedere https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters

stopwords

string

Rimuove le parole non significative da un flusso di token. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html

trim

string

Elimina lo spazio vuoto iniziale e finale dai token. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html

truncate

string

Tronca i termini a una lunghezza specifica. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html

unique

string

Filtra i token con lo stesso testo del token precedente. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html

uppercase

string

Normalizza il testo del token applicando il maiuscolo. Vedere http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

word_delimiter

string

Suddivide le parole in sottoparole ed esegue trasformazioni facoltative sui gruppi di sottoparole.

TruncateTokenFilter

Tronca i termini a una lunghezza specifica. Questo filtro di token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.TruncateTokenFilter

Frammento URI che specifica il tipo di filtro del token.

length

integer

300

Lunghezza in corrispondenza della quale verranno troncati i termini. Il valore predefinito e massimo è 300.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

UaxUrlEmailTokenizer

Suddivide in token gli URL e gli indirizzi di posta elettronica come un unico token. Questo tokenizzatore viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.UaxUrlEmailTokenizer

Un frammento URI che specifica il tipo di tokenizer.

maxTokenLength

integer

255

Lunghezza massima del token. Il valore predefinito è 255. I token con lunghezza superiore a quella massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri.

name

string

Nome del tokenizer. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

UniqueTokenFilter

Filtra i token con lo stesso testo del token precedente. Questo filtro di token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.UniqueTokenFilter

Frammento URI che specifica il tipo di filtro del token.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

onlyOnSamePosition

boolean

False

Valore che indica se rimuovere duplicati solo nella stessa posizione. L'impostazione predefinita è false.

VectorSearch

Contiene opzioni di configurazione correlate alla ricerca vettoriale.

Nome Tipo Descrizione
algorithms VectorSearchAlgorithmConfiguration[]:

Contiene opzioni di configurazione specifiche dell'algoritmo usato durante l'indicizzazione o l'esecuzione di query.

profiles

VectorSearchProfile[]

Definisce le combinazioni di configurazioni da usare con la ricerca vettoriale.

VectorSearchAlgorithmKind

Algoritmo usato per l'indicizzazione e la query.

Nome Tipo Descrizione
exhaustiveKnn

string

Algoritmo KNN esaustivo che eseguirà una ricerca bruta con forza bruta.

hnsw

string

HNSW (Gerarchico Navigable Small World), un tipo di algoritmo di prossimità approssimativo.

VectorSearchAlgorithmMetric

Metrica di somiglianza da usare per i confronti vettoriali.

Nome Tipo Descrizione
cosine

string

dotProduct

string

euclidean

string

VectorSearchProfile

Definisce una combinazione di configurazioni da usare con la ricerca vettoriale.

Nome Tipo Descrizione
algorithm

string

Nome della configurazione dell'algoritmo di ricerca vettoriale che specifica l'algoritmo e i parametri facoltativi.

name

string

Nome da associare a questo particolare profilo di ricerca vettoriale.

WordDelimiterTokenFilter

Suddivide le parole in sottoparole ed esegue trasformazioni facoltative sui gruppi di sottoparole. Questo filtro di token viene implementato usando Apache Lucene.

Nome Tipo Valore predefinito Descrizione
@odata.type string:

#Microsoft.Azure.Search.WordDelimiterTokenFilter

Frammento URI che specifica il tipo di filtro del token.

catenateAll

boolean

False

Valore che indica se tutte le parti della parola secondaria verranno catenate. Ad esempio, se è impostato su true, "Azure-Search-1" diventa "AzureSearch1". L'impostazione predefinita è false.

catenateNumbers

boolean

False

Valore che indica se verranno catenate le esecuzioni massime di parti del numero. Ad esempio, se è impostato su true, "1-2" diventa "12". L'impostazione predefinita è false.

catenateWords

boolean

False

Valore che indica se verranno catenate le esecuzioni massime delle parti delle parole. Ad esempio, se è impostato su true, "Ricerca di Azure" diventa "AzureSearch". L'impostazione predefinita è false.

generateNumberParts

boolean

True

Valore che indica se generare le parole secondarie del numero. Il valore predefinito è true.

generateWordParts

boolean

True

Valore che indica se generare parole di parte. Se impostata, fa sì che vengano generate parti di parole; ad esempio "AzureSearch" diventa "Azure" "Search". Il valore predefinito è true.

name

string

Nome del filtro del token. Può contenere solo lettere, numeri, spazi, trattini o caratteri di sottolineatura, deve iniziare e terminare con caratteri alfanumerici e non può contenere più di 128 caratteri.

preserveOriginal

boolean

False

Valore che indica se le parole originali verranno mantenute e aggiunte all'elenco di sottoword. L'impostazione predefinita è false.

protectedWords

string[]

Elenco di token da proteggere dall'essere delimitati.

splitOnCaseChange

boolean

True

Valore che indica se dividere le parole in caseChange. Ad esempio, se è impostato su true, "AzureSearch" diventa "Azure" "Search". Il valore predefinito è true.

splitOnNumerics

boolean

True

Valore che indica se suddividere i numeri. Ad esempio, se è impostato su true, "Azure1Search" diventa "Azure" "1" "Search". Il valore predefinito è true.

stemEnglishPossessive

boolean

True

Valore che indica se rimuovere "'s" finale per ogni sottoword. Il valore predefinito è true.