Share via


MicrosoftLanguageTokenizer コンストラクター

定義

オーバーロード

MicrosoftLanguageTokenizer()

MicrosoftLanguageTokenizer クラスの新しいインスタンスを初期化します。

MicrosoftLanguageTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftTokenizerLanguage>)

MicrosoftLanguageTokenizer クラスの新しいインスタンスを初期化します。

MicrosoftLanguageTokenizer()

ソース:
MicrosoftLanguageTokenizer.cs

MicrosoftLanguageTokenizer クラスの新しいインスタンスを初期化します。

public MicrosoftLanguageTokenizer ();
Public Sub New ()

適用対象

MicrosoftLanguageTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftTokenizerLanguage>)

ソース:
MicrosoftLanguageTokenizer.cs

MicrosoftLanguageTokenizer クラスの新しいインスタンスを初期化します。

public MicrosoftLanguageTokenizer (string name, int? maxTokenLength = default, bool? isSearchTokenizer = default, Microsoft.Azure.Search.Models.MicrosoftTokenizerLanguage? language = default);
new Microsoft.Azure.Search.Models.MicrosoftLanguageTokenizer : string * Nullable<int> * Nullable<bool> * Nullable<Microsoft.Azure.Search.Models.MicrosoftTokenizerLanguage> -> Microsoft.Azure.Search.Models.MicrosoftLanguageTokenizer
Public Sub New (name As String, Optional maxTokenLength As Nullable(Of Integer) = Nothing, Optional isSearchTokenizer As Nullable(Of Boolean) = Nothing, Optional language As Nullable(Of MicrosoftTokenizerLanguage) = Nothing)

パラメーター

name
String

トークナイザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。

maxTokenLength
Nullable<Int32>

トークンの最大長。 最大長より長いトークンは分割されます。 使用できる最大トークン長は、300 文字です。 300 文字を超えるトークンは、最初に長さ 300 のトークンに分割され、それらの各トークンは、設定された最大トークン長に基づいて分割されます。 既定値は 255 です。

isSearchTokenizer
Nullable<Boolean>

トークナイザーの使用方法を示す 値。 検索トークナイザーとして使用する場合は true に設定し、インデックス作成トークナイザーとして使用する場合は false に設定します。 既定値は false です。

language
Nullable<MicrosoftTokenizerLanguage>

使用する言語。 既定値は英語です。 使用できる値は、'bangla'、'ブルガリア'、'カタロニア'、'chineseSimplified'、'chineseTraditional'、'czech'、'デンマーク'、'dutch'、'english'、'french'、'german'、'greek'、'gujarati'、'ヒンディー語'、'アイスランド語'、'インドネシア語'、'イタリア語'、'italian'、です。 'japanese'、'kanda'、'korean'、'malay'、'marayalam'、'marathi'、'norwegianBokmaal'、'polish'、'portuguese'、'portugueseBrazilian'、'punjabi'、'roman'、'russian'、'serbianCyrillic'、'serbianLatin'、'slovenian'、'spanish'、'swedish'、'tamil'、'telugu'、'thai'、'ウクライナ語'、'urdu'、'vietnamese'

適用対象