Ricerca termini - trasformazioneTerm Lookup Transformation

La trasformazione Ricerca termini rileva le corrispondenze tra i termini estratti dal testo in una colonna di input della trasformazione e quelli contenuti in una tabella di riferimento,The Term Lookup transformation matches terms extracted from text in a transformation input column with terms in a reference table. quindi conta il numero delle occorrenze di un termine della tabella di ricerca nel set di dati di input e scrive tale numero nelle colonne di output della trasformazione, insieme al termine della tabella di riferimento.It then counts the number of times a term in the lookup table occurs in the input data set, and writes the count together with the term from the reference table to columns in the transformation output. Questa trasformazione può essere utilizzata per creare un elenco di termini personalizzato basato sul testo di input, completo di statistiche sulla frequenza dei termini.This transformation is useful for creating a custom word list based on the input text, complete with word frequency statistics.

Prima di eseguire una ricerca la trasformazione Ricerca termini estrae le parole dal testo di una colonna di input utilizzando lo stesso procedimento utilizzato dalla trasformazione Estrazione termini:Before the Term Lookup transformation performs a lookup, it extracts words from the text in an input column using the same method as the Term Extraction transformation:

  • Il testo viene suddiviso in frasi.Text is broken into sentences.

  • Le frasi vengono suddivise in parole.Sentences are broken into words.

  • Le parole vengono normalizzate.Words are normalized.

    Per personalizzare ulteriormente la determinazione delle corrispondenze, è possibile configurare la trasformazione Ricerca termini in modo da fare distinzione tra maiuscole e minuscole.To further customize which terms to match, the Term Lookup transformation can be configured to perform a case-sensitive match.

Corrisponde aMatches

La trasformazione Ricerca termini esegue una ricerca e restituisce un valore utilizzando le regole seguenti:The Term Lookup performs a lookup and returns a value using the following rules:

  • Se la trasformazione è configurata in modo da fare distinzione tra maiuscole e minuscole, i termini che presentano combinazioni di maiuscole e minuscole non corrispondenti vengono ignorati.If the transformation is configured to perform case-sensitive matches, matches that fail a case-sensitive comparison are discarded. I termini studente e STUDENTE , ad esempio, vengono considerati come due parole diverse.For example, student and STUDENT are treated as separate words.

    Nota

    Una parola priva di maiuscole può corrispondere a una parola con iniziale maiuscola all'inizio di una frase.A non-capitalized word can be matched with a word that is capitalized at the beginning of a sentence. Le parole studente e Studente , ad esempio, vengono considerate corrispondenti quando Studente è la prima parola di una frase.For example, the match between student and Student succeeds when Student is the first word in a sentence.

  • Se nella tabella di riferimento è presente la forma plurale del sostantivo o sintagma nominale, la ricerca individuerà solo la forma plurale del sostantivo o sintagma nominale.If a plural form of the noun or noun phrase exists in the reference table, the lookup matches only the plural form of the noun or noun phrase. Tutte le istanze della parola studenti , ad esempio, vengono conteggiate separatamente da quelle della parola studente.For example, all instances of students would be counted separately from the instances of student.

  • Se nella tabella di riferimento è presente solo la forma singolare della parola, sia la forma singolare che quella plurale della parola o frase verranno considerate corrispondenti alla forma singolare.If only the singular form of the word is found in the reference table, both the singular and the plural forms of the word or phrase are matched to the singular form. Se ad esempio la tabella di ricerca contiene la parola studentee la trasformazione trova studente e studenti, entrambe le parole verranno conteggiate come corrispondenze del termine di ricerca studente.For example, if the lookup table contains student, and the transformation finds the words student and students, both words would be counted as a match for the lookup term student.

  • Se il testo nella colonna di input è un sintagma nominale lemmatizzato, la normalizzazione interesserà solo l'ultima parola del sintagma nominale.If the text in the input column is a lemmatized noun phrase, only the last word in the noun phrase is affected by normalization. La versione lemmatizzata di doctors appointments è ad esempio doctors appointment.For example, the lemmatized version of doctors appointments is doctors appointment.

    Quando un elemento di ricerca contiene termini che si sovrappongono nel set di riferimento, ovvero viene trovato un termine secondario in più di un record di riferimento, la trasformazione Ricerca termini restituisce solo un risultato della ricerca.When a lookup item contains terms that overlap in the reference set—that is, a sub-term is found in more than one reference record—the Term Lookup transformation returns only one lookup result. Nell'esempio seguente viene illustrato il risultato ottenuto quando un elemento di ricerca contiene un termine secondario sovrapposto.The following example shows the result when a lookup item contains an overlapping sub-term. Il termine secondario sovrapposto in questo caso è Windows, presente in due termini di riferimento.The overlapping sub-term in this case is Windows, which is found within two reference terms. La trasformazione non restituisce tuttavia due risultati ma solo un termine di riferimento, ovvero Windows.However, the transformation does not return two results, but returns only a single reference term, Windows. Il secondo termine di riferimento, Windows 7 Professional, non viene restituito.The second reference term, Windows 7 Professional, is not returned.

ElementoItem ValoreValue
Termine di inputInput term Windows 7 ProfessionalWindows 7 Professional
Termini di riferimentoReference terms Windows 7 x64 ProfessionalWindows, Windows 7 Professional
OutputOutput WindowsWindows

La trasformazione Ricerca termini può trovare anche sostantivi e sintagmi nominali contenenti caratteri speciali che possono essere presenti anche nei dati della tabella di riferimento.The Term Lookup transformation can match nouns and noun phrases that contain special characters, and the data in the reference table may include these characters. I caratteri speciali sono i seguenti: %, @ &, $, #, *,:,,., , ,!,?, <, >, +, =, ^, ~, |, \, /, (,), [,], {,}, ", e '.The special characters are as follows: %, @, &, $, #, *, :, ;, ., , , !, ?, <, >, +, =, ^, ~, |, \, /, (, ), [, ], {, }, “, and ‘.

Tipi di datiData Types

La trasformazione Ricerca termini può utilizzare solo colonne con tipo di dati DT_WSTR o DT_NTEXT.The Term Lookup transformation can only use a column that has either the DT_WSTR or the DT_NTEXT data type. Se una colonna contiene testo ma non ha uno di questi tipi di dati, sarà possibile utilizzare la trasformazione Conversione dati per aggiungere al flusso di dati una colonna con tipo di dati DT_WSTR o DT_NTEXT e copiare nella nuova colonna i valori della colonna originale.If a column contains text, but does not have one of these data types, the Data Conversion transformation can add a column with the DT_WSTR or DT_NTEXT data type to the data flow and copy the column values to the new column. L'output della trasformazione Conversione dati può essere quindi utilizzato come input della trasformazione Ricerca termini.The output from the Data Conversion transformation can then be used as the input to the Term Lookup transformation. Per altre informazioni, vedere Trasformazione Conversione dati.For more information, see Data Conversion Transformation.

Configurazione della trasformazione Ricerca terminiConfiguration the Term Lookup Transformation

Le colonne di input della trasformazione Ricerca termini includono la proprietà InputColumnType che ne indica l'uso.The Term Lookup transformation input columns includes the InputColumnType property, which indicates the use of the column. InputColumnType può contenere i valori seguenti:InputColumnType can contain the following values:

  • Il valore 0 indica che la colonna viene semplicemente passata all'output e non viene utilizzata nella ricerca.The value 0 indicates the column is passed through to the output only and is not used in the lookup.

  • Il valore 1 indica che la colonna viene utilizzata solo nella ricerca.The value 1 indicates the column is used in the lookup only.

  • Il valore 2 indica che la colonna viene passata all'output e utilizzata anche nella ricerca.The value 2 indicates the column is passed through to the output, and is also used in the lookup.

    Le colonne di output della trasformazione la cui proprietà InputColumnType è impostata su 0 o 2 includono la proprietà CustomLineageID, che contiene l'identificatore di derivazione assegnato alla colonna da un componente a monte nel flusso di dati.Transformation output columns whose InputColumnType property is set to 0 or 2 include the CustomLineageID property for a column, which contains the lineage identifier assigned to the column by an upstream data flow component.

    La trasformazione Ricerca termini aggiunge all'output della trasformazione due colonne, che per impostazione predefinita sono denominate Term e Frequency.The Term Lookup transformation adds two columns to the transformation output, named by default Term and Frequency. Term contiene un termine della tabella di ricerca, mentre la colonna Frequency contiene il numero di occorrenze di tale termine rilevato nel set di dati di input.Term contains a term from the lookup table and Frequency contains the number of times the term in the reference table occurs in the input data set. Tali colonne non includono la proprietà CustomLineageID.These columns do not include the CustomLineageID property.

    La tabella di ricerca deve essere una tabella di un database di SQL ServerSQL Server o Access.The lookup table must be a table in a SQL ServerSQL Server or an Access database. Se l'output della trasformazione Estrazione termini viene salvato in una tabella, quest'ultima potrà essere utilizzata come tabella di riferimento, ma è possibile utilizzare anche altre tabelle.If the output of the Term Extraction transformation is saved to a table, this table can be used as the reference table, but other tables can also be used. Il testo presente in file flat, cartelle di lavoro di Excel o altre origini deve essere importato in un database di SQL ServerSQL Server o di Access, prima di usare la trasformazione Ricerca termini.Text in flat files, Excel workbooks or other sources must be imported to a SQL ServerSQL Server database or an Access database before you can use the Term Lookup transformation.

    La trasformazione Ricerca termini utilizza una connessione OLE DB separata per connettersi alla tabella di riferimento.The Term Lookup transformation uses a separate OLE DB connection to connect to the reference table. Per altre informazioni, vedere Gestione connessione OLE DB.For more information, see OLE DB Connection Manager.

    La trasformazione Ricerca termini funziona in una modalità con pre-memorizzazione nella cache completa.The Term Lookup transformation works in a fully precached mode. In fase di esecuzione la trasformazione Ricerca termini legge i termini dalla tabella di riferimento e li archivia nella propria memoria privata, prima di elaborare le righe di input della trasformazione.At run time, the Term Lookup transformation reads the terms from the reference table and stores them in its private memory before it processes any transformation input rows.

    Poiché i termini in una riga di una colonna di input possono ripetersi, l'output della trasformazione Ricerca termini include in genere un numero di righe superiore rispetto all'input.Because the terms in an input column row may repeat, the output of the Term Lookup transformation typically has more rows than the transformation input.

    La trasformazione include un input e un output.The transformation has one input and one output. Non supporta output degli errori.It does not support error outputs.

    È possibile impostare le proprietà tramite Progettazione SSISSSIS o a livello di codice.You can set properties through SSISSSIS Designer or programmatically.

    Per ulteriori informazioni sulle proprietà che è possibile impostare nella finestra di dialogo Editor avanzato o a livello di codice, fare clic su uno degli argomenti seguenti:For more information about the properties that you can set in the Advanced Editor dialog box or programmatically, click one of the following topics:

  • Proprietà comuniCommon Properties

  • Proprietà personalizzate delle trasformazioniTransformation Custom Properties

    Per altre informazioni su come impostare le proprietà, vedere Impostazione delle proprietà di un componente del flusso di dati.For more information about how to set properties, see Set the Properties of a Data Flow Component.

Editor trasformazione Ricerca termini (scheda Ricerca termini)Term Lookup Transformation Editor (Term Lookup Tab)

Utilizzare la scheda Ricerca termini della finestra di dialogo Editor trasformazione Ricerca termini per eseguire il mapping tra una colonna di input e una colonna di ricerca in una tabella di riferimento e per specificare un alias per ogni colonna di output.Use the Term Lookup tab of the Term Lookup Transformation Editor dialog box to map an input column to a lookup column in a reference table and to provide an alias for each output column.

OpzioniOptions

Colonne di input disponibiliAvailable Input Columns
Utilizzare le caselle di controllo per selezionare le colonne di input da passare all'output senza modifiche.Using the check boxes, select input columns to pass through to the output unchanged. Trascinare una colonna di input nell'elenco Colonne di riferimento disponibili per eseguirne il mapping a una colonna di ricerca nella tabella di riferimento.Drag an input column to the Available Reference Columns list to map it to a lookup column in the reference table. Le colonne di input e di output devono avere tipi di dati corrispondenti e supportati, ovvero DT_NTEXT o DT_WSTR.The input and lookup columns must have matching, supported data types, either DT_NTEXT or DT_WSTR. Selezionare una riga di mapping e fare clic con il pulsante destro del mouse per modificare i mapping nella finestra di dialogo Crea relazioni .Select a mapping line and right-click to edit the mappings in the Create Relationships dialog box.

Colonne di riferimento disponibiliAvailable Reference Columns
Consente di visualizzare le colonne disponibili nella tabella di riferimento.View the available columns in the reference table. Selezionare la colonna contenente l'elenco dei termini per i quali si desidera trovare una corrispondenza.Choose the column that contains the list of terms to match.

Colonna pass-throughPass-Through Column
Consente di selezionare una colonna di input nell'elenco delle colonne di input disponibili.Select from the list of available input columns. Le selezioni effettuate vengono riflesse nelle selezioni delle caselle di controllo nella tabella Colonne di input disponibili .Your selections are reflected in the check box selections in the Available Input Columns table.

Alias colonna di outputOutput Column Alias
Consente di digitare un alias per ogni colonna di output.Type an alias for each output column. Per impostazione predefinita, viene suggerito il nome della colonna. È comunque possibile scegliere qualsiasi nome descrittivo univoco.The default is the name of the column; however, you can choose any unique, descriptive name.

Configura output erroriConfigure Error Output
Usare la finestra di dialogo Configura output errori per specificare le opzioni di gestione degli errori per le righe che causano errori.Use the Configure Error Output dialog box to specify error handling options for rows that cause errors.

Editor trasformazione Ricerca termini (scheda Tabella di riferimento)Term Lookup Transformation Editor (Reference Table Tab)

Usare la scheda Tabella di riferimento della finestra di dialogo Editor trasformazione Ricerca termini per specificare la connessione alla tabella di riferimento o tabella di ricerca.Use the Reference Table tab of the Term Lookup Transformation Editor dialog box to specify the connection to the reference (lookup) table.

OpzioniOptions

gestione connessione OLE DBOLE DB connection manager
Selezionare una gestione connessione esistente nell'elenco o crearne una nuova facendo clic su Nuova.Select an existing connection manager from the list, or create a new connection by clicking New.

NuovaNew
Consente di creare una nuova connessione usando la finestra di dialogo Configura gestione connessione OLE DB .Create a new connection by using the Configure OLE DB Connection Manager dialog box.

Nome tabella di riferimentoReference table name
Consente di selezionare una tabella di ricerca o una vista nel database selezionando un elemento nell'elenco.Select a lookup table or view from the database by selecting an item from the list. La tabella o la vista deve contenere una colonna con un elenco di termini esistente da utilizzare per il confronto del testo presente nella colonna di origine.The table or view should contain a column with an existing list of terms that the text in the source column can be compared to.

Configura output erroriConfigure Error Output
Usare la finestra di dialogo Configura output errori per specificare le opzioni di gestione degli errori per le righe che causano errori.Use the Configure Error Output dialog box to specify error handling options for rows that cause errors.

Editor trasformazione Ricerca termini (scheda Avanzate)Term Lookup Transformation Editor (Advanced Tab)

Usare la scheda Avanzate della finestra di dialogo Editor trasformazione Ricerca termini per specificare se la ricerca deve distinguere tra lettere maiuscole e minuscole.Use the Advanced tab of the Term Lookup Transformation Editor dialog box to specify whether lookup should be case-sensitive.

OpzioniOptions

Ricerca con distinzione maiuscole/minuscoleUse case-sensitive term lookup
Consente di indicare se la ricerca deve distinguere tra lettere maiuscole e minuscole.Indicate whether the lookup is case-sensitive. Il valore predefinito è False.The default is False.

Configura output erroriConfigure Error Output
Usare la finestra di dialogo Configura output errori per specificare le opzioni di gestione degli errori per le righe che causano errori.Use the Configure Error Output dialog box to specify error handling options for rows that cause errors.

Vedere ancheSee Also

Errori di Integration Services e riferimento ai messaggi Integration Services Error and Message Reference
Trasformazione estrazione terminiTerm Extraction Transformation