Opzioni di Richiesta profilo Criteri di ricerca colonna (Attività Profiling dati)

Si applica a:SQL Server SSIS Integration Runtime in Azure Data Factory

Usare il riquadro Proprietà richiesta della pagina Richieste profilo per impostare le opzioni per la Richiesta profilo Criteri di ricerca colonna selezionata nel riquadro delle richieste. Un profilo Criteri di ricerca colonna segnala un set di espressioni regolari che analizzano la percentuale specificata di valori in una colonna stringa. Questo profilo consente di identificare eventuali problemi nei dati, ad esempio le stringhe non valide, e può indicare le possibili espressioni regolari da utilizzare in futuro per convalidare nuovi valori. Un profilo di criteri di ricerca di una colonna contenente i codici postali ZIP (Stati Uniti), ad esempio, può produrre le espressioni regolari \d{5}-\d{4}, \d{5} e \d{9}. Se vengono visualizzate altre espressioni regolari, è probabile che i dati contengano valori non validi o in formato non corretto.

Nota

Le opzioni descritte in questo argomento vengono visualizzate nella pagina Richieste profilo in Editor attività Profiling dati. Per altre informazioni su questa pagina dell'editor, vedere Editor attività Profiling dati (pagina Richieste profilo).

Per altre informazioni su come usare l'attività Profiling dati, vedere Impostazione dell'attività Profiling dati. Per altre informazioni sull'uso del Visualizzatore profilo dati per analizzare l'output dell'attività Profiling dati, vedere Visualizzatore profilo dati.

Informazioni sull'utilizzo di delimitatori e simboli

Prima di calcolare i criteri di ricerca per una Richiesta profilo Criteri di ricerca colonna, l'attività Profiling dati suddivide in token i dati, ovvero separa i valori stringa in unità minori note come token. L'attività separa le stringhe in token in base ai delimitatori e i simboli specificati per le proprietà Delimiters e Symbols :

  • Delimiters Per impostazione predefinita, l'elenco dei delimitatori contiene i caratteri seguenti: spazio, tabulazione orizzontale (\t), nuova riga (\n) e ritorno a capo (\r). È possibile specificare delimitatori aggiuntivi, ma non è possibile rimuovere i delimitatori predefiniti.

  • Symbols Per impostazione predefinita, l'elenco Symbols contiene i caratteri seguenti: ,.;:-"'~=&/@!?()<>[]{}|#*^%, oltre al segno di graduazione. Se, ad esempio, i simboli sono "()-", il valore "(425) 123-4567" viene suddiviso in token come ["(", "425", ")", "123", "-", "4567", ")"].

Un carattere non può essere simultaneamente un delimitatore e un simbolo.

Tutti i delimitatori vengono normalizzati in un singolo spazio come parte del processo di suddivisione in token, mentre i simboli vengono mantenuti.

Informazioni sull'utilizzo della tabella dei tag

È facoltativamente possibile raggruppare token correlati con un singolo tag archiviando i tag e i termini correlati in una tabella speciale creata in un database di SQL Server. La tabella dei tag deve contenere due colonne stringa, denominate "Tag" e "Termine". Queste colonne possono essere di tipo char, nchar, varcharo nvarchar, ma non text o ntext. È possibile combinare più tag e i termini corrispondenti in una singola tabella. Una richiesta di profilo Criteri di ricerca colonna può utilizzare solo una tabella dei tag. È possibile usare una gestione connessione ADO.NET distinta per la connessione alla tabella dei tag. Di conseguenza, la tabella dei tag può essere archiviata in un database diverso o un server diverso dalla tabella di origine.

È possibile, ad esempio, raggruppare i valori "East", "West", "North" e "South" eventualmente visualizzati negli indirizzi stradali statunitensi utilizzando il singolo tag "Direction". La tabella seguente rappresenta un esempio di tale tabella dei tag.

Tag Termine
Direzione East
Direzione West
Direzione North
Direzione South

È possibile utilizzare un altro tag per raggruppare le parole diverse che esprimono la nozione di strada negli indirizzi stradali:

Tag Termine
Via Via
Via Avenue
Via Place
Via Way

In base a questa combinazione di tag, il criterio di ricerca risultante per un indirizzo stradale potrebbe essere simile al seguente:

\d+\ LookupTag=Direction \d+\p{L}+\ LookupTag=Street

Nota

L'utilizzo di una tabella dei tag influisce negativamente sulle prestazioni dell'attività Profiling dati. Non utilizzare più di 10 tag o più di 100 termini per tag.

Lo stesso termine può appartenere a più tag.

Opzioni del riquadro Proprietà richiesta

Nel riquadro Proprietà richiestaper Richiesta profilo Criteri di ricerca colonna vengono visualizzati i gruppi di opzioni seguenti:

  • Datiche include le opzioni TableOrView e Column

  • Generali

  • Opzioni

Opzioni dati

ConnectionManager
Consente di selezionare la gestione connessione di ADO.NET esistente che usa il provider di dati .NET per SQL Server (SqlClient) ai fini della connessione al database di SQL Server contenente la tabella o la vista da profilare.

TableOrView
Consente di selezionare la tabella o la vista esistente che contiene la colonna da analizzare.

Per ulteriori informazioni, vedere la sezione "Opzioni TableorView" in questo argomento.

Istogramma
Consente di selezionare la colonna esistente da analizzare. Selezionare (*) per profilare tutte le colonne.

Per ulteriori informazioni, vedere la sezione "Opzioni Column" in questo argomento.

Opzioni TableOrView

Schema
Specifica lo schema a cui appartiene la tabella selezionata. Questa opzione è di sola lettura.

Tabella
Visualizza il nome della tabella selezionata. Questa opzione è di sola lettura.

Opzioni relative alle colonne

IsWildCard
Specifica se è stato selezionato il carattere jolly (*). Questa opzione è impostata su True se è stato selezionato (*) per profilare tutte le colonne. È impostata su False se è stata selezionata una singola colonna da analizzare. Questa opzione è di sola lettura.

ColumnName
Visualizza il nome della colonna selezionata. Questa opzione è vuota se è stato selezionato (*) per profilare tutte le colonne. Questa opzione è di sola lettura.

StringCompareOptions
Questa opzione non si applica al profilo Criteri di ricerca colonna.

Opzioni generali

RequestID
Nome descrittivo per identificare la richiesta di profilo. Non è in genere necessario modificare il valore generato automaticamente.

Opzioni

MaxNumberOfPatterns
Specifica il numero massimo di criteri di ricerca che si desidera vengano calcolati dal profilo. Il valore predefinito di questa opzione è 10. Il valore massimo è 100.

PercentageDataCoverageDesired
Specifica la percentuale di dati che si desidera vengano analizzati dai criteri di ricerca calcolati. Il valore predefinito di questa opzione è 95 (percentuale).

CaseSensitive
Indica se i criteri di ricerca devono applicare la distinzione tra maiuscole e minuscole. Il valore predefinito di questa opzione è False.

Delimiters
Elenco dei caratteri che devono essere considerati spazi tra parole quando il testo viene suddiviso in token. Per impostazione predefinita, l'elenco Delimiters contiene i caratteri seguenti: spazio, tabulazione orizzontale (\t), nuova riga (\n) e ritorno a capo (\r). È possibile specificare delimitatori aggiuntivi, ma non è possibile rimuovere i delimitatori predefiniti.

Per ulteriori informazioni, tornare alla sezione "Informazioni sull'utilizzo di delimitatori e simboli" di questo argomento.

Simboli
Elenco dei simboli che devono essere mantenuti come parte dei criteri di ricerca. I simboli, ad esempio, possono includere "/" per le date, "." per le ore e "@" per gli indirizzi di posta elettronica. Per impostazione predefinita, l'elenco Symbols contiene i caratteri seguenti: ,.;:-"'~=&/@!?()<>[]{}|#*^%.

Per ulteriori informazioni, tornare alla sezione "Informazioni sull'utilizzo di delimitatori e simboli" di questo argomento.

TagTableConnectionManager
Consente di selezionare la gestione connessione di ADO.NET esistente che usa il provider di dati .NET per SQL Server (SqlClient) ai fini della connessione al database di SQL Server contenente la tabella dei tag.

Per ulteriori informazioni, tornare alla sezione "Utilizzo della tabella dei tag" di questo argomento.

TagTableName
Consente di selezionare la tabella dei tag esistenti, che deve contenere due colonne stringa denominate Tag e Termine.

Per ulteriori informazioni, tornare alla sezione "Utilizzo della tabella dei tag" di questo argomento.

Vedi anche

Editor attività Profiling dati (pagina Generale)
Form profilo rapido singola tabella (Attività Profiling dati)