Opções da solicitação de perfil Padrão de Coluna (tarefa Criação de Perfil de Dados)Column Pattern Profile Request Options (Data Profiling Task)

Use o painel Propriedades da Solicitação da página Solicitações de Perfil para definir as opções da Solicitação de Perfil de Padrão de Coluna selecionada no painel de solicitações.Use the Request Properties pane of the Profile Requests page to set the options for the Column Pattern Profile Request selected in the requests pane. Um perfil de Padrão de Coluna informa um conjunto de expressões regulares que cobrem a porcentagem especificada de valores em uma coluna de cadeia de caracteres.A Column Pattern profile reports a set of regular expressions that cover the specified percentage of values in a string column. Esse perfil pode ajudá-lo a identificar problemas em seus dados, como cadeias de caracteres inválidas, além de sugerir expressões regulares que podem ser usadas posteriormente para validar novos valores.This profile can help you identify problems in your data, such as invalid strings, and can suggest regular expressions that can be used in the future to validate new values. Por exemplo, um perfil de padrão de uma coluna de Códigos Postais dos Estados Unidos pode produzir as expressões regulares \d{5}-\d{4}, \d{5} e \d{9}.For example, a pattern profile of a column of United States Zip Codes might produce the regular expressions \d{5}-\d{4}, \d{5}, and \d{9}. Se você vir outras expressões regulares, seus dados provavelmente conterão valores inválidos ou que estão em um formato incorreto.If you see other regular expressions, your data likely contains values that are invalid or in an incorrect format.

Observação

As opções descritas neste tópico são exibidas na página Solicitações de Perfil do Editor da Tarefa Criação de Perfil de Dados.The options described in this topic appear on the Profile Requests page of the Data Profiling Task Editor. Para obter mais informações sobre essa página do editor, consulte Editor da Tarefa Criação de Perfil de Dados (Página Solicitações de perfil).For more information about this page of the editor, see Data Profiling Task Editor (Profile Requests Page).

Para obter mais informações sobre como usar a Tarefa Criação de Perfil de Dados, consulte Configuração da Tarefa Criação de Perfil de Dados.For more information about how to use the Data Profiling Task, see Setup of the Data Profiling Task. Para obter mais informações sobre como usar o Visualizador de Perfil de Dados para analisar a saída da Tarefa Criação de Perfil de Dados, consulte Visualizador de Perfil de Dados.For more information about how to use the Data Profile Viewer to analyze the output of the Data Profiling Task, see Data Profile Viewer.

Compreendendo o uso de delimitadores e símbolosUnderstanding the Use of Delimiters and Symbols

Antes de computar os padrões para uma Solicitação de Perfil de Padrão de Coluna, a Tarefa Criação de Perfil de Dados gera tokens a partir dos dados.Before computing the patterns for a Column Pattern Profile Request, the Data Profiling Task tokenizes the data. Ou seja, a tarefa separa os valores da cadeia de caracteres em unidades menores conhecidas como tokens.That is, the task separates the string values into smaller units known as tokens. A tarefa separa cadeias de caracteres em tokens com base nos delimitadores e símbolos especificados para as propriedades de Delimitadores e Símbolos :The task separates strings into tokens based on the delimiters and symbols that you specify for the Delimiters and Symbols properties:

  • Delimitadores Por padrão, a lista de delimitadores contém os seguintes caracteres: espaço, guia horizontal (\t), nova linha (\n) e retorno de carro (\r).Delimiters By default, the list of delimiters contains the following characters: space, horizontal tab (\t), new line (\n), and carriage return (\r). É possível especificar delimitadores adicionais, mas não é possível remover os delimitadores padrão.You can specify additional delimiters, but you cannot remove the default delimiters.

  • Símbolos Por padrão, a lista de Símbolos contém os seguintes caracteres: ,.;:-"'~=&/@!?()<>[]{}|#*^%, além da marca de escala.Symbols By default, the list of Symbols contains the following characters: ,.;:-"'~=&/@!?()<>[]{}|#*^% as well as the tick mark. Por exemplo, se os símbolos forem "()-", será gerado o token ["(", "425", ")", "123", "-", "4567", ")"] para o valor "(425) 123-4567".For example, if the symbols are "()-", the value "(425) 123-4567" is tokenized as ["(", "425", ")", "123", "-", "4567", ")"].

    Um caractere não pode ser um delimitador e um símbolo ao mesmo tempo.A character cannot be both a delimiter and a symbol.

    Todos os delimitadores são normalizados em um único espaço como parte do processo de geração de tokens, enquanto os símbolos são retidos.All delimiters are normalized to a single space as part of the tokenizing process, while symbols are retained.

Compreendendo o uso da tabela de marcasUnderstanding the Use of the Tag Table

Como opção, é possível agrupar tokens relacionados com uma única marca armazenando marcas e os seus termos relacionados em uma tabela especial criada em um banco de dados do SQL ServerSQL Server .You can optionally group related tokens with a single tag by storing tags and the related terms in a special table that you create in a SQL ServerSQL Server database. É necessário que a tabela de marcas tenha duas colunas de cadeias de caracteres: "Marca" e "Termo".The tag table must have two string columns, one named "Tag" and the other named "Term". Essas colunas podem ser dos tipos char, nchar, varcharou nvarchar, mas não text ou ntext.These columns can be of type char, nchar, varchar, or nvarchar, but not text or ntext. É possível combinar várias marcas e os termos correspondentes em uma única tabela.You can combine multiple tags and the corresponding terms in a single table. Uma Solicitação de Perfil de Padrão de Coluna pode usar uma só tabela de marcas.A Column Pattern Profile Request can use only one tag table. É possível usar um gerenciador de conexões ADO.NETADO.NET separado para se conectar à tabela de marcas.You can use a separate ADO.NETADO.NET connection manager to connect to the tag table. Portanto, a tabela de marcas pode estar localizada em um banco de dados diferente ou em um servidor diferente do banco de dados de origem.Therefore, the tag table can be located in a different database or on a different server than the source data.

Por exemplo, é possível agrupar os valores "Leste", "Oeste", "Norte" e "Sul" que podem aparecer em endereços usando uma única marca: "Direção".For example, you could group the values "East", "West", "North", and "South" that might appear in street addresses by using the single tag, "Direction". A tabela a seguir é um exemplo de uma tabela de marcas desse tipo.The following table is an example of such a tag table.

MarcaTag TermoTerm
DireçãoDirection LesteEast
DireçãoDirection OesteWest
DireçãoDirection NorteNorth
DireçãoDirection SulSouth

Também seria possível usar outra marca para agrupar as palavras que especificam o logradouro em endereços:You could use another tag to group the different words that express the notion of a "street" in street addresses:

MarcaTag TermoTerm
LogradouroStreet LogradouroStreet
LogradouroStreet AvenidaAvenue
LogradouroStreet VilaPlace
LogradouroStreet TravessaWay

Com base nessa combinação de marcas, o padrão resultante para um endereço poderia se assemelhar ao seguinte padrão:Based on this combination of tags, the resulting pattern for a street address might resemble the following pattern:

\d+\ LookupTag=Direction \d+\p{L}+\ LookupTag=Street

Observação

Usar uma tabela de marcas diminui o desempenho da tarefa Criação de Perfil de Dados.Using a tag table decreases the performance of the Data Profiling task. Não use mais de 10 marcas nem mais de 100 termos por marca.Do not use more than 10 tags or more than 100 terms per tag.

O mesmo termo pode pertencer a mais de uma marca.The same term can belong to more than one tag.

Opções de Propriedades da SolicitaçãoRequest Properties Options

Para uma Solicitação de Perfil de Padrão de Coluna, o painel Propriedades da Solicitação exibe os seguintes grupos de opções:For a Column Pattern Profile Request, the Request Properties pane displays the following groups of options:

  • Dadosque incluem as opções TableOrView e ColumnData, which includes the TableOrView and Column options

  • GeralGeneral

  • OpçõesOptions

Opções de dadosData Options

ConnectionManagerConnectionManager
Selecione o gerente de conexões do ADO.NETADO.NET que usa o Provedor de Dados .NET para SQL ServerSQL Server (SqlClient) para conexão com o banco de dados do SQL ServerSQL Server que contém a tabela ou a exibição que você deseja analisar.Select the existing ADO.NETADO.NET connection manager that uses the .NET Data Provider for SQL ServerSQL Server (SqlClient) to connect to the SQL ServerSQL Server database that contains the table or view to be profiled.

TableOrViewTableOrView
Selecione a tabela ou exibição existente que contêm a coluna para a qual será criado um perfil.Select the existing table or view that contains the column to be profiled.

Para obter mais informações, consulte a seção "Opções TableOrView" neste tópico.For more information, see the section, "TableorView Options," in this topic.

ColumnColumn
Selecione a coluna existente para a qual um perfil será criado.Select the existing column to be profiled. Selecione (*) para analisar todas as colunas.Select (*) to profile all columns.

Para obter mais informações, consulte a seção “Opções Column” neste tópico.For more information, see the section, "Column Options," in this topic.

Opções TableOrViewTableOrView Options

EsquemaSchema
Especifica o esquema ao qual a tabela selecionada pertence.Specifies the schema to which the selected table belongs. Esta opção é somente leitura.This option is read-only.

TableTable
Exibe o nome da tabela selecionada.Displays the name of the selected table. Esta opção é somente leitura.This option is read-only.

Opções de ColunaColumn Options

IsWildCardIsWildCard
Especifica se o curinga (*) foi selecionado.Specifies whether the (*) wildcard has been selected. Esta opção será definida como True se você tiver selecionado (*) para analisar todas as colunas.This option is set to True if you have selected (*) to profile all columns. Será Falso se você selecionou uma coluna individual para a criação de um perfil.It is False if you have selected an individual column to be profiled. Esta opção é somente leitura.This option is read-only.

ColumnNameColumnName
Exibe o nome da coluna selecionada.Displays the name of the selected column. Esta opção estará em branco se você tiver selecionado (*) para analisar todas as colunas.This option is blank if you have selected (*) to profile all columns. Esta opção é somente leitura.This option is read-only.

StringCompareOptionsStringCompareOptions
Esta opção não é aplicável ao Perfil de Criação de Coluna.This option does not apply to the Column Pattern Profile.

Opções geraisGeneral Options

RequestIDRequestID
Digite um nome descritivo para identificar esta solicitação de perfil.Type a descriptive name to identify this profile request. Normalmente, não é necessário alterar o valor gerado automaticamente.Typically, you do not have to change the autogenerated value.

OpçõesOptions

MaxNumberOfPatternsMaxNumberOfPatterns
Especifique o número máximo de padrões que deve ser computado pelo perfil.Specify the maximum number of patterns that you want the profile to compute. O valor padrão desta opção é 10.The default value of this option is 10. O valor máximo é 100.The maximum value is 100.

PercentageDataCoverageDesiredPercentageDataCoverageDesired
Especifique a porcentagem dos dados a ser coberta pelos padrões computados.Specify the percentage of the data that you want the computed patterns to cover. O valor padrão desta opção é 95 (por cento).The default value of this option is 95 (percent).

CaseSensitiveCaseSensitive
Indique se os padrões deveriam fazer distinção entre letras maiúsculas e minúsculas.Indicate whether the patterns should be case-sensitive. O valor padrão desta opção é False.The default value of this option is False.

DelimitadoresDelimiters
Liste os caracteres que deveriam ser tratados como equivalentes a espaços entre palavras ao gerar tokens para texto.List the characters that should be treated as the equivalent of spaces between words when tokenizing text. Por padrão, a lista de Delimitadores contém os seguintes caracteres: espaço, guia horizontal (\t), nova linha (\n) e retorno de carro (\r).By default, the list of Delimiters contains the following characters: the space, horizontal tab (\t), new line (\n), and carriage return (\r). É possível especificar delimitadores adicionais, mas não é possível remover os delimitadores padrão.You can specify additional delimiters, but you cannot remove the default delimiters.

Para obter mais informações, consulte "Compreendendo o uso de delimitadores e símbolos" anteriormente neste tópico.For more information, see "Understanding the Use of Delimiters and Symbols" earlier in this topic.

SímbolosSymbols
Liste os símbolos que deveriam ser retidos como parte de padrões.List the symbols that should be retained as part of patterns. Exemplos poderiam incluir "/" para datas, ":" para horários e "@" para endereços de email.</span><span class="sxs-lookup">Examples might include "/" for dates, ":" for times, and "@" for e-mail addresses.</span></span> <span data-ttu-id="9bd51-214">Por padrão, a lista de Símbolos contém os seguintes caracteres: ,.;:-"'~=&/@!?()<>[]{}|#*^%.By default, the list of Symbols contains the following characters: ,.;:-"'~=&/@!?()<>[]{}|#*^%.

Para obter mais informações, consulte "Compreendendo o uso de delimitadores e símbolos" anteriormente neste tópico.For more information, see "Understanding the Use of Delimiters and Symbols" earlier in this topic.

TagTableConnectionManagerTagTableConnectionManager
Selecione o gerenciador de conexões existente do ADO.NETADO.NET que usa o Provedor de Dados .NET para SQL ServerSQL Server (SqlClient) se conectar ao banco de dados do SQL ServerSQL Server que contém a tabela de marcações.Select the existing ADO.NETADO.NET connection manager that uses the .NET Data Provider for SQL ServerSQL Server (SqlClient) to connect to the SQL ServerSQL Server database that contains the tag table.

Para obter mais informações, consulte "Compreendendo o uso da tabela de marcas" anteriormente neste tópico.For more information, see "Understanding the Use of the Tag Table" earlier in this topic.

TagTableNameTagTableName
Selecione a tabela de marcas existente, a qual deve ter duas colunas de cadeia de caracteres: Marca e Termo.Select the existing tag table, which must have two string columns named Tag and Term.

Para obter mais informações, consulte "Compreendendo o uso da tabela de marcas" anteriormente neste tópico.For more information, see "Understanding the Use of the Tag Table" earlier in this topic.

Consulte tambémSee Also

Editor da tarefa Criação de Perfil de Dados (Página Geral) Data Profiling Task Editor (General Page)
Formulário de Perfil Rápido de Tabela Única (Tarefa Criação de Perfil de Dados)Single Table Quick Profile Form (Data Profiling Task)