Termos e definições utilizados na classificação de textos personalizados

Artigo
12/19/2023

Utilize este artigo para saber mais sobre algumas das definições e termos que pode encontrar ao utilizar a classificação de texto personalizado.

Classe

Uma classe é uma categoria definida pelo utilizador que indica a classificação geral do texto. Os programadores etiquetam os respetivos dados com as respetivas classes antes de os transmitirem ao modelo de preparação.

Classificação F1

A classificação F1 é uma função de Precisão e Revocação. É necessário quando procura um equilíbrio entre precisão e revocação.

Modelação

Um modelo é um objeto preparado para realizar uma determinada tarefa, neste caso, tarefas de classificação de textos. Os modelos são preparados ao fornecer dados etiquetados para aprender, para que possam ser utilizados posteriormente para tarefas de classificação.

A preparação de modelos é o processo de ensinar o seu modelo a classificar documentos com base nos seus dados etiquetados.
A avaliação do modelo é o processo que ocorre logo após a preparação para saber o desempenho do modelo.
A implementação é o processo de atribuir o modelo a uma implementação para o disponibilizar para utilização através da API de predição.

Precisão

Mede a precisão/precisão do modelo. É a proporção entre os positivos corretamente identificados (verdadeiros positivos) e todos os positivos identificados. A métrica de precisão revela quantas classes previstas estão etiquetadas corretamente.

Project

Um projeto é uma área de trabalho para criar os seus modelos de ML personalizados com base nos seus dados. O seu projeto só pode ser acedido por si e por outras pessoas que tenham acesso ao recurso do Azure que está a ser utilizado. Como pré-requisito para criar um projeto de classificação de textos personalizado, tem de ligar o recurso a uma conta de armazenamento com o conjunto de dados quando criar um novo projeto. O seu projeto inclui automaticamente todos os .txt ficheiros disponíveis no seu contentor.

No seu projeto, pode fazer o seguinte:

Etiquetar os seus dados: o processo de etiquetagem dos seus dados para que, ao preparar o seu modelo, aprenda o que pretende extrair.
Criar e preparar o seu modelo: o passo principal do seu projeto, onde o seu modelo começa a aprender com os seus dados etiquetados.
Ver detalhes de avaliação do modelo: reveja o desempenho do modelo para decidir se há espaço para melhorias ou se está satisfeito com os resultados.
Implementação: depois de rever o desempenho do modelo e decidir que está apto a ser utilizado no seu ambiente; tem de atribuí-la a uma implementação para a poder consultar. Atribuir o modelo a uma implementação disponibiliza-o para utilização através da API de predição.
Modelo de teste: depois de implementar o modelo, pode utilizar esta operação no Language Studio para experimentar a sua implementação e ver o seu desempenho na produção.

Tipos de projeto

A classificação de textos personalizados suporta dois tipos de projetos

Classificação de etiqueta única – pode atribuir uma única classe para cada documento no seu conjunto de dados. Por exemplo, um script de filme só podia ser classificado como "Romance" ou "Comédia".
Classificação de várias etiquetas – pode atribuir várias classes para cada documento no seu conjunto de dados. Por exemplo, um script de filme pode ser classificado como "Comédia" ou "Romance" e "Comédia".

Chamar de volta

Mede a capacidade do modelo de prever classes positivas reais. É a proporção entre os verdadeiros positivos previstos e o que foi realmente marcado. A métrica de resgate revela quantas das classes previstas estão corretas.