O que é classificação de texto personalizado?

A classificação de texto personalizado é uma das funcionalidades personalizadas oferecidas pelo Azure Cognitive Service for Language. É um serviço API baseado na nuvem que aplica inteligência de aprendizagem automática para permitir que você construa modelos personalizados para tarefas de classificação de texto.

A classificação de texto personalizado permite que os utilizadores construam modelos de IA personalizados para classificar o texto em classes personalizadas pré-definidas pelo utilizador. Ao criar um projeto de classificação de texto personalizado, os desenvolvedores podem etiquetar os dados, treinar, avaliar e melhorar modelo desempenho antes de disponibilizá-los para consumo. A qualidade dos dados rotulados tem um grande impacto modelo desempenho. Para simplificar a construção e personalização do seu modelo, o serviço oferece um portal web personalizado que pode ser acedido através do estúdio Language. Pode começar facilmente com o serviço seguindo os passos neste arranque rápido.

A classificação de texto personalizado suporta dois tipos de projetos:

  • Classificação de rótulo único - pode atribuir uma única classe para cada documento no seu conjunto de dados. Por exemplo, um guião de filme só podia ser classificado como "Romance" ou "Comédia".
  • Classificação multi-etiqueta - pode atribuir várias classes para cada documento no seu conjunto de dados. Por exemplo, um roteiro de filme pode ser classificado como "Comédia" ou "Romance" e "Comédia".

Esta documentação contém os seguintes tipos de artigos:

  • Os quickstarts estão a iniciar instruções para guiá-lo através da realização de pedidos ao serviço.
  • Os conceitos fornecem explicações sobre a funcionalidade e funcionalidades do serviço.
  • Os guias de como fazer contêm instruções para a utilização do serviço de formas mais específicas ou personalizadas.

Cenários de utilização de exemplo

A classificação de texto personalizado pode ser usada em vários cenários em várias indústrias:

E-mails automáticos ou triagem de bilhetes

Os centros de suporte de todos os tipos recebem um grande volume de e-mails ou bilhetes que contêm texto e anexos não estruturados e gratuitos. A revisão atempresa, o reconhecimento e o encaminhamento para os peritos em assuntos dentro das equipas internas é fundamental. A triagem de e-mail nesta escala requer que as pessoas revejam e encaminhem para os departamentos certos, o que leva tempo e recursos. A classificação personalizada de texto pode ser usada para analisar textos de entrada, triagem e categorização do conteúdo a ser automaticamente encaminhado para os departamentos relevantes para mais ações.

A pesquisa é fundamental para qualquer aplicação que aucie conteúdo sonoro para os utilizadores. Os cenários comuns incluem pesquisas de catálogos ou documentos, pesquisas de produtos de retalho ou mineração de conhecimento para a ciência dos dados. Muitas empresas de várias indústrias procuram construir uma rica experiência de pesquisa sobre conteúdos privados e heterogéneos, que inclui documentos estruturados e não estruturados. Como parte do seu oleoduto, os desenvolvedores podem usar a classificação de texto personalizado para categorizar o seu texto em classes que são relevantes para a sua indústria. As classes previstas podem ser usadas para enriquecer a indexação do ficheiro para uma experiência de pesquisa mais personalizada.

Project ciclo de vida do desenvolvimento

A criação de um projeto de classificação de texto personalizado envolve tipicamente vários passos diferentes.

The development lifecycle

Siga estes passos para tirar o máximo partido do seu modelo:

  1. Defina esquema: Conheça os seus dados e identifique as classes entre as quais pretende diferenciar, evite ambiguidade.

  2. Dados do rótulo: A qualidade da rotulagem dos dados é um fator chave para determinar modelo desempenho. Os documentos que pertencem à mesma classe devem ter sempre a mesma classe, se tiver um documento que possa cair em duas classes use projetos de classificação multi-etiqueta . Evite ambiguidades de classe, certifique-se de que as suas aulas são claramente separáveis umas das outras, especialmente com projetos de classificação de rótulo único.

  3. Modelo de comboio: O seu modelo começa a aprender com os seus dados rotulados.

  4. Ver modelo detalhes da avaliação: Veja os detalhes da avaliação do seu modelo para determinar o seu desempenho quando introduzido em novos dados.

  5. Melhorar modelo: Trabalhar para melhorar o seu desempenho modelo examinando as previsões modelo incorretas e examinando a distribuição de dados.

  6. Implementar modelo: Implantar uma modelo disponibiliza-a para utilização através da API de Análise.

  7. Classifique o texto: Utilize o seu modelo personalizado para tarefas de classificação de texto personalizadas.

Documentação de referência e amostras de código

Ao utilizar a classificação de texto personalizada, consulte a seguinte documentação de referência e amostras para serviços cognitivos Azure para a linguagem:

Opção de desenvolvimento / linguagem Documentação de referência Amostras
REST APIs (Autoria) Documentação de REPOUSO API
REST APIs (Tempo de execução) Documentação de REPOUSO API
C# Documentação C# C# amostras - Classificação única de rótuloC# - Classificação de vários rótulos
Java Documentação de Java Amostras de Java - Classificação de etiqueta únicaAmostras de Java - Classificação de vários rótulos
JavaScript Documentação do JavaScript Amostras javaScript - Amostras javaScript classificação de rótulo único- classificação de vários rótulos
Python documentação Python Python amostras - Classificação de rótulo únicoPython amostras - Classificação de vários rótulos

IA Responsável

Um sistema de IA inclui não só a tecnologia, mas também as pessoas que a utilizarão, as pessoas que serão afetadas por ela, e o ambiente em que é implantada. Leia a nota de transparência para classificação de texto personalizado para saber sobre a utilização e implementação de IA responsáveis nos seus sistemas. Também pode ver os seguintes artigos para mais informações:

Passos seguintes

  • Utilize o artigo de arranque rápido para começar a utilizar a classificação de texto personalizada.

  • Ao percorrer o ciclo de vida de desenvolvimento do projeto, reveja o glossário para saber mais sobre os termos utilizados ao longo da documentação para esta funcionalidade.

  • Lembre-se de ver os limites de serviço para informações como a disponibilidade regional.