O que é classificação de texto personalizado?
A classificação de texto personalizado é uma das funcionalidades personalizadas oferecidas pelo Azure Cognitive Service for Language. É um serviço API baseado na nuvem que aplica inteligência de aprendizagem automática para permitir que você construa modelos personalizados para tarefas de classificação de texto.
A classificação de texto personalizado permite que os utilizadores construam modelos de IA personalizados para classificar o texto em classes personalizadas pré-definidas pelo utilizador. Ao criar um projeto de classificação de texto personalizado, os desenvolvedores podem etiquetar os dados, treinar, avaliar e melhorar modelo desempenho antes de disponibilizá-los para consumo. A qualidade dos dados rotulados tem um grande impacto modelo desempenho. Para simplificar a construção e personalização do seu modelo, o serviço oferece um portal web personalizado que pode ser acedido através do estúdio Language. Pode começar facilmente com o serviço seguindo os passos neste arranque rápido.
A classificação de texto personalizado suporta dois tipos de projetos:
- Classificação de rótulo único - pode atribuir uma única classe para cada documento no seu conjunto de dados. Por exemplo, um guião de filme só podia ser classificado como "Romance" ou "Comédia".
- Classificação multi-etiqueta - pode atribuir várias classes para cada documento no seu conjunto de dados. Por exemplo, um roteiro de filme pode ser classificado como "Comédia" ou "Romance" e "Comédia".
Esta documentação contém os seguintes tipos de artigos:
- Os quickstarts estão a iniciar instruções para guiá-lo através da realização de pedidos ao serviço.
- Os conceitos fornecem explicações sobre a funcionalidade e funcionalidades do serviço.
- Os guias de como fazer contêm instruções para a utilização do serviço de formas mais específicas ou personalizadas.
Cenários de utilização de exemplo
A classificação de texto personalizado pode ser usada em vários cenários em várias indústrias:
E-mails automáticos ou triagem de bilhetes
Os centros de suporte de todos os tipos recebem um grande volume de e-mails ou bilhetes que contêm texto e anexos não estruturados e gratuitos. A revisão atempresa, o reconhecimento e o encaminhamento para os peritos em assuntos dentro das equipas internas é fundamental. A triagem de e-mail nesta escala requer que as pessoas revejam e encaminhem para os departamentos certos, o que leva tempo e recursos. A classificação personalizada de texto pode ser usada para analisar textos de entrada, triagem e categorização do conteúdo a ser automaticamente encaminhado para os departamentos relevantes para mais ações.
Mineração de conhecimento para melhorar/enriquecer a procura semântica
A pesquisa é fundamental para qualquer aplicação que aucie conteúdo sonoro para os utilizadores. Os cenários comuns incluem pesquisas de catálogos ou documentos, pesquisas de produtos de retalho ou mineração de conhecimento para a ciência dos dados. Muitas empresas de várias indústrias procuram construir uma rica experiência de pesquisa sobre conteúdos privados e heterogéneos, que inclui documentos estruturados e não estruturados. Como parte do seu oleoduto, os desenvolvedores podem usar a classificação de texto personalizado para categorizar o seu texto em classes que são relevantes para a sua indústria. As classes previstas podem ser usadas para enriquecer a indexação do ficheiro para uma experiência de pesquisa mais personalizada.
Project ciclo de vida do desenvolvimento
A criação de um projeto de classificação de texto personalizado envolve tipicamente vários passos diferentes.
Siga estes passos para tirar o máximo partido do seu modelo:
Defina o seu esquema: Conheça os seus dados e identifique as classes entre as quais pretende diferenciar, evite ambiguidade.
Rotular os seus dados: A qualidade da rotulagem dos dados é um fator chave para determinar modelo desempenho. Os documentos que pertencem à mesma classe devem ter sempre a mesma classe, se tiver um documento que possa cair em duas classes use projetos de classificação multi-etiqueta . Evite ambiguidades de classe, certifique-se de que as suas aulas são claramente separáveis umas das outras, especialmente com projetos de classificação de rótulo único.
Treine o modelo: O seu modelo começa a aprender com os seus dados rotulados.
Veja o desempenho do modelo: Veja os detalhes da avaliação do seu modelo para determinar o seu desempenho quando introduzido em novos dados.
Melhorar a modelo: Trabalhar para melhorar o seu desempenho modelo examinando as previsões modelo incorretas e examinando a distribuição de dados.
Implementar o modelo: Implantar uma modelo disponibiliza-o para utilização através da API de Análise.
Classifique o texto: Utilize o seu modelo personalizado para tarefas de classificação de texto personalizadas.
Documentação de referência e amostras de código
Ao utilizar a classificação de texto personalizada, consulte a seguinte documentação de referência e amostras para o Serviço Cognitivo Azure para a Linguagem:
Opção de desenvolvimento / linguagem | Documentação de referência | Amostras |
---|---|---|
REST APIs (Autoria) | Documentação de REPOUSO API | |
REST APIs (Tempo de execução) | Documentação de REPOUSO API | |
C# (Tempo de execução) | Documentação C# | C# amostras - Classificação única de rótuloC# - Classificação de vários rótulos |
Java (Tempo de execução) | Documentação de Java | Amostras de Java - Classificação de etiqueta únicaAmostras de Java - Classificação de vários rótulos |
JavaScript (Tempo de execução) | Documentação do JavaScript | Amostras javaScript - Amostras javaScript classificação de rótulo único- classificação de vários rótulos |
Python (Tempo de execução) | documentação Python | Python amostras - Classificação de rótulo únicoPython amostras - Classificação de vários rótulos |
IA Responsável
Um sistema de IA inclui não só a tecnologia, mas também as pessoas que a utilizarão, as pessoas que serão afetadas por ela, e o ambiente em que é implantada. Leia a nota de transparência para classificação de texto personalizado para saber sobre a utilização e implementação de IA responsáveis nos seus sistemas. Também pode ver os seguintes artigos para mais informações:
- Nota de transparência para O Serviço Cognitivo Azure para a Linguagem
- Integração e utilização responsável
- Dados, privacidade e segurança
Passos seguintes
Utilize o artigo de arranque rápido para começar a utilizar a classificação de texto personalizada.
Ao percorrer o ciclo de vida de desenvolvimento do projeto, reveja o glossário para saber mais sobre os termos utilizados ao longo da documentação para esta funcionalidade.
Lembre-se de ver os limites de serviço para informações como a disponibilidade regional.