¿Qué es Reconocimiento de entidades con nombre (NER) personalizado (versión preliminar)?

Reconocimiento de entidades con nombre personalizado es una de las características que ofrece Azure Cognitive Service for Language. Se trata de un servicio de API basado en la nube que aplica inteligencia de aprendizaje automático que le permite crear modelos personalizados para tareas de Reconocimiento de entidades con nombre de texto personalizados de texto.

Reconocimiento de entidades con nombre personalizado se ofrece como parte de las características personalizadas de Azure Cognitive Service for Language. Esta característica permite a sus usuarios crear modelos de inteligencia artificial personalizados para extraer entidades específicas del dominio de texto no estructurado, como contratos o documentos financieros. Mediante la creación de un proyecto de Reconocimiento de entidades con nombre personalizado, los desarrolladores pueden etiquetar datos de forma iterativa, entrenar, evaluar y mejorar el rendimiento del modelo antes de que esté disponible para su consumo. La calidad de los datos etiquetados afecta considerablemente al rendimiento del modelo. Para simplificar la creación y personalización del modelo, el servicio ofrece un portal web personalizado al que se puede acceder a través de Language Studio. Si sigue los pasos que se indican en este inicio rápido, le resultará fácil empezar a usar el servicio.

Esta documentación contiene los siguientes tipos de artículos:

  • Los inicios rápidos son instrucciones de inicio que le guiarán a la hora de hacer solicitudes al servicio.
  • Los conceptos proporcionan explicaciones sobre la funcionalidad y las características del servicio.
  • Las guías de procedimientos contienen instrucciones para usar el servicio de una manera más específica o personalizada.

Escenarios de uso de ejemplo

Extracción de información

Muchas organizaciones financieras y legales extraen y normalizan datos de miles de textos no estructurados complejos, como extractos bancarios, contratos legales o formularios bancarios a diario. En lugar de procesar manualmente estos formularios, Reconocimiento de entidades con nombre personalizado puede ayudar a automatizar este proceso y ahorrar costos, tiempo y esfuerzo.

La búsqueda es fundamental para cualquier aplicación que represente contenido de texto para los usuarios, con escenarios comunes como la búsqueda de catálogos o documentos, la búsqueda de productos comerciales o la minería de conocimientos para la ciencia de datos.Muchas empresas de varios sectores están investigando la posibilidad de crear una mejor experiencia de búsqueda sobre contenido privado y heterogéneo que incluya documentos tanto estructurados como no estructurados. Como parte de su canalización, los desarrolladores pueden usar Reconocimiento de entidades con nombre personalizado para extraer entidades del texto que son relevantes para su sector. Estas entidades se podrían usar para enriquecer la indexación del archivo, con el fin de personalizar más la experiencia de búsqueda.

Auditoría y cumplimiento

En lugar de revisar manualmente archivos de texto considerablemente largos para auditar y aplicar directivas, los departamentos de TI de empresas financieras o legales pueden el usar Reconocimiento de entidades con nombre personalizado para crear soluciones automatizadas. Estas soluciones ayudan a aplicar directivas de cumplimiento y a configurar reglas de negocio necesarias en función de las canalizaciones de minería de conocimiento que procesan tanto el contenido estructurado como el no estructurado.

Ciclo de vida del desarrollo de aplicaciones

El uso de Reconocimiento de entidades con nombre personalizado suele implicar varios pasos diferentes.

El ciclo de vida del desarrollo

  1. Definir el esquema: conozca los datos e identifique las entidades que desea extraer. Evita la ambigüedad.

  2. Etiquetar los datos: el etiquetado de datos es un factor clave para determinar el rendimiento del modelo. Agregue las etiquetas de forma precisa, coherente y completa.

    1. Etiquetar con precisión: etiquete cada entidad en su tipo correcto siempre. Incluya solo lo que quiera extraer y evite datos innecesarios en la etiqueta.
    2. Etiquetar de forma coherente: la misma entidad debe tener la misma etiqueta en todos los archivos.
    3. Etiquetar por completo: etiquete todas las instancias de la entidad en todos los archivos.
  3. Entrenar el modelo: el modelo empieza a aprender de los datos etiquetados.

  4. Ver los detalles de evaluación del modelo: una vez completado el entrenamiento, vea los detalles de evaluación del modelo y su rendimiento.

  5. Mejorar el modelo: después de examinar los detalles de evaluación del modelo, puede continuar y aprender a mejorar el modelo.

  6. Implementar el modelo: la implementación de un modelo es para que esté disponible para su uso.

  7. Extraer entidades: use los modelos personalizados para las tareas de extracción de entidades.

Pasos siguientes

  • Tras leer el artículo de inicio rápido podrá empezar a usar la clasificación de texto personalizada.

  • Cuando avance por el ciclo de vida de desarrollo de aplicaciones, consulte el glosario para obtener más información sobre los términos que se usan en la documentación para esta característica.

  • No olvide ver los límites del servicio para obtener información como la disponibilidad regional.