Buscar documentos similares y relacionados con la búsqueda semántica

Se aplica a:SQL Server

Describe cómo buscar documentos o valores de texto similares e información acerca de su similitud o relación en columnas configuradas para la indización semántica estadística.

Buscar documentos similares o relacionados con SEMANTICSIMILARITYTABLE

Para identificar documentos similares o relacionados en una columna específica, consulte la semántica de semanticsimilaritytable (Transact-SQL).

SEMANTICSIMILARITYTABLE devuelve una tabla de cero, una o más filas cuyo contenido de la columna especificada es similar semánticamente al documento indicado. Se puede hacer referencia a esta función de conjunto de filas en la cláusula FROM de una instrucción SELECT como un nombre de tabla normal.

No se puede consultar en varias columnas para documentos similares. La función SEMANTICSIMILARITYTABLE solo recupera resultados de la misma columna que la columna de origen, que se identifica mediante el argumento source_key .

Para obtener información detallada sobre los parámetros requeridos por la función SEMANTICSIMILARITYTABLE y sobre la tabla de resultados que devuelve, consulte semanticsimilaritytable (Transact-SQL).

Importante

Las columnas de destino deben tener habilitada la indización de texto completo y semántica.

Ejemplo: Buscar los documentos principales similares a otro documento

En el ejemplo siguiente se recuperan los 10 candidatos principales que son similares al candidato especificado por @CandidateID de la tabla HumanResources.JobCandidate de la base de datos de ejemplo de AdventureWorks2022.

SELECT TOP(10) KEY_TBL.matched_document_key AS Candidate_ID  
FROM SEMANTICSIMILARITYTABLE  
    (  
    HumanResources.JobCandidate,  
    Resume,  
    @CandidateID  
    ) AS KEY_TBL  
ORDER BY KEY_TBL.score DESC;  
GO  

Buscar información sobre la similitud o relación de los documentos con SEMANTICSIMILARITYDETAILSTABLE

Para obtener información sobre las frases clave que hacen que los documentos sean similares o relacionados, puede consultar la función de semanticsimilaritydetailstable (Transact-SQL).

SEMANTICSIMILARITYDETAILSTABLE devuelve una tabla de cero, una o más filas de frases clave comunes en dos documentos (un documento de origen y un documento coincidente) cuyo contenido es similar semánticamente. Se puede hacer referencia a esta función de conjunto de filas en la cláusula FROM de una instrucción SELECT como un nombre de tabla normal.

Para obtener información detallada sobre los parámetros requeridos por la función SEMANTICSIMILARITYDETAILSTABLE y sobre la tabla de resultados que devuelve, consulte semanticsimilaritydetailstable (Transact-SQL).

Importante

Las columnas de destino deben tener habilitada la indización de texto completo y semántica.

Ejemplo: Buscar las frases clave principales que son similares entre documentos

En el ejemplo siguiente se recuperan las 5 frases clave que tienen la puntuación de similitud más alta entre los candidatos especificados en la tabla HumanResources.JobCandidate de la base de datos de ejemplo de AdventureWorks2022.

SELECT TOP(5) KEY_TBL.keyphrase, KEY_TBL.score  
FROM SEMANTICSIMILARITYDETAILSTABLE  
    (  
    HumanResources.JobCandidate,  
    Resume, @CandidateID,  
    Resume, @MatchedID  
    ) AS KEY_TBL  
ORDER BY KEY_TBL.score DESC;  
GO