Edición de un archivo de palabras irrelevantes (Office SharePoint Server)

Una palabra irrelevante es una palabra que no resulta útil en una búsqueda; por ejemplo, palabras como "el" o "un". Los archivos de palabras irrelevantes contienen una lista de palabras que se excluirán o se ignorarán cuando un usuario realice una consulta. Entre estas listas pueden incluirse palabras que son irrelevantes para la búsqueda, como conjunciones, artículos, adjetivos y adverbios, así como nombres comunes y palabras ofensivas o inapropiadas.

En este artículo:

  • Información sobre los archivos de palabras irrelevantes

  • Edición de un archivo de palabras irrelevantes

  • Lista de archivos de palabras irrelevantes por idioma

Información sobre los archivos de palabras irrelevantes

Para cada idioma, se almacena una lista de palabras irrelevantes en el archivo de palabras irrelevantes de dicho idioma. Si un idioma no tiene ninguna lista de palabras irrelevantes, Microsoft Office SharePoint Server 2007 usa el archivo de palabras irrelevantes neutral noiseneu.txt. El separador de palabras de un idioma determinado identifica las palabras individuales mediante la delimitación los límites de la palabra, en función de las normas léxicas de dicho idioma. Cuando un separador de palabras de un idioma determinado encuentra palabras durante el indizado o el tiempo de consulta, el separador de palabras elimina las palabras que figuran en el archivo de palabras irrelevantes. Para obtener más información sobre qué idiomas son compatibles con los archivos de palabras irrelevantes, vea la sección "Lista de palabras irrelevantes por idioma".

Los archivos de palabras irrelevantes se crean y se almacenan de manera predeterminada en la siguiente ubicación del servidor de consultas: Unidad:\Archivos de programa\Microsoft Office Servers\12.0\Data\Config. Los archivos de palabras irrelevantes de dicha ubicación se copian en la siguiente ubicación de carpeta para cada instancia del servicio Microsoft Search que existe en el servidor de consultas: Unidad:\Archivos de programa\Microsoft Office Servers\12.0\Data\Applications\\<UID de la aplicación>\Config, donde <UID de la aplicación> es el GUID asociado a cada instancia del servicio Search.

Nota

Si modifica los archivos de palabras irrelevantes en la ubicación predeterminada, la versión modificada de los archivos se copiará automáticamente cada vez que se cree un nuevo proveedor de servicios compartidos (SSP). Si modifica los archivos de palabras irrelevantes en la ubicación predeterminada después de crear un SSP, deberá copiar los archivos de la ubicación predeterminada al directorio especificado para cada SSP que ya exista.

Si agrega palabras irrelevantes, es posible que la precisión de las búsquedas disminuya. Esto implica que el tamaño del índice de contenido también disminuirá. Así pues, un índice de contenido más pequeño ayuda a aumentar el rendimiento. Si desea que las búsquedas devuelvan determinadas palabras irrelevantes, puede eliminarlas del archivo.

Si quita palabras del archivo de palabras irrelevantes, los cambios no surtirán efecto hasta que se restablezca el índice de contenido y se realice un rastreo completo de todo el contenido que incluye las palabras clave que ha quitado. Si agrega palabras al archivo de palabras irrelevantes, no será necesario realizar un rastreo completo de todo el contenido, ya que las palabras que acaba de agregar no se buscarán. No obstante, el tamaño del índice no disminuirá hasta que se realice un rastreo completo.

No elimine los archivos de palabras irrelevantes. Si no desea conservar las palabras irrelevantes que se han eliminado durante una actualización o una consulta, quite esas entradas específicas del archivo. Si elimina el archivo de palabras irrelevantes, también se eliminarán como palabras irrelevantes todos los caracteres únicos.

Edición de un archivo de palabras irrelevantes

Realice el siguiente procedimiento para editar un archivo de palabras irrelevantes.

Edición de un archivo de palabras irrelevantes

  1. Inicie el Bloc de notas y abra el archivo de palabras irrelevantes. Para obtener información sobre cómo buscar e identificar el archivo de palabras irrelevantes adecuado, vea la sección "Información sobre los archivos de palabras irrelevantes".

  2. Edite la lista de modo que incluya solamente las palabras que desee que sean ignoradas en una consulta de búsqueda.

  3. Guarde el archivo de palabras irrelevantes y cierre el Bloc de notas.

    Nota

    Cuando guarde un archivo de palabras irrelevantes modificado, use siempre el valor predeterminado de Codificación.

  4. Siga estos pasos para reiniciar el servicio Office SharePoint Server Search:

    1. Haga clic en Inicio, elija Herramientas administrativas y, a continuación, haga clic en Servicios.

    2. Haga clic con el botón secundario en Office SharePoint Server Search y, a continuación, haga clic en Reiniciar.

  5. Para que Search use los cambios realizados en el archivo de palabras irrelevantes, debe iniciar un rastreo completo del origen de contenido. Para obtener más información sobre cómo hacerlo, vea Inicio de un rastreo completo (Office SharePoint Server 2007).

Lista de archivos de palabras irrelevantes por idioma

Office SharePoint Server 2007 incluye archivos de palabras irrelevantes para los siguientes idiomas:

Idioma Nombre de archivo

Árabe

noiseara.txt

Bengalí

noiseben.txt

Búlgaro

noisebul.txt

Catalán

noisecat.txt

Chino (simplificado)

noisechs.txt

Chino (tradicional)

noisecht.txt

Croata

noisecro.txt

Danés

noisedan.txt

Neerlandés (Países Bajos)

noisenld.txt

Inglés (Reino Unido)

noiseeng.txt

Inglés (Estados Unidos)

noiseenu.txt

Finés

noisefin.txt

Francés

noisefra.txt

Alemán

noisedeu.txt

Griego

noisegrc.txt

Gujarati

noiseguj.txt

Hebreo

noiseheb.txt

Hindi

noisehin.txt

Islandés

noiseice.txt

Indonesio

noiseind.txt

Italiano

noiseita.txt

Japonés

noisejpn.txt

Canarés

noisekan.txt

Coreano

noisekor.txt

Letón

noiselat.txt

Lituano

noiselit.txt

Malayo

noisemal.txt

Malayalam

noisemly.txt

Marathi

noisemar.txt

Neutro

noiseneu.txt

Noruego (Bokmål)

noisenor.txt

Polaco

noiseplk.txt

Polaco

noisepol.txt

Portugués

noisepor.txt

Portugués (Brasil)

noiseptb.txt

Punyabí

noisepun.txt

Rumano

noiserom.txt

Ruso

noiserus.txt

Serbio (cirílico)

noisesbc.txt

Serbio (latino)

noisesbl.txt

Eslovaco

noisesvk.txt

Esloveno

noiseslo.txt

Español

noiseesn.txt

Sueco

noisesve.txt

Tamil

noisetam.txt

Telugu

noisetel.txt

Tailandés

noisetha.txt

Turco

noisetur.txt

Ucraniano

noiseurk.txt

Urdu (Pakistán)

noiseurd.txt