Grabación de muestras de voz para crear una voz personalizadaRecord voice samples to create a custom voice

Crear una voz personalizada con calidad de producción partiendo de cero no es una tarea ocasional.Creating a high-quality production custom voice from scratch is not a casual undertaking. El componente central de una voz personalizada es una gran colección de muestras de audio de voz humana.The central component of a custom voice is a large collection of audio samples of human speech. Es fundamental que estas grabaciones de audio sean de alta calidad.It's vital that these audio recordings be of high quality. Elija un actor de voz que tenga experiencia en esta clase de grabaciones y un ingeniero de grabación competente que las grabe con un equipo profesional.Choose a voice talent who has experience making these kinds of recordings, and have them recorded by a competent recording engineer using professional equipment.

No obstante, para poder realizar estas grabaciones, necesita un guion: las palabras que dirá el actor de voz para crear las muestras de audio.Before you can make these recordings, though, you need a script: the words that will be spoken by your voice talent to create the audio samples. Para obtener mejores resultados, el guion debe tener una buena cobertura fonética y variedad suficiente para entrenar el modelo de voz personalizada.For best results, your script must have good phonetic coverage and sufficient variety to train the custom voice model.

Muchos detalles pequeños pero importantes intervienen en la creación de una grabación de voz profesional.Many small but important details go into creating a professional voice recording. Esta guía es una guía básica de un proceso que le ayudará a obtener resultados buenos y uniformes.This guide is a roadmap for a process that will help you get good, consistent results.

Sugerencia

Para conseguir resultados de máxima calidad, considere la posibilidad de acudir a Microsoft para ayudar a desarrollar su voz personalizada.For the highest quality results, consider engaging Microsoft to help develop your custom voice. Microsoft posee una gran experiencia en producir voces de alta calidad para sus propios productos, como Cortana y Office.Microsoft has extensive experience producing high-quality voices for its own products, including Cortana and Office.

Roles de grabación de vozVoice recording roles

En un proyecto de grabación de voz personalizada hay cuatro roles básicos:There are four basic roles in a custom voice recording project:

RoleRole PropósitoPurpose
Actor de vozVoice talent La voz de esta persona constituirá la base de la voz personalizada.This person's voice will form the basis of the custom voice.
Ingeniero de grabaciónRecording engineer Supervisa los aspectos técnicos de la grabación y usa el equipo de grabación.Oversees the technical aspects of the recording and operates the recording equipment.
DirectorDirector Prepara el guion y prepara la sesión del actor de voz.Prepares the script and coaches the voice talent's performance.
EditorEditor Finaliza los archivos de audio y los prepara para la carga en el portal Custom Voice.Finalizes the audio files and prepares them for upload to the Custom Voice portal.

Un usuario individual puede desempeñar más de un rol.An individual may fill more than one role. En esta guía se da por hecho que desempeñará principalmente el papel de director y que contratará un actor de voz y un ingeniero de grabación.This guide assumes that you will be primarily filling the director role and hiring both a voice talent and a recording engineer. Si quiere realizar las grabaciones usted mismo, en este artículo se incluye alguna información sobre el rol de ingeniero de grabación.If you want to make the recordings yourself, this article includes some information about the recording engineer role. El rol de editor no es necesario hasta después de la sesión, por lo que puede realizarlo el director o el ingeniero de grabación.The editor role isn't needed until after the session, so can be performed by the director or the recording engineer.

Elección del actor de vozChoose your voice talent

Los actores con experiencia en voz en off o en poner voz a personajes serán unos buenos actores de voz personalizada.Actors with experience in voiceover or voice character work make good custom voice talent. También pueden desempeñar bien este rol presentadores y locutores.You can also often find suitable talent among announcers and newsreaders.

Elija un actor cuya voz natural le guste.Choose voice talent whose natural voice you like. Aunque se pueden crear voces de "personaje" únicas, para los actores de voz es mucho más difícil conseguir locuciones uniformes y el esfuerzo puede dar lugar a que fuercen la voz.It is possible to create unique "character" voices, but it's much harder for most talent to perform them consistently, and the effort can cause voice strain.

Sugerencia

Por lo general, evite usar voces reconocibles para crear una voz personalizada, a menos que, desde luego, el objetivo sea producir la voz de un famoso.Generally, avoid using recognizable voices to create a custom voice—unless, of course, your goal is to produce a celebrity voice. Las voces menos conocidas generan normalmente menos distracciones para los usuarios.Lesser-known voices are usually less distracting to users.

El único factor más importante para elegir el actor de voz es la uniformidad.The single most important factor for choosing voice talent is consistency. Las grabaciones deben sonar como que si se realizaran el mismo día en la misma sala.Your recordings should all sound like they were made on the same day in the same room. Puede aproximarse a este ideal con unas buenas prácticas y una buena ingeniería de grabación.You can approach this ideal through good recording practices and engineering.

Su actor de voz es la otra mitad de la ecuación.Your voice talent is the other half of the equation. Debe ser capaz de hablar a una velocidad, con un nivel de volumen y un tono uniformes.They must be able to speak with consistent rate, volume level, pitch, and tone. Es obligatorio una dicción clara.Clear diction is a must. El actor también debe ser capaz de controlar estrictamente la variación de su tono, el efecto emocional y los manierismos del habla.The talent also needs to be able to strictly control their pitch variation, emotional affect, and speech mannerisms.

La grabación de muestras de voz personalizada puede ser más fatigoso que otros trabajos de voz.Recording custom voice samples can be more fatiguing than other kinds of voice work. La mayoría de los actores de voz pueden grabar durante dos o tres horas al día.Most voice talent can record for two or three hours a day. Limite las sesiones a tres o cuatro a la semana, con un día de descanso entre medias si es posible.Limit sessions to three or four a week, with a day off in-between if possible.

Las grabaciones realizadas para un modelo de voz deben ser emocionalmente neutras.Recordings made for a voice model should be emotionally neutral. Es decir, un enunciado triste no debe leerse de forma triste.That is, a sad utterance should not be read in a sad way. El estado de ánimo se puede agregar a la voz sintetizada más adelante mediante controles de la prosodia.Mood can be added to the synthesized speech later through prosody controls. Trabaje con el actor de voz para desarrollar una "persona" que defina el sonido y el torno emocional general de la voz personalizada.Work with your voice talent to develop a "persona" that defines the overall sound and emotional tone of the custom voice. En el proceso, identificará lo que suena "neutro" para esa persona.In the process, you'll pinpoint what "neutral" sounds like for that persona.

Es posible que, por ejemplo, una persona tenga una personalidad animada por naturaleza.A persona might have, for example, a naturally upbeat personality. Por tanto, "su" voz puede transmitir una nota de optimismo incluso aunque hable de forma neutra.So "their" voice might carry a note of optimism even when they speak neutrally. Sin embargo, tal rasgo de personalidad debe ser sutil y uniforme.However, such a personality trait should be subtle and consistent. Escuche las lecturas de voces existentes para hacerse una idea de lo que busca.Listen to readings by existing voices to get an idea of what you're aiming for.

Sugerencia

Por lo general, querrá quedarse con las grabaciones de voz que realice.Usually, you'll want to own the voice recordings you make. Así que el actor de voz debe aceptar un contrato de trabajo a comisión para el proyecto.Your voice talent should be amenable to a work-for-hire contract for the project.

Creación de un guionCreate a script

El punto de partida de cualquier sesión de grabación de voz personalizada es el guion, que contiene los enunciados que dirá el actor de voz.The starting point of any custom voice recording session is the script, which contains the utterances to be spoken by your voice talent. (El término "enunciados" abarca tanto oraciones completas como frases más cortas).(The term "utterances" encompasses both full sentences and shorter phrases.)

Los enunciados del guion pueden proceder de cualquier parte: ficción, no ficción, transcripciones de voces, informes de noticias y cualquier cosa disponible en formato impreso.The utterances in your script can come from anywhere: fiction, non-fiction, transcripts of speeches, news reports, and anything else available in printed form. Si quiere asegurarse de que su voz funcione bien con clases de palabras específicas (como terminología médica o jerga de programación), podría incluir oraciones de trabajos académicos o documentos técnicos.If you want to make sure your voice does well on specific kinds of words (such as medical terminology or programming jargon), you might want to include sentences from scholarly papers or technical documents. Para obtener una breve descripción de los posibles problemas legales, vea la sección "Aspectos legales".For a brief discussion of potential legal issues, see the "Legalities" section. También puede escribir su propio texto.You can also write your own text.

Las expresiones no tienen que proceder de la misma fuente, o de la misma clase de fuente.Your utterances don't need to come from the same source, or the same kind of source. Incluso no es necesario que tengan nada que ver unos con otros.They don't even need to have anything to do with each other. Sin embargo, si va a usar frases hechas (por ejemplo, "Ha iniciado sesión correctamente") en la aplicación de voz, asegúrese de incluirlas en el guion.However, if you will use set phrases (for example, "You have successfully logged in") in your speech application, make sure to include them in your script. De esta forma, la voz personalizada tendrá una mejor oportunidad de pronunciar bien esas frases.This will give your custom voice a better chance of pronouncing those phrases well. Y si decide usar una grabación en lugar de voz sintetizada, ya la tendrá en la misma voz.And if you should decide to use a recording in place of synthesized speech, you'll already have it in the same voice.

Si bien la uniformidad es importante a la hora de elegir un actor de voz, la variedad es lo que distingue un buen guion.While consistency is key in choosing voice talent, variety is the hallmark of a good script. El guion debe incluir muchas palabras y frases diferentes con diversas longitudes de frase, estructuras y estados de ánimo.Your script should include many different words and sentences with a variety of sentence lengths, structures, and moods. Cada sonido del idioma se debe representar varias veces y en varios contextos (lo que se conoce como cobertura fonética).Every sound in the language should be represented multiple times and in numerous contexts (called phonetic coverage).

Además, el texto debe incorporar todas las formas en que puede representarse un sonido determinado al escribir, y colocar cada sonido en distintos lugares en las oraciones.Furthermore, the text should incorporate all the ways that a particular sound can be represented in writing, and place each sound at varying places in the sentences. Se deben incluir tanto oraciones afirmativas como preguntas y se deben leer con la entonación adecuada.Both declarative sentences and questions should be included and read with appropriate intonation.

Es difícil escribir un guion que proporcione suficientes datos para permitir que el portal Custom Speech genere una buena voz.It's difficult to write a script that provides just enough data to allow the Custom Speech portal to build a good voice. En la práctica, la manera más sencilla de crear un guion que logre una sólida cobertura fonética es incluir un gran número de muestras.In practice, the simplest way to make a script that achieves robust phonetic coverage is to include a large number of samples. Las voces estándar que proporciona Microsoft se han creado a partir de decenas de miles de expresiones.The standard voices that Microsoft provides were built from tens of thousands of utterances. Deberá estar preparado para grabar unos cuantos miles de expresiones para generar una voz personalizada con calidad de producción.You should be prepared to record a few to several thousand utterances at minimum to build a production-quality custom voice.

Compruebe el guion con mucho cuidado para detectar posibles errores.Check the script carefully for errors. Si es posible, que otra persona también lo revise.If possible, have someone else check it too. Cuando repase el guion con el actor de voz, es probable que detecte algunos errores más.When you run through the script with your talent, you'll probably catch a few more mistakes.

Formato del guionScript format

Puede escribir el guion en Microsoft Word.You can write your script in Microsoft Word. El guion se usará durante la sesión de grabación, así que puede prepararlo de forma que sea fácil trabajar con él.The script is for use during the recording session, so you can set it up any way you find easy to work with. Cree de forma independiente el archivo de texto necesario para el portal Custom Voice.Create the text file that's required by the Custom Voice portal separately.

Un formato de guion básico contiene tres columnas:A basic script format contains three columns:

  • El número del enunciado, empezando por el 1.The number of the utterance, starting at 1. La numeración permite que todas las personas del estudio puedan consultar una expresión concreta ("probemos de nuevo el número 356").Numbering makes it easy for everyone in the studio to refer to a particular utterance ("let's try number 356 again"). Puede usar la característica de numeración de párrafos de Word para numerar las filas de la tabla de forma automática.You can use the Word paragraph numbering feature to number the rows of the table automatically.
  • Una columna en blanco donde escribirá el número de toma o el código de tiempo de cada expresión para ayudarle a encontrarla en la grabación finalizada.A blank column where you'll write the take number or time code of each utterance to help you find it in the finished recording.
  • El propio texto del enunciado.The text of the utterance itself.

Script de ejemplo

Nota

La mayoría de los estudios graban en segmentos cortos conocidos como tomas.Most studios record in short segments known as takes. Cada toma contiene normalmente de 10 a 24 expresiones.Each take typically contains 10 to 24 utterances. Basta con anotar el número de toma para después poder encontrar una expresión.Just noting the take number is sufficient to find an utterance later. Si graba en un estudio que prefiere realizar grabaciones más largas, querrá anotar entonces el código de tiempo.If you're recording in a studio that prefers to make longer recordings, you'll want to note the time code instead. El estudio tendrá una gran pantalla de tiempo.The studio will have a prominent time display.

Deje suficiente espacio después de cada fila para escribir notas.Leave enough space after each row to write notes. Asegúrese de que ningún enunciado se divida entre páginas.Be sure that no utterance is split between pages. Numere las páginas e imprima el guion en una de las caras del papel.Number the pages, and print your script on one side of the paper.

Imprima tres copias del guion: una para el actor de voz, otra para el ingeniero y la última para el director (usted).Print three copies of the script: one for the talent, one for the engineer, and one for the director (you). Use un clip de papel en lugar de grapas: un actor de voz experimentado separará las páginas para evitar hacer ruido cuando se hojean.Use a paper clip instead of staples: an experienced voice artist will separate the pages to avoid making noise as the pages are turned.

Aspectos legalesLegalities

Según la ley de derechos de autor, la lectura de texto protegido por derechos de autor por parte de un actor podría ser una representación por la que el autor de la obra debería ser compensado.Under copyright law, an actor's reading of copyrighted text might be a performance for which the author of the work should be compensated. Esta representación no será reconocible en el producto final, la voz personalizada.This performance will not be recognizable in the final product, the custom voice. Aun así, la legalidad del uso de una obra protegida por derechos de autor con esta finalidad no está bien establecida.Even so, the legality of using a copyrighted work for this purpose is not well established. Microsoft no puede proporcionar asesoramiento legal sobre este problema; consulte a su asesor.Microsoft cannot provide legal advice on this issue; consult your own counsel.

Afortunadamente, es posible evitar estos problemas por completo.Fortunately, it is possible to avoid these issues entirely. Hay muchas fuentes de texto que puede usar sin licencia o permiso.There are many sources of text you can use without permission or license.

Fuente de textoText source DESCRIPCIÓNDescription
Corpus CMU ArcticCMU Arctic corpus Aproximadamente 1100 oraciones seleccionadas de obras protegidas por derechos de autor para su uso especialmente en proyectos de síntesis de voz.About 1100 sentences selected from out-of-copyright works specifically for use in speech synthesis projects. Un excelente punto de partida.An excellent starting point.
Obras que ya noWorks no longer
están protegidas por derechos de autorunder copyright
Normalmente las obras publicadas antes de 1923.Typically works published prior to 1923. En inglés, el proyecto Gutenberg ofrece miles de obras de este tipo.For English, Project Gutenberg offers tens of thousands of such works. Quizás quiera centrarse en obras más modernas, dado que el lenguaje estará más próximo al inglés moderno.You may want to focus on newer works, as the language will be closer to modern English.
Obras del gobierno  Government works Las obras creadas por el gobierno de los Estados Unidos no están protegidas por derechos de autor en los Estados Unidos, aunque es posible que el gobierno reclame derechos de autor en otros países o regiones.Works created by the United States government are not copyrighted in the United States, though the government may claim copyright in other countries/regions.
Dominio públicoPublic domain Obras en las que se ha renunciado explícitamente a los derechos de autor o que se han destinado al dominio público.Works for which copyright has been explicitly disclaimed or that have been dedicated to the public domain. Puede que en algunas jurisdicciones no sea posible renunciar totalmente a los derechos de autor.It may not be possible to waive copyright entirely in some jurisdictions.
Obras con licencia permisivaPermissively-licensed works Obras distribuidas con una licencia como Creative Commons o la licencia de documentación libre de GNU (GFDL).Works distributed under a license like Creative Commons or the GNU Free Documentation License (GFDL). La Wikipedia usa la GFDL.Wikipedia uses the GFDL. Algunas licencias, sin embargo, pueden imponer restricciones sobre la representación del contenido con licencia que pueden afectar a la creación de un modelo de voz personalizada, así que lea la licencia detenidamente.Some licenses, however, may impose restrictions on performance of the licensed content that may impact the creation of a custom voice model, so read the license carefully.

Grabación del guionRecording your script

Grabe el guion en un estudio de grabación profesional especializado en trabajos de voz.Record your script at a professional recording studio that specializes in voice work. Dispondrá de una cabina de grabación, el equipo adecuado y las personas adecuadas correctas utilizarlo.They'll have a recording booth, the right equipment, and the right people to operate it. Vale la pena no escatimar en la grabación.It pays not to skimp on recording.

Revise el proyecto con el ingeniero de grabación del estudio y escuche sus consejos.Discuss your project with the studio's recording engineer and listen to their advice. La grabación debe tener poca o ninguna compresión de rango dinámico (máximo 4:1).The recording should have little or no dynamic range compression (maximum of 4:1). Es esencial que el audio tenga un volumen uniforme y una elevada relación señal-ruido, y que esté libre de sonidos no deseados.It is critical that the audio have consistent volume and a high signal-to-noise ratio, while being free of unwanted sounds.

Hágalo usted mismoDo it yourself

Si quiere hacer la grabación por su cuenta y riesgo, en lugar de meterse en un estudio de grabación, este es un manual básico breve.If you want to make the recording yourself, rather than going into a recording studio, here's a short primer. Gracias al aumento de la grabación doméstica y la distribución de archivos multimedia, resulta más fácil que nunca encontrar buena información y recursos de grabación en Internet.Thanks to the rise of home recording and podcasting, it's easier than ever to find good recording advice and resources online.

La "cabina de grabación" debe ser una habitación pequeña sin eco apreciable o "tono de la sala".Your "recording booth" should be a small room with no noticeable echo or "room tone." Debe ser lo más silenciosa e insonorizada posible.It should be as quiet and soundproof as possible. Se pueden usar cortinas en las paredes para reducir el eco y neutralizar o "amortiguar" el sonido de la habitación.Drapes on the walls can be used to reduce echo and neutralize or "deaden" the sound of the room.

Use un micrófono de condensador de estudio de alta calidad diseñado para la grabación de voz.Use a high-quality studio condenser microphone ("mic" for short) intended for recording voice. Sennheiser, AKG e incluso los recientes micrófonos Zoom pueden producir buenos resultados.Sennheiser, AKG, and even newer Zoom mics can yield good results. Puede comprar un micrófono o alquilar uno en una empresa de alquiler de equipo audiovisual.You can buy a mic, or rent one from a local audio-visual rental firm. Busque uno con una interfaz USB.Look for one with a USB interface. Este tipo de micrófono combina de forma práctica el elemento de micrófono, el preamplificador y el convertidor analógico-digital en un paquete, lo que simplifica la conexión.This type of mic conveniently combines the microphone element, preamp, and analog-to-digital converter into one package, simplifying hookup.

También puede usar un micrófono analógico.You may also use an analog microphone. Muchas de las empresas de alquiler ofrecen micrófonos "vintage" reconocidos por sus personajes de voz.Many rental houses offer "vintage" microphones renowned for their voice character. Tenga en cuenta que el equipo analógico profesional usa conectores XLR balanceados, en lugar del conector de 1/4" que se usa en los equipos de consumo.Note that professional analog gear uses balanced XLR connectors, rather than the 1/4-inch plug that's used in consumer equipment. Si se decide por el analógico, también necesitará un preamplificador y una interfaz de audio de equipo informático con estos conectores.If you go analog, you'll also need a preamp and a computer audio interface with these connectors.

Coloque el micrófono en un pie o soporte tipo jirafa e instale un filtro contra chasquidos para eliminar el ruido de las consonantes oclusivas, como la "p" y la "b".Install the microphone on a stand or boom, and install a pop filter in front of the microphone to eliminate noise from "plosive" consonants like "p" and "b." Algunos micrófonos incorporan un montaje de suspensión que los aísla de las vibraciones del pie, lo que es útil.Some microphones come with a suspension mount that isolates them from vibrations in the stand, which is helpful.

El actor de voz debe permanecer a una distancia constante del micrófono.The voice talent must stay at a consistent distance from the microphone. Use cinta en el suelo para marcar dónde se debe colocar.Use tape on the floor to mark where they should stand. Si el actor prefiere sentarse, tenga especial cuidado para controlar la distancia al micrófono y evitar el ruido de la silla.If the talent prefers to sit, take special care to monitor mic distance and avoid chair noise.

Use un atril para sostener el guion.Use a stand to hold the script. Evite inclinar el atril para que pueda reflejar el sonido hacia el micrófono.Avoid angling the stand so that it can reflect sound toward the microphone.

La persona que use el equipo de grabación, el ingeniero, debe estar en una habitación distinta de la del actor, con algún medio para comunicarse con él en la cabina de grabación (un circuito de radio).The person operating the recording equipment—the engineer—should be in a separate room from the talent, with some way to talk to the talent in the recording booth (a talkback circuit).

La grabación debe contener el menor ruido posible; el objetivo es una relación señal-ruido de 80 db o superior.The recording should contain as little noise as possible, with a goal of an 80-db signal-to-noise ratio or better.

Escuche con atención la grabación de silencio en la cabina, averigüe de dónde proceden los ruidos y elimine la causa.Listen closely to a recording of silence in your "booth," figure out where any noise is coming from, and eliminate the cause. Las fuentes habituales de ruido son los conductos de ventilación, los balastros de tubos fluorescentes, el tráfico de carreteras cercanas y los ventiladores de los equipos (incluso los portátiles pueden tener ventiladores).Common sources of noise are air vents, fluorescent light ballasts, traffic on nearby roads, and equipment fans (even notebook PCs might have fans). Los micrófonos y cables pueden captar el ruido eléctrico de los cables cercanos de CA, normalmente un zumbido o murmullo.Microphones and cables can pick up electrical noise from nearby AC wiring, usually a hum or buzz. Un zumbido también se puede producir por un bucle de tierra, que se genera al conectar un equipo a más de un circuito eléctrico.A buzz can also be caused by a ground loop, which is caused by having equipment plugged into more than one electrical circuit.

Sugerencia

En algunos casos, es posible usar un ecualizador o un complemento de software de reducción de ruido para ayudar a eliminar el ruido de las grabaciones, aunque siempre es mejor detenerlo en el origen.In some cases, you might be able to use an equalizer or a noise reduction software plug-in to help remove noise from your recordings, although it is always best to stop it at its source.

Establezca los niveles de manera que la mayoría del intervalo dinámico de grabación digital disponible se use sin sobremodulación.Set levels so that most of the available dynamic range of digital recording is used without overdriving. Esto significa establecer un nivel de audio alto, pero sin que distorsione.That means set the audio loud, but not so loud that it becomes distorted. En la imagen siguiente se muestra un ejemplo de la forma de onda de una grabación correcta:An example of the waveform of a good recording is shown in the following image:

Forma de onda de una grabación correcta

Aquí, se usa la mayor parte del rango (alto), pero los picos más altos de la señal no llegan a la parte superior o inferior de la ventana.Here, most of the range (height) is used, but the highest peaks of the signal do not reach the top or bottom of the window. También puede ver que el silencio en la grabación se aproxima a una línea horizontal fina, que indica un ruido de fondo bajo.You can also see that the silence in the recording approximates a thin horizontal line, indicating a low noise floor. Esta grabación tiene un rango dinámico y una relación señal-ruido aceptables.This recording has acceptable dynamic range and signal-to-noise ratio.

Grabe directamente en el equipo informático mediante una interfaz de audio de alta calidad o un puerto USB, según el micrófono que vaya a usar.Record directly into the computer via a high-quality audio interface or a USB port, depending on the mic you're using. Si es analógico, use lo básico: micrófono, preamplificador, interfaz de audio, equipo informático.For analog, keep the audio chain simple: mic, preamp, audio interface, computer. Tanto Avid Pro Tools como Adobe Audition se pueden usar con licencia mensual por un módico precio.You can license both Avid Pro Tools and Adobe Audition monthly at a reasonable cost. Si su presupuesto es muy reducido, pruebe la aplicación gratuita Audacity.If your budget is extremely tight, try the free Audacity.

Grabe con sonido monofónico de 16 bits a 44,1 kHz (calidad de CD) o mejor.Record at 44.1 kHz 16 bit monophonic (CD quality) or better. El más moderno actualmente es 24 bits a 48 kHz, si el equipo lo admite.Current state-of-the-art is 48 kHz 24-bit, if your equipment supports it. La calidad del audio se reduce a 16 bits a 16 kHz antes de enviarlo al portal Custom Voice.You will down-sample your audio to 16 kHz 16-bit before you submit it to the Custom Voice portal. Aun así, vale la pena tener una grabación original de alta calidad en caso de que sea necesario realizar modificaciones.Still, it pays to have a high-quality original recording in the event edits are needed.

Lo ideal es tener distintas personas en los roles de director, ingeniero y actor.Ideally, have different people serve in the roles of director, engineer, and talent. No intente hacerlo todo usted mismo.Don't try to do it all yourself. En caso de emergencia, la misma persona puede ser el director y el ingeniero.In a pinch, one person can be both the director and the engineer.

Antes de la sesiónBefore the session

Para evitar perder tiempo en el estudio, repase el guion con el actor antes de la sesión de grabación.To avoid wasting studio time, run through the script with your voice talent before the recording session. Mientras el actor se familiariza con el texto, puede resolver dudas con la pronunciación de palabras que no resulten muy conocidas.While the voice talent becomes familiar with the text, they can clarify the pronunciation of any unfamiliar words.

Nota

La mayoría de los estudios de grabación ofrecen una pantalla electrónica de guiones en la cabina de grabación.Most recording studios offer electronic display of scripts in the recording booth. En este caso, escriba las notas de revisión directamente en el documento del guion.In this case, type your run-through notes directly into the script's document. También puede querer una copia en papel para tomar notas durante la sesión.You'll still want a paper copy to take notes on during the session, though. La mayoría de los ingenieros también querrán una copia en papel.Most engineers will want a hard copy, too. Y la tercera copia impresa servirá como respaldo para el actor en caso de que el equipo informático no funcione.And you'll still want a third printed copy as a backup for the talent in case the computer is down.

Es posible que el actor de voz pregunte qué palabra quiere enfatizar en una expresión (la "palabra operativa").Your voice talent might ask which word you want emphasized in an utterance (the "operative word"). Indíquele que desea una lectura natural sin ningún énfasis en particular.Tell them that you want a natural reading with no particular emphasis. El énfasis se puede agregar cuando se sintetice la voz; no debe formar parte de la grabación original.Emphasis can be added when speech is synthesized; it should not be a part of the original recording.

Indique el actor que pronuncie las palabras claramente.Direct the talent to pronounce words distinctly. Cada palabra del guion se debe pronunciar tal y como se escribe.Every word of the script should be pronounced as written. Los sonidos no se deben omitir ni arrastrar juntos, como es habitual en el habla informal, a menos que se hayan escrito de esa manera en el guion.Sounds should not be omitted or slurred together, as is common in casual speech, unless they have been written that way in the script.

Texto escritoWritten text Pronunciación informal no deseadaUnwanted casual pronunciation
me has dejado heladonever going to give you up mehas dejao helaonever gonna give you up
le dijeron que estaba muy guapathere are four lights le dijeron queestaba mu guapathere're four lights
la ciudad de Madridhow's the weather today la ciuda de Madrihow's th' weather today
estoy cansadosay hello to my little friend estoy cansaosay hello to my lil' friend

El actor no debe agregar pausas claras entre las palabras.The talent should not add distinct pauses between words. La frase debe fluir naturalmente, aunque suene un poco formal.The sentence should still flow naturally, even while sounding a little formal. Es posible que se necesite práctica para que esta distinción fina salga bien.This fine distinction might take practice to get right.

La sesión de grabaciónThe recording session

Al comienzo de la sesión, cree una grabación de referencia, o archivo de ajuste, de un enunciado típico.Create a reference recording, or match file, of a typical utterance at the beginning of the session. Pida al actor que repita esta línea cada página o página y media.Ask the talent to repeat this line every page or so. Cada vez, compare la nueva grabación con la referencia.Each time, compare the new recording to the reference. Esta práctica ayuda al actor a mantenerse en un volumen, tono y entonación constantes.This practice helps the talent remain consistent in volume, tempo, pitch, and intonation. Mientras tanto, el ingeniero puede usar el archivo de ajuste como referencia para los niveles y la uniformidad general del sonido.Meanwhile, the engineer can use the match file as a reference for levels and overall consistency of sound.

El archivo de ajuste es especialmente importante cuando se reanuda la grabación tras un descanso, u otro día.The match file is especially important when you resume recording after a break or on another day. Lo reproducirá varias veces para el actor y le hará repetirlo cada vez hasta que la coincidencia sea perfecta.You'll want to play it a few times for the talent and have them repeat it each time until they are matching well.

Entrene a su actor para respirar profundamente y hacer una pausa durante un momento antes de cada enunciado.Coach your talent to take a deep breath and pause for a moment before each utterance. Grabe un par de segundos de silencio entre enunciados.Record a couple of seconds of silence between utterances. Las palabras se deben pronunciar de la misma manera cada vez que aparezcan, en función del contexto.Words should be pronounced the same way each time they appear, considering context. Es importante mantener la coherencia en la pronunciación y en la entonación de las palabras.For example, "record" as a verb is pronounced differently from "record" as a noun.

Grabe un buen silencio de cinco segundos antes de la primera grabación para capturar el "tono de la sala"Record a good five seconds of silence before the first recording to capture the "room tone." Esta práctica ayuda al portal Custom Voice a compensar cualquier rastro de ruido que pueda quedar en las grabaciones.This practice helps the Custom Voice portal compensate for any remaining noise in the recordings.

Sugerencia

Lo que realmente necesita es captar al actor de voz, por lo que puede hacer una grabación monofónica (un solo canal) de esas líneas concretas.All you really need to capture is the voice talent, so you can make a monophonic (single-channel) recording of just their lines. Sin embargo, si graba en estéreo, puede usar el segundo canal para grabar la charla en la sala de control y capturar los comentarios de líneas o cortes determinados.However, if you record in stereo, you can use the second channel to record the chatter in the control room to capture discussion of particular lines or takes. Quite esta pista de la versión que se carga en el portal Custom Voice.Remove this track from the version that's uploaded to the Custom Voice portal.

Use auriculares para escuchar con atención la representación del actor de voz.Listen closely, using headphones, to the voice talent's performance. Lo que busca es una dicción buena pero natural, una pronunciación correcta y ausencia de sonidos no deseados.You're looking for good but natural diction, correct pronunciation, and a lack of unwanted sounds. No dude en pedir al actor que vuelva a grabar un enunciado que no satisfaga estas normas.Don't hesitate to ask your talent to re-record an utterance that doesn't meet these standards.

Sugerencia

Cuando se usa un volumen elevado de expresiones, una sola de ellas podría no tener un efecto apreciable sobre la voz personalizada resultante.If you are using a large number of utterances, a single utterance might not have a noticeable effect on the resultant custom voice. Es posible que sea más adecuado anotar simplemente las expresiones con problemas, excluirlas del conjunto de datos y ver el resultado de la voz personalizada. Siempre puede volver al estudio y grabar las muestras que faltan más tarde.It might be more expedient to simply note any utterances with issues, exclude them from your dataset, and see how your custom voice turns out. You can always go back to the studio and record the missed samples later.

Anote en el guion el número de toma o código de tiempo de cada expresión.Note the take number or time code on your script for each utterance. Pídale también al ingeniero que marque todas las expresiones en los metadatos de la grabación o en la hoja de pistas.Ask the engineer to mark each utterance in the recording's metadata or cue sheet as well.

Haga pausas cada cierto tiempo y ofrezca bebidas para ayudar a mantener la voz del actor en buen estado.Take regular breaks and provide a beverage to help your voice talent keep their voice in good shape.

Después de la sesiónAfter the session

Los estudios de grabación modernos funcionan en equipos informáticos.Modern recording studios run on computers. Al final de la sesión, recibirá uno o varios archivos de audio, no una cinta.At the end of the session, you receive one or more audio files, not a tape. Estos archivos tendrán probablemente el formato WAV o AIFF en calidad de CD (16 bits a 44,1 kHz) o superior.These files will probably be WAV or AIFF format in CD quality (44.1 kHz 16-bit) or better. 24 bits a 48 kHz es lo habitual y deseable.48 kHz 24-bit is common and desirable. Por lo general, no se necesitan velocidades de muestreo más altas, como 96 kHz.Higher sampling rates, such as 96 kHz, are generally not needed.

El portal Custom Voice exige que cada enunciado se proporcione en su propio archivo.The Custom Voice portal requires each provided utterance to be in its own file. Los archivos de audio entregados por el estudio contienen varias expresiones.Each audio file delivered by the studio contains multiple utterances. Así que la principal tarea de posproducción es separar las grabaciones y prepararlas para su envío.So the primary post-production task is to split up the recordings and prepare them for submission. Es posible que el ingeniero de grabación haya colocado marcadores en el archivo (o proporcionado una lista de pistas independiente) para indicar dónde comienza cada expresión.The recording engineer might have placed markers in the file (or provided a separate cue sheet) to indicate where each utterance starts.

Use sus notas para encontrar exactamente los cortes que quiera y, después, use una utilidad de edición de sonido, como Avid Pro Tools, Adobe Audition, o la aplicación gratuita Audacity para copiar las expresiones en un archivo nuevo.Use your notes to find the exact takes you want, and then use a sound editing utility, such as Avid Pro Tools, Adobe Audition, or the free Audacity, to copy each utterance into a new file.

Deje solamente unos 0,2 segundos de silencio al principio y al final de cada clip, excepto para el primero.Leave only about 0.2 seconds of silence at the beginning and end of each clip, except for the first. Ese archivo debe empezar con cinco segundos completos de silencio.That file should start with a full five seconds of silence. No use un editor de audio para "poner a cero" las partes de silencio del archivo.Do not use an audio editor to "zero out" silent parts of the file. Incluir el "tono de la sala" ayudará a los algoritmos de Custom Voice a compensar los ruidos de fondo que hayan podido quedar.Including the "room tone" will help the Custom Voice algorithms compensate for any residual background noise.

Escuche atentamente cada archivo.Listen to each file carefully. En esta fase, puede editar pequeños sonidos no deseados que pasó por alto durante la grabación, como ligeros ruidos con los labios antes de una línea, pero tenga cuidado de no quitar la voz real.At this stage, you can edit out small unwanted sounds that you missed during recording, like a slight lip smack before a line, but be careful not to remove any actual speech. Si no puede corregir un archivo, elimínelo del conjunto de datos y tome nota de que lo ha hecho.If you can't fix a file, remove it from your dataset and note that you have done so.

Convierta todos los archivos a 16 bits y una velocidad de muestreo de 16 kHz antes de guardar y, si graba la charla del estudio, quite el segundo canal.Convert each file to 16 bits and a sample rate of 16 kHz before saving and, if you recorded the studio chatter, remove the second channel. Guarde cada archivo en formato WAV y nombre los archivos con el número de enunciado del guion.Save each file in WAV format, naming the files with the utterance number from your script.

Por último, cree la transcripción que asocia cada archivo WAV con una versión de texto del enunciado correspondiente.Finally, create the transcript that associates each WAV file with a text version of the corresponding utterance. En Crear fuentes de voz personalizada se incluye información detallada del formato requerido.Creating custom voice fonts includes details of the required format. Puede copiar el texto directamente del guion.You can copy the text directly from your script. Después, cree un archivo ZIP de los archivos WAV y de la transcripción de texto.Then create a Zip file of the WAV files and the text transcript.

Archive las grabaciones originales en un lugar seguro en caso de que las necesite más adelante.Archive the original recordings in a safe place in case you need them later. También, conserve el guion y las notas.Preserve your script and notes, too.

Pasos siguientesNext steps

Está listo para cargar las grabaciones y crear la voz personalizada.You're ready to upload your recordings and create your custom voice.