تسجيل عينات صوتية لإنشاء صوت عصبي مخصص احترافي

توفر لك هذه المقالة إرشادات حول إعداد عينات صوتية عالية الجودة لإنشاء نموذج صوت احترافي باستخدام مشروع Pro الصوت العصبي المخصص.

ملاحظة

راجع أنواع مشاريع الصوت العصبي المخصص للحصول على معلومات حول القدرات والمتطلبات والاختلافات بين مشاريع الصوت العصبي المخصص Pro الصوت العصبي المخصص.

إن إنشاء صوت عصبي مخصص عالي الجودة من الصفر ليس مهمة غير رسمية. المكون المركزي للصوت العصبي المخصص هو مجموعة كبيرة من العينات الصوتية للكلام البشري. من الضروري أن تكون هذه التسجيلات الصوتية ذات جودة عالية. اختر موهبة صوتية لديها خبرة في صنع هذه الأنواع من التسجيلات ، وقم بتسجيلها من قبل مهندس تسجيل باستخدام معدات احترافية.

قبل أن تتمكن من إجراء هذه التسجيلات ، تحتاج إلى برنامج نصي: الكلمات التي ستنطق بها موهبتك الصوتية لإنشاء عينات صوتية.

العديد من التفاصيل الصغيرة ولكنها مهمة تدخل في إنشاء تسجيل صوتي احترافي. هذا الدليل هو خارطة طريق لعملية من شأنها أن تساعدك على الحصول على نتائج جيدة ومتسقة.

أدوار التسجيل الصوتي

هناك أربعة أدوار أساسية في مشروع تسجيل صوتي عصبي مخصص:

الدور الغرض
موهبة صوتية سيشكل صوت هذا الشخص أساس الصوت العصبي المخصص.
مهندس تسجيل يشرف على الجوانب التقنية للتسجيل ويشغل معدات التسجيل.
مدير يعد السيناريو ويدرب أداء المواهب الصوتية.
المحرر يضع اللمسات الأخيرة على الملفات الصوتية ويعيدها للتحميل إلى Speech Studio

قد يشغل الفرد أكثر من دور واحد. يفترض هذا الدليل أنك ستملأ دور المخرج في المقام الأول وتوظف موهبة صوتية ومهندس تسجيل. إذا كنت ترغب في إجراء التسجيلات بنفسك، تتضمن هذه المقالة بعض المعلومات حول دور مهندس التسجيل. لا حاجة إلى دور المحرر إلا بعد الجلسة ، لذلك يمكن أن يؤديه المخرج أو مهندس التسجيل.

اختر موهبتك الصوتية

الممثلون ذوو الخبرة في التعليق الصوتي أو عمل الشخصيات الصوتية يصنعون موهبة صوتية عصبية مخصصة جيدة. يمكنك أيضا في كثير من الأحيان العثور على المواهب المناسبة بين المذيعين وقراء الأخبار. اختر موهبة الصوت التي يعجبك صوتها الطبيعي. من الممكن إنشاء أصوات "شخصية" فريدة من نوعها ، ولكن من الصعب جدا على معظم المواهب أدائها باستمرار ، ويمكن أن يسبب الجهد إجهادا صوتيا. العامل الوحيد الأكثر أهمية لاختيار المواهب الصوتية هو الاتساق. يجب أن تبدو جميع التسجيلات الخاصة بك لنفس نمط الصوت وكأنها تم إجراؤها في نفس اليوم في نفس الغرفة. يمكنك التعامل مع هذا المثل الأعلى من خلال ممارسات التسجيل الجيدة والهندسة.

موهبتك الصوتية هي النصف الآخر من المعادلة. يجب أن يكونوا قادرين على التحدث بمعدل ثابت ومستوى الصوت ودرجة الصوت والنغمة. الإملاء الواضح أمر لا بد منه. تحتاج الموهبة أيضا إلى أن تكون قادرة على التحكم الصارم في تباين الملعب ، والتأثير العاطفي ، وسلوكيات الكلام. يمكن أن يكون تسجيل عينات الصوت أكثر إرهاقا من الأنواع الأخرى من العمل الصوتي. يمكن لمعظم المواهب الصوتية التسجيل لمدة ساعتين أو ثلاث ساعات في اليوم. قلل من الجلسات إلى ثلاث أو أربع جلسات في الأسبوع ، مع يوم عطلة بينهما إن أمكن.

اعمل مع موهبتك الصوتية لتطوير "شخصية" تحدد الصوت العام والنغمة العاطفية للصوت العصبي المخصص. في هذه العملية ، ستحدد ما يبدو عليه "المحايد" لتلك الشخصية. باستخدام إمكانية الصوت العصبي المخصص ، يمكنك تدريب نموذج يتحدث مع العواطف. حدد "أساليب التحدث" واطلب من موهبتك الصوتية قراءة البرنامج النصي بطريقة تردد صدى الأنماط التي تريدها.

قد يكون للشخصية ، على سبيل المثال ، شخصية متفائلة بشكل طبيعي. لذلك قد يحمل صوتهم "هم" ملاحظة من التفاؤل حتى عندما يتحدثون بحيادية. ومع ذلك ، يجب أن تكون هذه السمة الشخصية خفية ومتسقة. استمع إلى قراءات الأصوات الموجودة للحصول على فكرة عما تهدف إليه.

تلميح

عادة ، ستحتاج إلى امتلاك التسجيلات الصوتية التي تقوم بها. يجب أن تكون موهبتك الصوتية قابلة لعقد العمل مقابل الإيجار للمشروع.

إنشاء برنامج نصي

نقطة البداية لأي جلسة تسجيل صوتي عصبي مخصصة هي البرنامج النصي ، الذي يحتوي على الألفاظ التي يجب أن تحدثها موهبتك الصوتية. يشمل مصطلح "الأقوال" كلا من الجمل الكاملة والعبارات القصيرة. يتطلب بناء صوت عصبي مخصص ما لا يقل عن 300 نطق مسجل كبيانات تدريب.

يمكن أن تأتي الأقوال في السيناريو الخاص بك من أي مكان: خيالية وغير خيالية ونصوص الخطب والتقارير الإخبارية وأي شيء آخر متاح في شكل مطبوع. إذا كنت ترغب في التأكد من أن صوتك يعمل بشكل جيد على أنواع محددة من الكلمات (مثل المصطلحات الطبية أو مصطلحات البرمجة) ، فقد ترغب في تضمين جمل من الأوراق العلمية أو المستندات التقنية. للاطلاع على مناقشة موجزة للقضايا القانونية المحتملة، راجع قسم "الجوانب القانونية ". يمكنك أيضا كتابة النص الخاص بك.

لا يجب أن تأتي كلماتك من نفس المصدر أو من نفس النوع من المصدر. لا يحتاجون حتى إلى أن يكون لهم أي علاقة ببعضهم البعض. ومع ذلك، إذا كنت ستستخدم عبارات محددة (على سبيل المثال، "لقد قمت بتسجيل الدخول بنجاح") في تطبيق الكلام، فتأكد من تضمينها في البرنامج النصي. سيعطي صوتك العصبي المخصص فرصة أفضل لنطق هذه العبارات بشكل جيد.

نوصي بأن تتضمن البرامج النصية للتسجيل كلا من الجمل العامة والجمل الخاصة بالمجال. على سبيل المثال ، إذا كنت تخطط لتسجيل 2000 جملة ، فقد تكون 1000 منها جمل عامة ، ويمكن أن تكون 1000 جملة أخرى منها عبارة عن جمل من نطاقك المستهدف أو حالة استخدام تطبيقك.

نحن نقدم نماذج من البرامج النصية في نطاقات "عام" و "دردشة" و "خدمة العملاء" لكل لغة لمساعدتك في إعداد نصوص التسجيل الخاصة بك. يمكنك استخدام هذه البرامج النصية المشتركة من Microsoft للتسجيلات الخاصة بك مباشرة أو استخدامها كمرجع لإنشاء تسجيلاتك الخاصة.

يمكنك تحديد البرامج النصية الخاصة بنطاقك من الجمل التي سيتم استخدام صوتك العصبي المخصص لقراءتها.

معايير اختيار البرنامج النصي

فيما يلي بعض الإرشادات العامة التي يمكنك اتباعها لإنشاء مجموعة جيدة (عينات صوتية مسجلة) للتدريب الصوتي العصبي المخصص.

  • قم بموازنة البرنامج النصي الخاص بك لتغطية أنواع الجمل المختلفة في نطاقك بما في ذلك العبارات والأسئلة والتعجب والجمل الطويلة والجمل القصيرة.

    بشكل عام ، يجب أن تحتوي كل جملة على 4 كلمات إلى 30 كلمة. من الضروري عدم تضمين أي جمل مكررة في البرنامج النصي.
    لمعرفة كيفية تحقيق التوازن بين أنواع الجمل المختلفة، راجع الجدول التالي.

    أنواع الجمل التغطية
    جمل البيان جمل البيان هي الجزء الرئيسي من البرنامج النصي ، حيث تأخذ حوالي 70-80٪ من المجموع.
    جمل الأسئلة يجب أن تستحوذ جمل الأسئلة على حوالي 10٪ -20٪ من البرنامج النصي لنطاقك ، بما في ذلك 5٪ -10٪ من الارتفاع و 5٪ -10٪ من النغمات المنخفضة.
    جمل التعجب يجب أن تستغرق جمل التعجب حوالي 10٪ -20٪ من البرامج النصية الخاصة بك.
    كلمة / عبارة قصيرة يجب أن تأخذ نصوص الكلمات القصيرة / العبارات أيضا حوالي 10٪ من إجمالي الألفاظ ، مع 5 إلى 7 كلمات لكل حالة.

    ملاحظة

    فيما يتعلق بالكلمة / العبارة القصيرة ، فهذا يعني في الواقع أنه يجب تضمين كلمات أو عبارات مفردة وفصلها بفاصلة. يساعد موهبة الصوت على التوقف لفترة وجيزة عند الفاصلة عند قراءة البرامج النصية.

    وتشمل أفضل الممارسات ما يلي:

    • تغطية متوازنة لجزء من الكلام ، مثل الفعل والاسم والصفة وما إلى ذلك.
    • تغطية متوازنة للنطق. قم بتضمين جميع الحروف من الألف إلى الياء حتى يتعلم محرك تحويل النص إلى كلام كيفية نطق كل حرف بأسلوبك المحدد.
    • مقروءة ومفهومة ومنطقية للمتحدث لقراءتها.
    • تجنب الكثير من الأنماط المتشابهة للكلمة / العبارة ، مثل "سهل" و "أسهل".
    • قم بتضمين تنسيق مختلف من الأرقام: العنوان والوحدة والهاتف والكمية والتاريخ وما إلى ذلك ، في جميع أنواع الجمل.
    • قم بتضمين جمل إملائية إذا كان ذلك شيئا سيتم استخدام صوتك العصبي المخصص لقراءته. على سبيل المثال ، "Spell of Apple هو A P P L E".
  • لا تضع جمل متعددة في سطر واحد / كلام واحد. افصل كل سطر حسب الأقوال.

  • تأكد من أن الجملة نظيفة في الغالب. بشكل عام ، لا تقم بتضمين الكثير من الكلمات غير القياسية مثل الأرقام أو الاختصارات لأنها عادة ما تكون صعبة القراءة. قد تحتاج بعض التطبيقات إلى قراءة العديد من الأرقام أو الاختصارات. في هذه الحالة ، يمكنك تضمين هذه الكلمات ، ولكن تطبيعها في شكلها المنطوق.

    فيما يلي بعض أفضل الممارسات على سبيل المثال:

    • بالنسبة للخطوط ذات الاختصارات ، بدلا من "راجع للشغل" ، لديك "بالمناسبة".
    • بالنسبة للأسطر التي تحتوي على أرقام ، بدلا من "911" ، لديك "تسعة واحد واحد".
    • بالنسبة للأسطر التي تحتوي على اختصارات ، بدلا من "ABC" ، لديك "A B C".

    مع ذلك ، تأكد من أن موهبتك الصوتية تنطق هذه الكلمات بالطريقة المتوقعة. حافظ على تطابق البرنامج النصي والتسجيلات باستمرار أثناء عملية التدريب.

  • يجب أن يتضمن البرنامج النصي الخاص بك العديد من الكلمات والجمل المختلفة مع أنواع مختلفة من أطوال الجمل والهياكل والحالة المزاجية.

  • تحقق من البرنامج النصي بعناية بحثا عن الأخطاء. إذا كان ذلك ممكنا ، اطلب من شخص آخر التحقق من ذلك أيضا. عندما تقوم بتشغيل البرنامج النصي بموهبتك ، فمن المحتمل أن تلتقط بعض الأخطاء الأخرى.

الفرق بين نص موهبة الصوت ونص التدريب

يمكن أن يختلف البرنامج النصي للتدريب عن البرنامج النصي للمواهب الصوتية ، خاصة بالنسبة للنصوص النصية التي تحتوي على أرقام ورموز واختصارات وتاريخ ووقت. يجب أن تتبع النصوص المعدة للموهبة الصوتية اتفاقيات القراءة الأصلية ، مثل 50٪ و 45 دولارا. يجب تطبيع النصوص المستخدمة للتدريب لتتناسب مع التسجيل الصوتي ، مثل خمسين بالمائةوخمسة وأربعين دولارا.

ملاحظة

نحن نقدم بعض الأمثلة على البرامج النصية للموهبة الصوتية على GitHub. لاستخدام البرامج النصية النموذجية للتدريب ، يجب عليك تطبيعها وفقا لتسجيلات موهبتك الصوتية قبل تحميل الملف.

يوضح الجدول التالي الفرق بين البرامج النصية للموهبة الصوتية والنص العادي للتدريب.

الفئة مثال على البرنامج النصي للمواهب الصوتية مثال على البرنامج النصي للتدريب (تم تطبيعه)
ارقام 123 مائة وثلاثة وعشرون
الرموز 50% خمسون في المئة
الاختصار في أقرب وقت ممكن في أسرع وقت ممكن
التاريخ والوقت 3 مارس الساعة 5:00 مساء الثالث من مارس الساعة الخامسة مساء

العيوب النموذجية للبرنامج النصي

يمكن أن تؤثر الجودة الرديئة للبرنامج النصي سلبا على نتائج التدريب. لتحقيق نتائج تدريب عالية الجودة ، من الأهمية بمكان تجنب العيوب.

تندرج عيوب البرنامج النصي بشكل عام في الفئات التالية:

الفئة مثال
لديك محتوى لا معنى له بطريقة مشتركة.
جمل غير مكتملة. - "كانت هذه هي حولتي الأخيرة" (لا يوجد موضوع ، لا معنى محدد)
- "من الواضح أنه مضحك بالفعل (لا توجد علامة اقتباس في النهاية ، إنها ليست جملة كاملة)
خطأ مطبعي في الجمل. - ابدأ بأحرف صغيرة
- لا توجد علامات ترقيم نهائية إذا لزم الأمر
- خطأ إملائي
- عدم وجود علامات ترقيم: لا توجد فترة في النهاية (باستثناء عنوان الخبر)
- تنتهي بالرموز ، باستثناء الفاصلة والسؤال والتعجب
- تنسيق خاطئ ، مثل:
 - 45 دولار (يجب أن يكون 45 دولارا)
 - لا توجد مسافة أو مسافة زائدة بين الكلمة / علامات الترقيم
الازدواجية في شكل مماثل ، واحد لكل نمط يكفي. - "الآن الساعة 1 ظهرا في نيويورك"
- "الآن الساعة 2 ظهرا في نيويورك"
- "الآن الساعة 3 عصرا في نيويورك"
- "الآن الساعة 1 ظهرا في سياتل"
- "الآن الساعة 1 ظهرا في واشنطن دي .C."
الكلمات الأجنبية غير الشائعة: فقط الكلمة الأجنبية الشائعة الاستخدام مقبولة في نصنا.
الرموز التعبيرية أو أي رموز أخرى غير شائعة.

تنسيق البرنامج النصي

يمكنك كتابة البرنامج النصي الخاص بك في Microsoft Word. البرنامج النصي مخصص للاستخدام أثناء جلسة التسجيل ، بحيث يمكنك إعداده بأي طريقة تجد سهولة العمل بها. قم بإنشاء الملف النصي المطلوب بواسطة Speech Studio بشكل منفصل.

يحتوي تنسيق البرنامج النصي الأساسي على ثلاثة أعمدة:

  • رقم الكلام، بدءا من 1. يسهل الترقيم على كل شخص في الاستوديو الإشارة إلى كلام معين ("دعنا نجرب الرقم 356 مرة أخرى"). يمكنك استخدام ميزة ترقيم فقرات Word لترقيم صفوف الجدول تلقائيا.
  • عمود فارغ حيث ستكتب الرقم أو رمز الوقت لكل كلام لمساعدتك في العثور عليه في التسجيل النهائي.
  • نص القول نفسه.

Sample script

ملاحظة

تسجل معظم الاستوديوهات في مقاطع قصيرة تعرف باسم Takes. تحتوي كل لقطة عادة على 10 إلى 24 ألفاظا. مجرد ملاحظة رقم الأخذ يكفي للعثور على كلام لاحقا. إذا كنت تقوم بالتسجيل في استوديو يفضل إجراء تسجيلات أطول، فستحتاج إلى تدوين رمز الوقت بدلا من ذلك. سيكون للاستوديو عرض زمني بارز.

اترك مساحة كافية بعد كل صف لكتابة الملاحظات. تأكد من عدم تقسيم أي كلام بين الصفحات. قم بترقيم الصفحات، واطبع البرنامج النصي على جانب واحد من الورقة.

اطبع ثلاث نسخ من السيناريو: واحدة للموهبة، وواحدة للمهندس، وواحدة للمخرج (أنت). استخدم مشبك ورق بدلا من الدبابيس: سيقوم فنان صوت متمرس بفصل الصفحات لتجنب إحداث ضوضاء أثناء قلب الصفحات.

بيان المواهب الصوتية

لتدريب صوت عصبي ، يجب عليك إنشاء ملف تعريف موهبة صوتية مع ملف صوتي مسجل بواسطة موهبة الصوت التي توافق على استخدام بيانات الكلام الخاصة بهم لتدريب نموذج صوت مخصص. عند إعداد البرنامج النصي للتسجيل، تأكد من تضمين جملة العبارة.

يمكنك العثور على العبارة بلغات متعددة على GitHub. يجب أن تكون لغة البيان اللفظي هي نفسها لغة التسجيل. تحتاج إلى تحميل هذا الملف الصوتي إلى Speech Studio كما هو موضح أدناه لإنشاء ملف تعريف مواهب صوتية، والذي يستخدم للتحقق من بيانات التدريب الخاصة بك عند إنشاء نموذج صوتي.

Upload voice talent statement

اقرأ المزيد عن التحقق من المواهب الصوتية هنا.

الجوانب القانونية

وبموجب قانون حق المؤلف، قد تكون قراءة الممثل للنص المحمي بحقوق الطبع والنشر أداء ينبغي تعويض مؤلف المصنف عنه. لن يكون من الممكن التعرف على هذا الأداء في المنتج النهائي ، الصوت العصبي المخصص. ومع ذلك ، فإن شرعية استخدام عمل محمي بحقوق الطبع والنشر لهذا الغرض ليست راسخة. يتعذر على Microsoft تقديم المشورة القانونية بشأن هذه المشكلة؛ استشر محاميك الخاص.

لحسن الحظ ، من الممكن تجنب هذه المشكلات تماما. هناك العديد من مصادر النص التي يمكنك استخدامها دون إذن أو ترخيص.

مصدر النص الوصف
CMU القطب الشمالي المتن حوالي 1100 جملة مختارة من أعمال خارج حقوق الطبع والنشر خصيصا للاستخدام في مشاريع توليف الكلام. نقطة انطلاق ممتازة.
لم يعد يعمل
بموجب حقوق الطبع والنشر
عادة ما تكون الأعمال المنشورة قبل عام 1923. بالنسبة للغة الإنجليزية ، يقدم Project Gutenberg عشرات الآلاف من هذه الأعمال. قد ترغب في التركيز على الأعمال الأحدث ، حيث ستكون اللغة أقرب إلى اللغة الإنجليزية الحديثة.
الأعمال الحكومية الأعمال التي أنشأتها حكومة الولايات المتحدة ليست محمية بحقوق الطبع والنشر في الولايات المتحدة، على الرغم من أن الحكومة قد تطالب بحقوق الطبع والنشر في بلدان/مناطق أخرى.
المجال العام المصنفات التي تم إخلاء مسؤوليتها صراحة عن حقوق الطبع والنشر أو التي تم تخصيصها للملك العام. قد لا يكون من الممكن التنازل عن حقوق الطبع والنشر بالكامل في بعض الولايات القضائية.
المصنفات المرخصة بشكل مسموح به المصنفات الموزعة بموجب ترخيص مثل المشاع الإبداعي أو رخصة جنو للوثائق الحرة (GFDL). ويكيبيديا تستخدم GFDL. ومع ذلك، قد تفرض بعض التراخيص قيودا على أداء المحتوى المرخص الذي قد يؤثر على إنشاء نموذج صوت عصبي مخصص، لذا اقرأ الترخيص بعناية.

تسجيل البرنامج النصي الخاص بك

سجل السيناريو الخاص بك في استوديو تسجيل احترافي متخصص في العمل الصوتي. سيكون لديهم كشك تسجيل ، والمعدات المناسبة ، والأشخاص المناسبين لتشغيله. يوصى بعدم البخل عند التسجيل.

ناقش مشروعك مع مهندس التسجيل في الاستوديو واستمع إلى نصائحهم. يجب أن يحتوي التسجيل على ضغط نطاق ديناميكي قليل أو معدوم (بحد أقصى 4: 1). من الأهمية بمكان أن يكون للصوت مستوى صوت ثابت ونسبة إشارة إلى ضوضاء عالية ، مع خلوه من الأصوات غير المرغوب فيها.

متطلبات التسجيل

لتحقيق نتائج تدريب عالية الجودة، اتبع المتطلبات التالية أثناء التسجيل أو إعداد البيانات:

  • واضحة وواضحة

  • السرعة الطبيعية: ليست بطيئة جدا أو سريعة جدا بين الملفات الصوتية.

  • الحجم المناسب ، اللفظي والاستراحة: مستقر داخل نفس الجملة أو بين الجمل ، فاصل صحيح لعلامات الترقيم.

  • لا ضوضاء أثناء التسجيل

  • تناسب تصميم شخصيتك

  • لا توجد لهجة خاطئة: تناسب التصميم المستهدف

  • لا يوجد نطق خاطئ

يمكنك الرجوع إلى المواصفات أدناه للتحضير لعينات الصوت كأفضل الممارسات.

الخاصية القيمة
تنسيق الملف *.wav، أحادي اللون
معدل أخذ العينات 24 كيلوهرتز
تنسيق العينة 16 بت، PCM
مستويات الصوت القصوى -3 ديسيبل إلى -6 ديسيبل
SNR > 35 ديسيبل
صمت - يجب أن يكون هناك بعض الصمت (يوصي 100 مللي ثانية) في البداية والنهاية ، ولكن ليس أكثر من 200 مللي ثانية
- الصمت بين الكلمات أو العبارات < -30 ديسيبل
- الصمت في الموجة بعد نطق <الكلمة الأخيرة -60 ديسيبل
ضوضاء البيئة ، صدى - مستوى الضوضاء في بداية الموجة قبل التحدث < -70 ديسيبل

ملاحظة

يمكنك التسجيل بمعدل أخذ عينات أعلى وعمق بت ، على سبيل المثال بتنسيق 48 كيلو هرتز 24 بت PCM. أثناء التدريب الصوتي العصبي المخصص ، سنقوم بتخفيض عينته إلى 24 كيلوهرتز 16 بت PCM تلقائيا.

أخطاء صوتية نموذجية

للحصول على نتائج تدريب عالية الجودة ، يوصى بشدة بتجنب الأخطاء الصوتية. تتضمن أخطاء الصوت عادة الفئات التالية:

  • اسم الملف الصوتي لا يتطابق مع معرف البرنامج النصي.

  • يحتوي ملف WAR على تنسيق غير صالح ولا يمكن قراءته.

  • معدل أخذ العينات الصوتية أقل من 16 كيلو هرتز. أيضا ، يوصى بأن يكون معدل أخذ عينات ملف wav مساويا أو أعلى من 24 كيلو هرتز للصوت العصبي عالي الجودة.

  • لا تقع ذروة الحجم ضمن نطاق -3 ديسيبل (70٪ من الحد الأقصى لحجم الصوت) إلى -6 ديسيبل (50٪).

  • تجاوز الشكل الموجي. أي أن الشكل الموجي في قيمته القصوى يتم قطعه وبالتالي لا يكتمل.

    waveform overflow

  • جزء الصمت ليس نظيفا ، مثل الضوضاء المحيطة وضوضاء الفم والصدى.

    على سبيل المثال، يحتوي الصوت أدناه على ضوضاء البيئة بين الخطابات.

    environment noise

    تحتوي العينة أدناه على ضوضاء إزاحة التيار المستمر أو الصدى.

    DC offset or echo

  • الحجم الإجمالي منخفض جدا. سيتم وضع علامة على بياناتك كمشكلة إذا كان مستوى الصوت أقل من -18 ديسيبل (10٪ من الحد الأقصى لحجم الصوت). تأكد من أن جميع الملفات الصوتية يجب أن تكون متسقة بنفس مستوى الصوت.

    overall volume

  • لا صمت قبل الكلمة الأولى أو بعد الكلمة الأخيرة. أيضا ، يجب ألا يزيد صمت البداية أو النهاية عن 200 مللي ثانية أو أقل من 100 مللي ثانية.

    No silence

افعل ذلك بنفسك

إذا كنت ترغب في إجراء التسجيل بنفسك ، بدلا من الذهاب إلى استوديو التسجيل ، فإليك تمهيدي قصير. بفضل ظهور التسجيل المنزلي والبودكاست ، أصبح من الأسهل من أي وقت مضى العثور على نصائح وموارد تسجيل جيدة عبر الإنترنت.

يجب أن يكون "كشك التسجيل" الخاص بك غرفة صغيرة بدون صدى ملحوظ أو "نغمة غرفة". يجب أن تكون هادئة وعازلة للصوت قدر الإمكان. يمكن استخدام الستائر على الجدران لتقليل الصدى وتحييد أو "قتل" صوت الغرفة.

استخدم ميكروفون مكثف استوديو عالي الجودة ("ميكروفون" باختصار) مخصص لتسجيل الصوت. يمكن أن تسفر Sennheiser و AKG وحتى ميكروفونات Zoom الأحدث عن نتائج جيدة. يمكنك شراء ميكروفون أو استئجار ميكروفون من شركة تأجير سمعية وبصرية محلية. ابحث عن واحدة مزودة بواجهة USB. يجمع هذا النوع من الميكروفون بشكل ملائم بين عنصر الميكروفون و preamp والمحول التناظري إلى الرقمي في حزمة واحدة ، مما يبسط التوصيل.

يمكنك أيضا استخدام ميكروفون تناظري. تقدم العديد من المنازل المستأجرة ميكروفونات "عتيقة" تشتهر بطابعها الصوتي. لاحظ أن الترس التناظري الاحترافي يستخدم موصلات XLR متوازنة ، بدلا من القابس مقاس 1/4 بوصة المستخدم في المعدات الاستهلاكية. إذا ذهبت إلى التناظرية ، فستحتاج أيضا إلى مضخم صوت مسبق وواجهة صوت كمبيوتر مع هذه الموصلات.

قم بتثبيت الميكروفون على حامل أو ذراع الرافعة، وقم بتثبيت مرشح بوب أمام الميكروفون للقضاء على الضوضاء الناتجة عن الحروف الساكنة "الصارخة" مثل "p" و "b". تأتي بعض الميكروفونات مزودة بحامل تعليق يعزلها عن الاهتزازات في الحامل ، وهو أمر مفيد.

يجب أن تبقى موهبة الصوت على مسافة ثابتة من الميكروفون. استخدم شريطا لاصقا على الأرض لتحديد المكان الذي يجب أن يقفوا فيه. إذا كانت الموهبة تفضل الجلوس ، فاحرص بشكل خاص على مراقبة مسافة الميكروفون وتجنب ضوضاء الكرسي.

استخدم حاملا للاحتفاظ بالبرنامج النصي. تجنب تثبيت الحامل بحيث يمكن أن يعكس الصوت نحو الميكروفون.

يجب أن يكون الشخص الذي يشغل معدات التسجيل - المهندس - في غرفة منفصلة عن الموهبة ، مع وجود طريقة للتحدث إلى الموهبة في كشك التسجيل ( دائرة النقاش).

يجب أن يحتوي التسجيل على أقل قدر ممكن من الضوضاء ، بهدف نسبة إشارة إلى ضوضاء تبلغ 80 ديسيبل أو أفضل.

استمع عن كثب إلى تسجيل الصمت في "كشكك" الخاص بك ، واكتشف من أين يأتي أي ضجيج ، وتخلص من السبب. المصادر الشائعة للضوضاء هي فتحات التهوية ، وكوابح الضوء الفلورسنت ، وحركة المرور على الطرق القريبة ، ومراوح المعدات (حتى أجهزة الكمبيوتر المحمولة قد تحتوي على مراوح). يمكن للميكروفونات والكابلات التقاط الضوضاء الكهربائية من أسلاك التيار المتردد القريبة ، وعادة ما تكون طنينا أو طنينا. يمكن أيضا أن يحدث الطنين بسبب حلقة أرضية ، والتي تسببها توصيل المعدات بأكثر من دائرة كهربائية واحدة.

تلميح

في بعض الحالات، قد تتمكن من استخدام معادل أو مكون إضافي لبرنامج تقليل الضوضاء للمساعدة في إزالة الضوضاء من تسجيلاتك، على الرغم من أنه من الأفضل دائما إيقافها من مصدرها.

قم بتعيين المستويات بحيث يتم استخدام معظم النطاق الديناميكي المتاح للتسجيل الرقمي دون الإفراط في القيادة. وهذا يعني ضبط الصوت بصوت عال ، ولكن ليس بصوت عال بحيث يصبح مشوها. يظهر مثال على الشكل الموجي للتسجيل الجيد في الصورة التالية:

A good recording waveform

هنا ، يتم استخدام معظم النطاق (الارتفاع) ، ولكن أعلى قمم الإشارة لا تصل إلى أعلى أو أسفل النافذة. يمكنك أيضا أن ترى أن الصمت في التسجيل يقترب من خط أفقي رفيع ، مما يشير إلى أرضية منخفضة الضوضاء. يتمتع هذا التسجيل بنطاق ديناميكي مقبول ونسبة إشارة إلى ضوضاء.

قم بالتسجيل مباشرة في الكمبيوتر عبر واجهة صوت عالية الجودة أو منفذ USB، اعتمادا على الميكروفون الذي تستخدمه. بالنسبة للتناظرية ، حافظ على بساطة سلسلة الصوت: الميكروفون ، preamp ، واجهة الصوت ، الكمبيوتر. يمكنك ترخيص كل من Avid Pro ToolsوAdobe Audition شهريا بتكلفة معقولة. إذا كانت ميزانيتك ضيقة للغاية ، فجرب الجرأة المجانية.

سجل بسرعة 44.1 كيلوهرتز 16 بت أحادية الصوت (جودة القرص المضغوط) أو أفضل. أحدث ما توصلت إليه التكنولوجيا الحالية هو 48 كيلوهرتز 24 بت، إذا كانت معداتك تدعمها. ستقوم بتخفيض عينة الصوت إلى 24 كيلوهرتز 16 بت قبل إرساله إلى Speech Studio. ومع ذلك ، من المفيد الحصول على تسجيل أصلي عالي الجودة في حالة الحاجة إلى تعديلات.

من الناحية المثالية ، اطلب من أشخاص مختلفين العمل في أدوار المدير والمهندس والموهبة. لا تحاول أن تفعل كل شيء بنفسك. في قرصة ، يمكن لشخص واحد أن يكون كل من المدير والمهندس.

قبل الجلسة

لتجنب إضاعة وقت الاستوديو ، قم بتشغيل البرنامج النصي مع موهبتك الصوتية قبل جلسة التسجيل. في حين أن موهبة الصوت تصبح على دراية بالنص ، فإنها يمكن أن توضح نطق أي كلمات غير مألوفة.

ملاحظة

تقدم معظم استوديوهات التسجيل عرضا إلكترونيا للنصوص النصية في كشك التسجيل. في هذه الحالة، اكتب ملاحظات التشغيل مباشرة في مستند البرنامج النصي. ومع ذلك ، ستظل بحاجة إلى نسخة ورقية لتدوين الملاحظات عليها أثناء الجلسة. معظم المهندسين يريدون نسخة مطبوعة أيضا. وستظل بحاجة إلى نسخة مطبوعة ثالثة كنسخة احتياطية للموهبة في حالة تعطل الكمبيوتر.

قد تسأل موهبتك الصوتية عن الكلمة التي تريد التأكيد عليها في النطق ("الكلمة المنطوق"). أخبرهم أنك تريد قراءة طبيعية دون تركيز خاص. يمكن إضافة التركيز عند توليف الكلام. لا ينبغي أن يكون جزءا من التسجيل الأصلي.

توجيه الموهبة لنطق الكلمات بشكل واضح. يجب نطق كل كلمة من النص كما هو مكتوب. لا ينبغي حذف الأصوات أو تجميعها معا ، كما هو شائع في الكلام غير الرسمي ، ما لم تكن قد كتبت بهذه الطريقة في النص.

نص مكتوب النطق غير المرغوب فيه
لن تتخلى عنك أبدا لن تتخلى عنك أبدا
هناك أربعة أضواء هناك أربعة أضواء
كيف هو الطقس اليوم كيف يكون الطقس اليوم
قل مرحبا لصديقي الصغير قل مرحبا لصديقي ليل

يجب ألا تضيف الموهبة وقفات مميزة بين الكلمات. يجب أن تظل الجملة تتدفق بشكل طبيعي ، حتى عندما تبدو رسمية بعض الشيء. هذا التمييز الدقيق قد يتطلب ممارسة للحصول على الحق.

جلسة التسجيل

قم بإنشاء تسجيل مرجعي، أو ملف مطابقة، للفظ نموذجي في بداية الجلسة. اطلب من الموهبة تكرار هذا السطر في كل صفحة أو نحو ذلك. في كل مرة، قارن التسجيل الجديد بالمرجع. تساعد هذه الممارسة الموهبة على البقاء متسقة في الحجم والإيقاع والملعب والتجويد. وفي الوقت نفسه ، يمكن للمهندس استخدام ملف المطابقة كمرجع للمستويات والاتساق العام للصوت.

ملف المطابقة مهم بشكل خاص عند استئناف التسجيل بعد استراحة أو في يوم آخر. قم بتشغيله عدة مرات للموهبة واجعلهم يكررونه في كل مرة حتى يتطابقوا بشكل جيد.

درب موهبتك على أخذ نفس عميق والتوقف للحظة قبل كل كلام. سجل بضع ثوان من الصمت بين الأقوال. يجب نطق الكلمات بنفس الطريقة في كل مرة تظهر فيها ، مع مراعاة السياق. على سبيل المثال ، يتم نطق "سجل" كفعل بشكل مختلف عن "سجل" كاسم.

سجل ما يقرب من خمس ثوان من الصمت قبل التسجيل الأول لالتقاط "نغمة الغرفة". تساعد هذه الممارسة Speech Studio على تعويض الضوضاء في التسجيلات.

تلميح

كل ما تحتاجه حقا لالتقاطه هو الموهبة الصوتية ، حتى تتمكن من إجراء تسجيل أحادي الصوت (قناة واحدة) لخطوطها فقط. ومع ذلك ، إذا قمت بالتسجيل في ستيريو ، فيمكنك استخدام القناة الثانية لتسجيل الثرثرة في غرفة التحكم لالتقاط مناقشة لخطوط أو لقطات معينة. أزل هذا المسار من الإصدار الذي تم تحميله إلى Speech Studio.

استمع عن كثب، باستخدام سماعات الرأس، إلى أداء المواهب الصوتية. أنت تبحث عن إملاء جيد ولكنه طبيعي ، ونطق صحيح ، وعدم وجود أصوات غير مرغوب فيها. لا تتردد في أن تطلب من موهبتك إعادة تسجيل كلام لا يفي بهذه المعايير.

تلميح

إذا كنت تستخدم عددا كبيرا من الأقوال ، فقد لا يكون لكلام واحد تأثير ملحوظ على الصوت العصبي المخصص الناتج. قد يكون من الأنسب ملاحظة أي أقوال بها مشكلات ، واستبعادها من مجموعة البيانات الخاصة بك ، ومعرفة كيف يتحول صوتك العصبي المخصص. يمكنك دائما العودة إلى الاستوديو وتسجيل العينات الفائتة لاحقا.

لاحظ رقم الأخذ أو رمز الوقت على البرنامج النصي لكل نطق. اطلب من المهندس وضع علامة على كل كلام في البيانات الوصفية للتسجيل أو ورقة الإشارة أيضا.

خذ فترات راحة منتظمة وقدم مشروبا لمساعدة موهبتك الصوتية على الحفاظ على صوتهم في حالة جيدة.

بعد الجلسة

تعمل استوديوهات التسجيل الحديثة على أجهزة الكمبيوتر. في نهاية جلسة العمل، تتلقى ملف صوتي واحد أو أكثر، وليس شريطا. من المحتمل أن تكون هذه الملفات بتنسيق WAV أو AIFF بجودة قرص مضغوط (44.1 كيلو هرتز 16 بت) أو أفضل. 24 كيلوهرتز 16 بت أمر شائع ومرغوب فيه. معدل أخذ العينات الافتراضي للصوت العصبي المخصص هو 24 كيلو هرتز. يوصى باستخدام معدل عينة يبلغ 24 كيلوهرتز لبيانات التدريب الخاصة بك. ولا حاجة عموما إلى معدلات أعلى لأخذ العينات، مثل 96 كيلوهرتز.

يتطلب Speech Studio أن يكون كل كلام مقدم في ملفه الخاص. يحتوي كل ملف صوتي يسلمه الاستوديو على أقوال متعددة. لذا فإن المهمة الأساسية لما بعد الإنتاج هي تقسيم التسجيلات وإعدادها للتقديم. ربما يكون مهندس التسجيل قد وضع علامات في الملف (أو قدم ورقة إشارة منفصلة) للإشارة إلى المكان الذي يبدأ فيه كل كلام.

استخدم ملاحظاتك للعثور على اللقطات الدقيقة التي تريدها، ثم استخدم أداة مساعدة لتحرير الصوت، مثل Avid Pro Tools أو Adobe Audition أو Audacity المجانية، لنسخ كل كلام إلى ملف جديد.

اترك حوالي 0.2 ثانية فقط من الصمت في بداية ونهاية كل مقطع ، باستثناء الأول. يجب أن يبدأ هذا الملف بخمس ثوان كاملة من الصمت. لا تستخدم محرر الصوت "لتصفية" الأجزاء الصامتة من الملف. سيساعد تضمين "نغمة الغرفة" الخوارزميات على التعويض عن أي ضوضاء خلفية متبقية.

استمع إلى كل ملف بعناية. في هذه المرحلة ، يمكنك تحرير الأصوات الصغيرة غير المرغوب فيها التي فاتتك أثناء التسجيل ، مثل صفعة شفاه طفيفة قبل سطر ، ولكن احرص على عدم إزالة أي خطاب فعلي. إذا لم تتمكن من إصلاح ملف، فقم بإزالته من مجموعة البيانات ولاحظ أنك قمت بذلك.

قم بتحويل كل ملف إلى 16 بت ومعدل عينة يبلغ 24 كيلوهرتز قبل الحفظ وإذا قمت بتسجيل دردشة الاستوديو ، فقم بإزالة القناة الثانية. احفظ كل ملف بتنسيق WAV ، وقم بتسمية الملفات برقم النطق من البرنامج النصي الخاص بك.

أخيرا ، قم بإنشاء النص الذي يربط كل ملف WAV بإصدار نصي من الكلام المقابل. يتضمن تدريب نموذج الصوت الخاص بك تفاصيل التنسيق المطلوب. يمكنك نسخ النص مباشرة من البرنامج النصي. ثم قم بإنشاء ملف مضغوط لملفات WAV والنص النصي.

أرشفة التسجيلات الأصلية في مكان آمن في حال احتجت إليها لاحقا. احتفظ بالبرنامج النصي والملاحظات أيضا.

الخطوات التالية

أنت مستعد لتحميل تسجيلاتك وإنشاء صوتك العصبي المخصص.