تحسين التوليف باستخدام أداة إنشاء المحتوى الصوتي

إنشاء المحتوى الصوتي هو أداة سهلة الاستخدام وقوية تتيح لك إنشاء محتوى صوتي طبيعي للغاية لمجموعة متنوعة من السيناريوهات ، مثل الكتب الصوتية ونشرات الأخبار وروايات الفيديو وروبوتات الدردشة. باستخدام إنشاء المحتوى الصوتي، يمكنك ضبط أصوات تحويل النص إلى كلام بدقة وتصميم تجارب صوتية مخصصة بطريقة فعالة ومنخفضة التكلفة.

تعتمد الأداة على لغة ترميز توليف الكلام (SSML). يسمح لك بضبط سمات إخراج النص إلى كلام في الوقت الفعلي أو توليف الدفعات ، مثل الأحرف الصوتية وأنماط الصوت وسرعة التحدث والنطق والعرض.

اعتبارا من نوفمبر 2021 ، يمكنك الوصول بسهولة إلى أكثر من 270 صوتا عصبيا عبر 119 لغة مختلفة. تتضمن هذه الأصوات أحدث الأصوات العصبية المعدة مسبقا وصوتك العصبي المخصص ، إذا كنت قد قمت ببناء واحد.

لمعرفة المزيد، شاهد الفيديو التعليمي لإنشاء المحتوى الصوتي.

الشروع في العمل

يعد إنشاء المحتوى الصوتي أداة مجانية ، ولكنك ستدفع مقابل خدمة الكلام التي تستهلكها. للعمل مع الأداة، تحتاج إلى تسجيل الدخول باستخدام حساب Azure وإنشاء مورد كلام. لكل حساب Azure، لديك حصص شهرية حرة للكلام، والتي تتضمن 0.5 مليون حرف للأصوات العصبية المعدة مسبقا (يشار إليها باسم Neural في صفحة التسعير). عادة ما يكون المبلغ المخصص شهريا كافيا لفريق محتوى صغير من حوالي 3-5 أشخاص.

تغطي الأقسام التالية كيفية إنشاء حساب Azure والحصول على مورد كلام.

الخطوة 1: إنشاء حساب Azure

للعمل مع إنشاء المحتوى الصوتي، تحتاج إلى حساب Microsoft وحسابAzure. لإعداد الحسابات، راجع قسم "تجربة خدمة الكلام مجانا" في ما هي خدمة الكلام؟.

بوابة Azure الإلكترونية هي المكان المركزي المناسب لك لإدارة حساب Azure الخاص بك. يمكنك إنشاء مورد Speech وإدارة الوصول إلى المنتج ومراقبة كل شيء بدءا من تطبيقات الويب البسيطة إلى عمليات النشر السحابية المعقدة.

الخطوة 2: إنشاء مورد كلام

بعد التسجيل للحصول على حساب Azure، تحتاج إلى إنشاء مورد كلام في حساب Azure الخاص بك للوصول إلى خدمات الكلام. للحصول على التعليمات، راجع كيفية إنشاء مورد كلام.

يستغرق الأمر بضع لحظات لتوزيع مورد الكلام الجديد. بعد اكتمال النشر، يمكنك البدء في استخدام أداة إنشاء المحتوى الصوتي.

ملاحظة

إذا كنت تخطط لاستخدام الأصوات العصبية، فتأكد من إنشاء موردك في منطقة تدعم الأصوات العصبية.

الخطوة 3: تسجيل الدخول إلى إنشاء المحتوى الصوتي باستخدام حساب Azure ومورد الكلام

  1. بعد الحصول على حساب Azure ومورد الكلام، يمكنك تسجيل الدخول إلى أداة إنشاء المحتوى الصوتي عن طريق تحديد البدء.

  2. تسرد الصفحة الرئيسية جميع المنتجات ضمن Speech Studio. للبدء، حدد إنشاء محتوى صوتي.

    يتم فتح صفحة مرحبا بك في استوديو الكلام .

  3. حدد اشتراك Azure ومورد الكلام الذي تريد العمل معه، ثم حدد استخدام المورد.

    في المرة التالية التي تسجل فيها الدخول إلى إنشاء المحتوى الصوتي، يتم ربطك مباشرة بملفات العمل الصوتي ضمن مورد الكلام الحالي. يمكنك التحقق من تفاصيل اشتراك Azure وحالته في مدخل Azure.

    إذا لم يكن لديك مورد كلام متوفر وكنت مالك اشتراك Azure أو مسؤوله، فيمكنك إنشاء مورد كلام في Speech Studio عن طريق تحديد إنشاء مورد جديد.

    إذا كان لديك دور مستخدم لاشتراك Azure معين، فقد لا يكون لديك أذونات لإنشاء مورد كلام جديد. للوصول إلى الموقع، اتصل بالمشرف.

    لتعديل مورد الكلام في أي وقت، حدد الإعدادات في أعلى الصفحة.

    لتبديل الدلائل، حدد الإعدادات أو انتقل إلى ملفك الشخصي.

استخدم الأداة

يعرض الرسم التخطيطي التالي عملية الضبط الدقيق لمخرجات تحويل النص إلى كلام.

Diagram of the sequence of steps for fine-tuning text-to-speech outputs.

يتم وصف كل خطوة في الرسم البياني السابق هنا:

  1. اختر مورد الكلام الذي تريد العمل معه.

  2. قم بإنشاء ملف ضبط الصوت باستخدام نص عادي أو برامج نصية SSML. اكتب المحتوى الخاص بك أو حمله إلى إنشاء المحتوى الصوتي.

  3. اختر الصوت واللغة لمحتوى البرنامج النصي. يتضمن إنشاء المحتوى الصوتي جميع أصوات تحويل النص إلى كلام من Microsoft. يمكنك استخدام أصوات عصبية مسبقة الصنع أو صوت عصبي مخصص.

    ملاحظة

    يتوفر الوصول عبر بوابات للصوت العصبي المخصص ، والذي يسمح لك بإنشاء أصوات عالية الدقة تشبه الكلام الطبيعي. لمزيد من المعلومات، راجع عملية البوابة.

  4. حدد المحتوى الذي تريد معاينته، ثم حدد تشغيل (أيقونة المثلث) لمعاينة إخراج التوليف الافتراضي.

    إذا قمت بإجراء أية تغييرات على النص، فحدد أيقونة إيقاف ، ثم حدد تشغيل مرة أخرى لإعادة إنشاء الصوت باستخدام البرامج النصية التي تم تغييرها.

    قم بتحسين الإخراج عن طريق ضبط النطق والاستراحة ودرجة الصوت والمعدل والتجويد ونمط الصوت والمزيد. للحصول على قائمة كاملة بالخيارات، راجع لغة ترميز توليف الكلام.

    لمزيد من المعلومات حول الضبط الدقيق لإخراج الكلام، قم بعرض فيديو كيفية تحويل النص إلى كلام باستخدام Microsoft Azure الذكاء الاصطناعي الأصوات .

  5. احفظ الصوت المضبوط وقم بتصديره.

    عند حفظ مسار الضبط في النظام، يمكنك متابعة العمل والتكرار على الإخراج. عندما تكون راضيا عن الإخراج ، يمكنك إنشاء مهمة إنشاء صوت باستخدام ميزة التصدير. يمكنك مراقبة حالة مهمة التصدير وتنزيل الإخراج للاستخدام مع تطبيقاتك ومنتجاتك.

إنشاء ملف ضبط الصوت

يمكنك إدخال المحتوى الخاص بك في أداة إنشاء المحتوى الصوتي بإحدى الطريقتين:

  • خيار 1

    1. حدد NewFile> لإنشاء ملف ضبط صوت جديد.

    2. اكتب المحتوى الخاص بك أو الصقه في نافذة التحرير. العدد المسموح به من الأحرف لكل ملف هو 20000 أو أقل. إذا كان البرنامج النصي يحتوي على أكثر من 20000 حرف، فيمكنك استخدام الخيار 2 لتقسيم المحتوى تلقائيا إلى ملفات متعددة.

    3. حدد ⁧⁩حفظ⁧⁩.

  • خيار 2

    1. حدد Upload لاستيراد ملف نصي واحد أو أكثر. يتم دعم كل من النص العادي و SSML.

      إذا كان ملف البرنامج النصي الخاص بك أكثر من 20000 حرف، فقم بتقسيم المحتوى حسب الفقرات أو الأحرف أو التعبيرات العادية.

    2. عند تحميل ملفاتك النصية، تأكد من استيفائها للمتطلبات التالية:

      الخاصية الوصف
      تنسيق الملف نص عادي (.txt)*
      نص SSML (.txt)**
      الملفات المضغوطة غير مدعومة.
      تنسيق الترميز UTF-8
      اسم الملف يجب أن يكون لكل ملف اسم فريد. الملفات المكررة غير مدعومة.
      طول النص الحد الأقصى للأحرف هو 20,000. إذا تجاوزت ملفاتك الحد، فقم بتقسيمها وفقا للتعليمات الموجودة في الأداة.
      قيود SSML يمكن أن يحتوي كل ملف SSML على جزء واحد فقط من SSML.

      * مثال على النص العادي:

      Welcome to use Audio Content Creation to customize audio output for your products.
      

      ** مثال على نص SSML:

      <speak xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" version="1.0" xml:lang="en-US">
          <voice name="Microsoft Server Speech Text to Speech Voice (en-US, JennyNeural)">
          Welcome to use Audio Content Creation <break time="10ms" />to customize audio output for your products.
          </voice>
      </speak>
      

تصدير الصوت المضبوط

بعد مراجعة إخراج الصوت والرضا عن الضبط والتعديل، يمكنك تصدير الصوت.

  1. حدد تصدير لإنشاء مهمة إنشاء صوت.

    نوصي بالتصدير إلى مكتبة الصوت، لأن هذا الخيار يدعم إخراج الصوت الطويل وتجربة إخراج الصوت الكاملة. يمكنك أيضا تنزيل الصوت على القرص المحلي مباشرة، ولكن لا تتوفر سوى أول 10 دقائق.

  2. اختر تنسيق الإخراج للصوت المضبوط. يتم سرد تنسيقات الصوت المدعومة ومعدلات العينات في الجدول التالي:

    تنسيق 8 كيلو هرتز معدل العينة 16 كيلو هرتز معدل العينة معدل عينة 24 كيلو هرتز 48 كيلو هرتز معدل العينة
    الرعايا riff-8khz-16bit-mono-pcm riff-16khz-16bit-mono-pcm riff-24khz-16bit-mono-pcm riff-48khz-16bit-mono-pcm
    mp3 غير متوفر الصوت - 16 كيلو هرتز - 128kbitrate - أحادي - mp3 الصوت - 24 كيلو هرتز - 160kbitrate - أحادي - mp3 الصوت - 48 كيلو هرتز - 192kbitrate - أحادي - mp3
  3. لعرض حالة المهمة، حدد علامة التبويب تصدير المهمة .

    في حالة فشل المهمة، راجع صفحة المعلومات التفصيلية للحصول على تقرير كامل.

  4. عند اكتمال المهمة، يتوفر الصوت للتنزيل من جزء مكتبة الصوت .

  5. اختر ⁧⁩تنزيل⁧⁩. أنت الآن جاهز لاستخدام الصوت المضبوط المخصص في تطبيقاتك أو منتجاتك.

إضافة مستخدمين لإنشاء المحتوى الصوتي أو إزالتهم

إذا أراد أكثر من مستخدم واحد استخدام "إنشاء محتوى صوتي"، فيمكنك منحهم حق الوصول إلى اشتراك Azure ومورد الكلام. إذا أضفت مستخدمين إلى اشتراك Azure، فيمكنهم الوصول إلى جميع الموارد ضمن اشتراك Azure. ولكن إذا أضفت مستخدمين إلى مورد Speech فقط، فسيكون لديهم حق الوصول إلى مورد Speech فقط وليس إلى موارد أخرى ضمن اشتراك Azure هذا. يمكن للمستخدمين الذين لديهم حق الوصول إلى مورد الكلام استخدام أداة إنشاء المحتوى الصوتي.

يحتاج المستخدمون الذين تمنحهم حق الوصول إلى إعداد حساب Microsoft. إذا لم يكن لديهم حساب Microsoft ، فيمكنهم إنشاء حساب في بضع دقائق فقط. يمكنهم استخدام بريدهم الإلكتروني الحالي وربطه بحساب Microsoft، أو يمكنهم إنشاء عنوان بريد إلكتروني Outlook واستخدامه كحساب Microsoft.

إضافة مستخدمين إلى مورد كلام

لإضافة مستخدمين إلى مورد كلام حتى يتمكنوا من استخدام إنشاء محتوى صوتي، قم بما يلي:

  1. في مدخل Azure، ابحث عن الخدمات المعرفية وحددها، ثم حدد مورد الكلام الذي تريد إضافة مستخدمين إليه.
  2. حدد التحكم في الوصول (IAM)، وحدد إضافة، ثم حدد إضافة تعيين دور (معاينة) لفتح جزء إضافة تعيين دور.
  3. حدد علامة التبويب الدور ، ثم حدد دور مستخدم الخدمة المعرفية . إذا كنت تريد منح مستخدم ملكية مورد الكلام هذا، فحدد دور المالك .
  4. حدد علامة التبويب الأعضاء ، وأدخل عنوان البريد الإلكتروني للمستخدم وحدد اسم المستخدم في الدليل. يجب ربط عنوان البريد الإلكتروني بحساب Microsoft موثوق به بواسطة Azure Active Directory. يمكن للمستخدمين التسجيل بسهولة للحصول على حساب Microsoft باستخدام عنوان بريدهم الإلكتروني الشخصي.
  5. حدد علامة التبويب مراجعة + تعيين، ثم حدد مراجعة + تعيين لتعيين الدور لمستخدم.

إليك ما يحدث بعد ذلك:

يتم إرسال دعوة عبر البريد الإلكتروني تلقائيا إلى المستخدمين. ويمكنهم قبوله عن طريق تحديد قبول الدعوةقبول>للانضمام إلى Azure في بريدهم الإلكتروني. ثم تتم إعادة توجيهها إلى مدخل Azure. ولا يحتاجون إلى اتخاذ مزيد من الإجراءات في مدخل Azure. بعد بضع لحظات، يتم تعيين الدور للمستخدمين في نطاق مورد الكلام، مما يتيح لهم الوصول إلى مورد الكلام هذا. إذا لم يتلق المستخدمون البريد الإلكتروني للدعوة، يمكنك البحث عن حساباتهم ضمن تعيينات الدور والانتقال إلى ملفهم الشخصي. ابحث عن IdentityInvite>المقبولة، وحدد (إدارة) لإعادة إرسال الدعوة عبر البريد الإلكتروني. يمكنك أيضا نسخ رابط الدعوة وإرساله إليهم.

يقوم المستخدمون الآن بزيارة صفحة منتج إنشاء المحتوى الصوتي أو تحديثها، وتسجيل الدخول باستخدام حساب Microsoft الخاص بهم. يختارون كتلة إنشاء المحتوى الصوتي من بين جميع منتجات الكلام. يختارون مورد الكلام في النافذة المنبثقة أو في الإعدادات في الجزء العلوي الأيسر.

إذا لم يتمكنوا من العثور على مورد الكلام المتاح، فيمكنهم التحقق للتأكد من أنهم في الدليل الصحيح. للقيام بذلك، يقومون بتحديد ملف تعريف الحساب في الجزء العلوي الأيسر ثم تحديد التبديل بجوار الدليل الحالي. إذا كان هناك أكثر من دليل واحد متاح ، فهذا يعني أن لديهم حق الوصول إلى أدلة متعددة. يمكنهم التبديل إلى أدلة مختلفة والانتقال إلى الإعدادات لمعرفة ما إذا كان مورد الكلام الصحيح متاحا أم لا.

Add role dialog

سيرى المستخدمون الذين هم في مورد الكلام نفسه عمل بعضهم البعض في استوديو إنشاء المحتوى الصوتي. إذا كنت تريد أن يكون لكل مستخدم على حدة مكان عمل فريد وخاص في إنشاء المحتوى الصوتي، فقم بإنشاء مورد كلام جديد لكل مستخدم وامنح كل مستخدم وصولا فريدا إلى مورد الكلام.

إزالة مستخدمين من مورد "الكلام"

  1. ابحث عن الخدمات المعرفية في مدخل Azure، وحدد مورد الكلام الذي تريد إزالة المستخدمين منه.

  2. حدد التحكم في الوصول (IAM)، ثم حدد علامة التبويب تعيينات الدور لعرض كافة تعيينات الأدوار لمورد الكلام هذا.

  3. حدد المستخدمين الذين تريد إزالتهم، وحدد إزالة، ثم حدد موافق.

    Screenshot of the 'Remove' button on the 'Remove role assignments' pane.

تمكين المستخدمين من منح حق الوصول إلى الآخرين

إذا كنت تريد السماح لمستخدم بمنح حق الوصول إلى مستخدمين آخرين، فستحتاج إلى تعيين دور المالك لمورد الكلام وتعيين المستخدم كقارئ دليل Azure.

  1. أضف المستخدم كمالك لمورد الكلام. لمزيد من المعلومات، راجع إضافة مستخدمين إلى مورد كلام.

    Screenshot showing the 'Owner' role on the 'Add role assignment' pane.

  2. في مدخل Azure، حدد القائمة المطوية في الجزء العلوي الأيمن، وحدد Azure Active Directory، ثم حدد المستخدمون.

  3. ابحث عن حساب Microsoft الخاص بالمستخدم، وانتقل إلى صفحة التفاصيل الخاصة به، ثم حدد الأدوار المعينة.

  4. حدد إضافة مهامقراء>الدليل. إذا كان الزر إضافة مهام غير متوفر، فهذا يعني أنه ليس لديك حق الوصول. يمكن للمسؤول العمومي لهذا الدليل فقط إضافة مهام للمستخدمين.

راجع أيضًا

الخطوات التالية