تركيب الكلام باستخدام أداة إنشاء محتوى الصوت

مقالة
01/18/2024

يمكنك استخدام أداة إنشاء محتوى الصوت في Speech Studio لتركيب النص إلى كلام دون كتابة أي تعليمة برمجية. يمكنك استخدام صوت الإخراج كما هو، أو كنقطة بداية لمزيد من التخصيص.

إنشاء محتوى صوتي طبيعي للغاية لسيناريوهات مختلفة، مثل الكتب الصوتية، وبث الأخبار، وسرد الفيديو، وتوبوتات الدردشة. باستخدام إنشاء محتوى صوتي، يمكنك ضبط النص بفعالية على أصوات الكلام وتصميم تجارب صوتية مخصصة.

تستند الأداة إلى Speech Synthesis Markup Language (SSML). يسمح لك بضبط سمات إخراج النص إلى الكلام في الوقت الحقيقي أو تركيب الدفعة، مثل الأحرف الصوتية وأنماط الصوت وسرعة التحدث والنطق والتجسيد.

نهج بدون تعليمات برمجية: يمكنك استخدام أداة إنشاء محتوى الصوت لتركيب النص إلى كلام دون كتابة أي تعليمة برمجية. قد يكون صوت الإخراج هو التسليم النهائي الذي تريده. على سبيل المثال، يمكنك استخدام صوت الإخراج لأجهزة بودكاست أو سرد فيديو.
مساعد المطور: يمكنك الاستماع إلى صوت الإخراج وضبط SSML لتحسين تركيب الكلام. ثم يمكنك استخدام Speech SDK أو Speech CLI لدمج SSML في تطبيقاتك. على سبيل المثال، يمكنك استخدام SSML لإنشاء روبوت دردشة.

يمكنك الوصول بسهولة إلى مجموعة كبيرة من اللغات والأصوات. تتضمن هذه الأصوات أحدث الأصوات العصبية التي تم إنشاؤها مسبقا وصوتك العصبي المخصص، إذا قمت ببناء واحد.

لمعرفة المزيد، اعرض الفيديو التعليمي لإنشاء محتوى صوتي على YouTube.

الشروع في العمل

أداة إنشاء محتوى الصوت في Speech Studio مجانية للوصول إليها، ولكنك تدفع مقابل استخدام خدمة الكلام. للعمل باستخدام الأداة، تحتاج إلى تسجيل الدخول باستخدام حساب Azure وإنشاء مورد Speech. لكل حساب Azure، لديك حصص نسبية شهرية للكلام مجاناً، وهي تتضمن 0.5 مليون حرف للأصوات العصبية المُعدة مسبقاً (يشار إليها بـ العصبية في صفحة الأسعار). عادة ما يكون المبلغ المخصص شهريا كافيا لفريق محتوى صغير من حوالي 3-5 أشخاص.

تتناول المقاطع التالية كيفية إنشاء حساب Azure والحصول على مورد Speech.

الخطوة 1: إنشاء حساب Azure

للعمل باستخدام Audio Content Creation، تحتاج إلى حساب Microsoft وحساب Azure.

مدخل Azure مكان مركزي يمكنك من خلاله إدارة حسابك على Azure. يمكنك إنشاء مورد Speech وإدارة الوصول إلى المنتج ومراقبة كل شيء، بداية من تطبيقات الويب البسيطة إلى عمليات التوزيع المعقدة على السحابة.

الخطوة 2: إنشاء مورد Speech

بعد التسجيل في حساب Azure، تحتاج إلى إنشاء مورد Speech في حسابك على Azure للوصول إلى خدمات Speech. إنشاء مورد Speech على مدخل Azure. لمزيد من المعلومات، راجع إنشاء مورد متعدد الخدمات.

يستغرق الأمر بضع لحظات لتوزيع مورد الكلام الجديد. بعد اكتمال التوزيع، يمكنك بدء استخدام أداة Audio Content Creation.

إشعار

إذا كنت تخطط لاستخدام الأصوات العصبية، فتأكد من إنشاء موردك في منطقة تدعم الأصوات العصبية.

بعد الحصول على حساب Azure ومورد Speech، سجِّل الدخول إلى Speech Studio، ثم حدد Audio Content Creation.
حدد اشتراك Azure ومورد Speech الذي تريد العمل باستخدامه، ثم حدد استخدام المورد.

عند تسجيل الدخول إلى Audio Content Creation للمرة الثانية، يتم ربطك مباشرة بملفات عمل الصوت ضمن مورد Speech الحالي. يمكنك التحقق من تفاصيل اشتراك Azure وحالته في مدخل Azure.

إذا لم يتوفر لديك مورد Speech وكنت مالك اشتراك Azure أو مسؤوله، يمكنك إنشاء مورد Speech في Speech Studio بتحديد إنشاء مورد جديد.

إذا كان لديك دور مستخدم لاشتراك Azure معين، فقد لا يكون لديك أذونات لإنشاء مورد Speech جديد. اتصل بالمسؤول للحصول على حق الوصول.

لتبديل مورد Speech في أي وقت، حدد الإعدادات أعلى الصفحة.

لتبديل الدلائل، حدد الإعدادات أو انتقل إلى ملف تعريفك.

استخدام الأداة

يعرض الرسم التخطيطي التالي عملية ضبط مخرجات النص إلى كلام.

Diagram of the sequence of steps for fine-tuning text to speech outputs.

فيما يلي وصف لكل خطوة في المخطط السابق:

اختر مورد Speech الذي تريد العمل باستخدامه.
أنشئ ملف تحسين الصوت باستخدام نص عادي أو برامج SSML النصية. أدخل محتواك أو قم بتحميله إلى Audio Content Creation.
اختر الصوت واللغة لمحتوى البرنامج النصي. يتضمن إنشاء محتوى الصوت كل النص الذي تم إنشاؤه مسبقا لأصوات الكلام. يمكنك استخدام أصوات عصبية مُعدة مسبقاً أو صوت عصبي مخصص.

إشعار

يتوفر الوصول المسور للصوت العصبي المخصص، والذي يسمح لك بإنشاء أصوات عالية الجودة مشابهة للكلام الطبيعي. لمزيد من المعلومات، راجع عملية التحكم بالوصول عبر بوابة.
حدد المحتوى الذي تريد معاينته، ثم حدد تشغيل (أيقونة المثلث) لمعاينة إخراج التركيب الافتراضي.

إذا أجريت أي تغيير على النص، فحدد الأيقونة إيقاف، ثم حدد تشغيل مرة أخرى لإعادة إنشاء الصوت باستخدام البرامج النصية التي تم تغييرها.

يمكنك تحسين الإخراج عن طريق ضبط النطق والفاصل النغمي وحدة الصوت وسرعة الكلام ونمط الصوت ونبرته، وغير ذلك الكثير. للحصول على قائمة كاملة بالخيارات، راجع Speech Synthesis Markup Language.

لمزيد من المعلومات حول ضبط إخراج الكلام، اعرض فيديو كيفية تحويل النص إلى كلام باستخدام Microsoft Azure الذكاء الاصطناعي voices .
احفظ الصوت بعد الضبط وقم بتصديره.

عند حفظ مسار الضبط في النظام، يمكنك متابعة العمل وتكراره على الإخراج. عندما تكون راضياً عن الإخراج، يمكنك إنشاء مهمة لإنشاء صوت باستخدام ميزة التصدير. يمكنك مراقبة حالة مهمة التصدير وتنزيل الإخراج للاستخدام مع التطبيقات والمنتجات.

إنشاء ملف لضبط الصوت

يمكنك إدخال محتواك في أداة Audio Content Creation بأي من الطريقتين التاليتين:

الخيار 1
1. حدد جديد>ملف نصي لإنشاء ملف جديد لضبط الصوت.
2. أدخل المحتوى أو الصقه في نافذة التحرير. عدد الأحرف المسموح به لكل ملف هو 20000 أو أقل. إذا كان البرنامج النصي يحتوي على أكثر من 20000 حرف، يمكنك استخدام الخيار 2 لتقسيم المحتوى تلقائياً إلى ملفات متعددة.
3. حدد حفظ.

الخيار 2

حدد تحميل>ملف نصي لاستيراد ملف نصي واحد أو أكثر. يتوفر الدعم لكل من النص العادي وSSML.

إذا كان ملف البرنامج النصي أكثر من 20000 حرف، يمكنك تقسيم المحتوى حسب الفقرات أو حسب الأحرف أو حسب التعبيرات العادية.

عند تحميل الملفات النصية، تأكد من أنها تفي بالمتطلبات التالية:

الخاصية	‏‏الوصف
تنسيق الملف	نص عادي (.txt)* نص SSML ‏(.txt)** ملفات Zip غير مدعمة.
تنسيق الترميز	UTF-8
اسم الملف	يجب أن يكون لكل ملف اسم فريد. الملفات المكررة غير مدعمة.
طول النص	أقصى عدد مسموح به للأحرف هو 20000. إذا تجاوزت ملفاتك الحد الأقصى، يمكنك تقسيمها وفقاً للإرشادات الواردة في الأداة.
قيود SSML	يمكن أن يحتوي كل ملف SSML على جزء واحد فقط من SSML.

* مثال على النص العادي:

Welcome to use Audio Content Creation to customize audio output for your products.

** مثال على نص SSML:

<speak xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" version="1.0" xml:lang="en-US">
    <voice name="en-US-AvaMultilingualNeural">
    Welcome to use Audio Content Creation <break time="10ms" />to customize audio output for your products.
    </voice>
</speak>

تصدير الصوت المضبوط

بعد مراجعة إخراج الصوت والرضا عن ضبط الصوت وتعديله، يمكنك تصدير الصوت.

حدد تصدير لإنشاء مهمة إنشاء صوت.

من المستحسن التصدير إلى مكتبة الصوت لتخزين إخراج الصوت والبحث عنه والعثور عليه بسهولة في السحابة. يمكنك الاندماج بشكل أفضل مع تطبيقاتك من خلال Azure blob storage. يمكنك أيضاً تنزيل الصوت إلى القرص المحلي مباشرة.

اختر تنسيق إخراج الصوت بعد ضبطه. يوضَِح الجدول التالي تنسيقات الصوت المدعمة ونماذج السرعات:

Format	بسرعة 8 كيلوهرتز	بسرعة 16 كيلوهرتز	بسرعة 24 كيلوهرتز	بسرعة 48 كيلوهرتز
wav	riff-8khz-16bit-mono-pcm	riff-16khz-16bit-mono-pcm	riff-24khz-16bit-mono-pcm	riff-48khz-16bit-mono-pcm
mp3	‏‫غير متوفر‬	audio-16khz-128kbitrate-mono-mp3	audio-24khz-160kbitrate-mono-mp3	audio-48khz-192kbitrate-mono-mp3

لعرض حالة المهمة، حدد علامة التبويب قائمة المهام.

إذا فشلت المهمة، فشاهد صفحة المعلومات المفصّلة للحصول على تقرير كامل.
عند اكتمال المهمة، يتوفر الصوت للتنزيل في جزء مكتبة الصوت.
حدد الملف الذي تريد تنزيله واختر تنزيل.

أنت الآن مستعد لاستخدام الصوت المخصص المضبوط في تطبيقاتك أو منتجاتك.

تكوين BYOS والوصول للقراءة العامة المجهولة للكائنات الثنائية كبيرة الحجم

إذا فقدت إذن الوصول إلى إحضار التخزين الخاص بك (BYOS)، فلا يمكنك عرض الملفات أو إنشائها أو تحريرها أو حذفها. لاستئناف وصولك، تحتاج إلى إزالة التخزين الحالي وإعادة تكوين BYOS في مدخل Microsoft Azure. لمعرفة المزيد حول كيفية تكوين BYOS، راجع تحميل تخزين Azure كمشاركة محلية في App Service.

بعد تكوين إذن BYOS، تحتاج إلى تكوين وصول قراءة عام مجهول للحاويات والكائنات الثنائية كبيرة الحجم ذات الصلة. وإلا، لا تتوفر بيانات الكائن الثنائي كبير الحجم للوصول العام ولا يمكن الوصول إلى ملف المعجم الخاص بك في الكائن الثنائي كبير الحجم. بشكل افتراضي، يتم تعطيل إعداد الوصول العام للحاوية. لمنح المستخدمين المجهولين حق الوصول للقراءة إلى حاوية والكائنات الثنائية كبيرة الحجم الخاصة بها، قم أولا بتعيين Allow Blob public access to Enabled للسماح بالوصول العام لحساب التخزين، ثم قم بتعيين مستوى الوصول العام للحاوية (المسمى acc-public-files) (الوصول للقراءة المجهولة للكائنات الثنائية كبيرة الحجم فقط). لمعرفة المزيد حول كيفية تكوين الوصول العام المجهول للقراءة، راجع تكوين وصول القراءة العامة المجهول للحاويات والكائنات الثنائية كبيرة الحجم.

إضافة مستخدمي Audio Content Creation أو إزالتهم

إذا أراد أكثر من مستخدم واحد استخدام Audio Content Creation، يمكنك منحهم حق الوصول إلى اشتراك Azure ومورد Speech. إذا أضفت مستخدمين إلى اشتراك Azure، يمكنهم الوصول إلى جميع الموارد ضمن اشتراك Azure. ولكن إذا قمت بإضافة مستخدمين إلى مورد Speech فقط، فلن يكون لديهم سوى حق الوصول إلى مورد Speech وليس إلى الموارد الأخرى ضمن اشتراك Azure هذا. يمكن للمستخدمين الذين لديهم حق الوصول إلى مورد Speech استخدام أداة Audio Content Creation.

يجب على المستخدمين الذين تمنحهم حق الوصول إعداد حساب Microsoft. إذا لم يكن لأي منهم حساب على Microsoft، يمكنه إنشاء حساب خلال بضع دقائق فقط. يمكنهم استخدام بريدهم الإلكتروني الموجود وربطه بحساب Microsoft، أو يمكنهم إنشاء عنوان بريد إلكتروني على Outlook واستخدامه باعتباره حساب Microsoft.

إضافة مستخدمين إلى مورد Speech

لإضافة مستخدمين إلى مورد Speech حتى يتمكنوا من استخدام Audio Content Creation، قم بما يلي:

في مدخل Azure، حدد جميع الخدمات.
ثم حدد خدمات Azure الذكاء الاصطناعي، وانتقل إلى مورد Speech المحدد.

إشعار

يمكنك أيضاً إعداد Azure RBAC لمجموعات الموارد أو الاشتراكات أو مجموعات الإدارة بأكملها. يمكنك فعل ذلك عن طريق تحديد مستوى النطاق المطلوب ثم الانتقال إلى العنصر المطلوب (على سبيل المثال، تحديد مجموعات الموارد ثم النقر فوق مجموعة الموارد المطلوبة).
اخترالتحكم بالوصول (IAM) في جزء التنقل الأيمن.
اخترAdd->إضافة تعيين الدور.
في علامة التبويب الدور على الشاشة التالية، اختر الدور الذي تريد إضافته (في هذه الحالة المالك).
في علامة التبويب الأعضاء، أدخل عنوان البريد الإلكتروني للمستخدم وحدد اسم المستخدم في الدليل. يجب ربط عنوان البريد الإلكتروني بحساب Microsoft موثوق به بواسطة معرف Microsoft Entra. يمكن للمستخدمين التسجيل بسهولة للحصول على حساب Microsoft باستخدام عنوان البريد الإلكتروني الشخصي.
في علامة التبويب Review + assign ، حدد Review + assign لتعيين الدور.

إليك ما سيحدث بعد ذلك:

يتم إرسال دعوة بالبريد الإلكتروني تلقائياً إلى المستخدمين. ويمكن قبولها عن طريق تحديد قبول الدعوة>قبول الانضمام إلى Azure في البريد الإلكتروني. بعد ذلك، تتم إعادة توجيه المستخدمين إلى مدخل Azure. وليس عليهم اتخاذ أي إجراء آخر في مدخل Azure. بعد لحظات قليلة، يتم تعيين دور للمستخدمين في نطاق مورد Speech، ما يمنحهم حق الوصول إلى مورد Speech هذا. إذا لم يتلقَ المستخدمون دعوة بالبريد الإلكتروني، يمكنك البحث عن حساباتهم أسفل تعيينات الدور والانتقال إلى ملف التعريف لكل منهم. ابحث عن الهوية>قبول الدعوة، وحدد (إدارة) لإعادة إرسال دعوة بالبريد الإلكتروني. يمكنك أيضاً نسخ ارتباط الدعوة وإرساله إليهم.

يمكن للمستخدمين الآن زيارة صفحة منتج Audio Content Creation أو تحديثها، وتسجيل الدخول باستخدام حساب Microsoft. في هذه الصفحة، يمكنهم تحديد كتلة Audio Content Creation عبر جميع منتجات الكلام. ويمكنهم اختيار مورد Speech في النافذة المنبثقة أو في الإعدادات أعلى اليسار.

وإذا لم يتمكنوا من العثور على مورد Speech المتوفر، يمكنهم التحقق للتأكد من أنهم في الدليل الصحيح. ولفعل ذلك، يجب تحديد ملف تعريف الحساب أعلى اليسار ثم تحديد تبديل إلى جانب الدليل الحالي. إذا كان هناك أكثر من دليل واحد متاح، فهذا يعني أن لديهم حق الوصول إلى أدلة متعددة. يمكنهم التبديل إلى دلائل مختلفة والانتقال إلى الإعدادات لمعرفة ما إذا كان مورد Speech الصحيح متوفراً أم لا.

يرى المستخدمون الموجودون في نفس مورد Speech عمل بعضهم البعض في أداة إنشاء محتوى الصوت. إذا كنت تريد أن يكون لكل مستخدم مساحة عمل فريدة وخاصة في Audio Content Creation، فأنشئ مورد Speech جديد لكل مستخدم وامنح كل مستخدم حق الوصول الفريد إلى مورد Speech.

إزالة مستخدمين من مورد Speech

ابحث عن خدمات Azure الذكاء الاصطناعي في مدخل Microsoft Azure، وحدد مورد الكلام الذي تريد إزالة المستخدمين منه.
حدد التحكم بالوصول (IAM)، ثم حدد علامة التبويب تعيينات الدور لعرض جميع تعيينات الدور لمورد Speech هذا.
حدد المستخدمين الذين تريد إزالتهم، وحدد إزالة، ثم حدد موافق.

تمكين المستخدمين من منح حق الوصول للآخرين

إذا كنت تريد السماح لمستخدم بمنح حق الوصول إلى مستخدمين آخرين، فستحتاج إلى تعيين دور مالك مورد Speech إليهم، وتعيين المستخدم باعتباره قارئ دليل Azure.

أضف المستخدم باعتباره مالكاً لمورد Speech. لمزيد من المعلومات، راجع إضافة مستخدمين إلى مورد Speech.
في مدخل Microsoft Azure، حدد القائمة المطوية في أعلى اليسار، وحدد Microsoft Entra ID، ثم حدد Users.
ابحث عن حساب Microsoft الخاص بالمستخدم، وانتقل إلى صفحة التفاصيل، ثم حدد الأدوار المُعيّنة.
حدد إضافة التعيينات>قرّاء الدليل. إذا كان الزر إضافة تعيينات غير متوفر، فهذا يعني أنه ليس لديك حق الوصول. يمكن فقط للمسؤول العام لهذا الدليل إضافة تعيينات للمستخدمين.

Share via

تركيب الكلام باستخدام أداة إنشاء محتوى الصوت