ما المقصود بخدمة الكلام؟

خدمة الكلام هي توحيد ترجمة الكلام إلى نص، وتحويل النص إلى كلام، وترجمة الكلام في اشتراك Azure واحد. من السهل أن الكلام تمكين التطبيقات والأدوات والأجهزة الخاصة بك مع الكلام CLI،SPEECH SDK،Speech Studio،أو REST واجهات برمجة التطبيقات.

هام

حلت خدمة الكلام محل واجهة برمجة تطبيقات Bing Speech وTranslator Speech. راجع قسم الترحيل للحصول على إرشادات الترحيل.

الميزات التالية هي جزء من خدمة الكلام. استخدم الارتباطات الموجودة في هذا الجدول لمعرفة المزيد حول حالات الاستخدام الشائعة لكل ميزة، أو استعرض مرجع API.

الخدمة الميزة الوصف SDK REST
تحويل الكلام إلى نص تحويل الكلام إلى نص في الوقت الحقيقي يقوم تحويل الكلام إلى نص بنسخ أو ترجمة التدفقات الصوتية أو الملفات المحلية إلى نص في الوقت الفعلي يمكن أن تستهلكه أو تعرضه تطبيقاتك أو أدواتك أو أجهزتك. استخدم تحويل الكلام إلى النص مع فهم اللغة (LUIS) لاشتقاق نوايا المستخدم من الكلام المنسوخ والعمل على الأوامر الصوتية. نعم نعم
تحويل الكلام إلى نص بشكل مجمع يتيح تحويل الكلام إلى نص دفعة واحدة إمكانية النسخ غير المتزامن لتحويل الكلام إلى نص لكميات كبيرة من بيانات صوت الكلام المخزنة في Azure Blob Storage. بالإضافة إلى تحويل صوت الكلام إلى نص، فإن تحويل الكلام الدفعي إلى نص يسمح أيضًا بالتدوين وتحليل التوجه. لا نعم
محادثة متعددة الأجهزة قم بتوصيل عدة أجهزة أو عملاء في محادثة لإرسال رسائل نصية أو كلام، مع دعم سهل للنسخ والترجمة نعم لا
البرمجة النصية للمحادثة تقوم بتمكين التعرف على الكلام في الوقت الفعلي، وتحديد المتحدث، والتكرار. إنها مثالية لإسناد الاجتماعات الشخصية مع القدرة على تمييز المتحدثين. نعم لا
إنشاء نماذج مخصصة للكلام إذا كنت تستخدم تحويل الكلام إلى النص للتعرف عليه ونسخه في بيئة فريدة من نوعها، يمكنك إنشاء وتدريب نماذج صوتية ولغة ونطق مخصصة لمعالجة الضوضاء المحيطة أو المفردات الخاصة بالصناعة. لا نعم
تقييم النطق يقوم تقييم النطق بتقييم نطق الكلام ويعطي المتحدثين ملاحظات حول دقة وطلاقة الصوت المنطوق. مع تقييم النطق، يمكن لمتعلمي اللغة الممارسة، والحصول على ردود فعل فورية، وتحسين النطق بحيث يمكنهم التحدث والتواجد بثقة. نعم نعم
تحويل النص إلى كلام الأصوات العصبية المبنية مسبقا تحويل نص إلى كلام نص الإدخال إلى كلام مركب شبيه بالإنسان باستخدام لغة ترميز تجميع الكلام (SSML). استخدم الأصوات العصبية، وهي أصوات تشبه الإنسان تعمل بالشبكات العصبية العميقة. راجع دعم اللغة. نعم نعم
أصوات عصبية مخصصة إنشاء خطوط صوتية عصبية مخصصة فريدة من نوعها للعلامة التجارية أو المنتج الخاص بك. لا نعم
ترجمة الكلام ترجمة الكلام تتيح ترجمة الكلام إمكانية ترجمة الكلام في الوقت الفعلي ومن اللغات المتعددة إلى التطبيقات والأدوات والأجهزة. استخدم هذه الخدمة للترجمة من الكلام إلى الكلام ومن الكلام إلى النص. نعم لا
المساعدون الصوتيون المساعدون الصوتيون يعمل المساعدون الصوتيون الذين يستخدمون خدمة الكلام على تمكين المطورين من إنشاء واجهات محادثة طبيعية شبيهة بالبشر لتطبيقاتهم وتجاربهم. توفر خدمة المساعد الصوتي تفاعلًا سريعًا وموثوقًا بين الجهاز وتنفيذ المساعد الذي يستخدم قناة الكلام المباشر في Bot Framework أو خدمة الأوامر المخصصة المتكاملة لإكمال المهمة. نعم لا
Speaker Recognition تحديد التحقق من & السماعة توفر خدمة التعرف على المتحدث خوارزميات من شأنها التحقق وتحديد هوية المتحدثين من خلال خصائصهم الصوتية الفريدة. يستخدم التعرف على المتحدث للإجابة عن سؤال "من المتحدث؟". نعم نعم

جرب خدمة الكلام مجاناً

للخطوات التالية، تحتاج إلى حساب Microsoft وحساب Azure. إذا لم يكن لديك حساب Microsoft، يمكنك التسجيل للحصول على حساب واحد مجانًا في مدخل حساب Microsoft. حدد تسجيل الدخول باستخدام Microsoft ثم، عند مطالبتك بتسجيل الدخول، حدد إنشاء حساب Microsoft. اتبع الخطوات لإنشاء حساب Microsoft الجديد والتحقق منه.

بمجرد أن يكون لديك حساب Microsoft، انتقل إلى صفحة اشتراك Azure، وحدد البدء مجاناً، وأنشئ حساب Azure جديد باستخدام حساب Microsoft. فيما يلي مقطع فيديو عن كيفية الاشتراك في حساب Azure مجاني.

ملاحظة

عند الاشتراك في حساب Azure مجاني، يأتي مع رصيد خدمة بقيمة 200 دولار يمكنك تطبيقه على اشتراك خدمة الكلام المدفوع، وهو صالح لمدة تصل إلى 30 يوماً. يتم تعطيل خدمات Azure الخاصة بك عند نفاد رصيدك أو انتهاء صلاحيته في نهاية الـ 30 يوماً. لمتابعة استخدام خدمات Azure، يجب ترقية حسابك. لمزيد من المعلومات، راجع كيفية ترقية حسابك المجاني في Azure.

تحتوي خدمة الكلام على مستويين من الخدمة: مجاني (f0) والاشتراك (s0)، والتي لها قيود ومزايا مختلفة. إذا كنت تستخدم خدمة الكلام المجانية منخفضة الحجم، يمكنك الاحتفاظ بهذا الاشتراك المجاني حتى بعد انتهاء صلاحية رصيدك التجريبي المجاني أو رصيد الخدمة. لمزيد من المعلومات، راجع تسعير الخدمات المعرفية - خدمة الكلام.

إنشاء مورد Azure

لإضافة مورد خدمة الكلام (مستوى مجاني أو مدفوع) إلى حساب Azure الخاص بك:

  1. سجّل الدخول إلى مدخل Azure باستخدام حساب Microsoft.

  2. حدد Create a resource أعلى يسار المدخل. إذا لم تشاهد Create a resource، يمكنك دائما العثور عليه عن طريق تحديد القائمة المطوية في الزاوية العلوية اليسرى من الشاشة.

  3. في نافذة New، اكتب "الكلام" في مربع البحث ثم اضغط على مفتاح الإدخال ENTER.

  4. في نتائج البحث، حدد Speech.

    Create Speech resource in Azure portal.

  5. حدد إنشاء، ثم:

    • قدم اسماً فريداً للمورد الجديد. يساعدك الاسم في التمييز بين الاشتراكات المتعددة المرتبطة بنفس الخدمة.
    • اختر اشتراك Azure الذي يرتبط به المورد الجديد لتحديد كيفية فوترة الرسوم. فيما يلي مقدمة حول كيفية إنشاء اشتراك Azure في مدخل Azure.
    • اختر المنطقة التي سيتم استخدام المورد فيها. Azure عبارة عن نظام أساسي سحابي عالمي متوفر بشكل عام في العديد من المناطق حول العالم. للحصول على أفضل أداء، حدد المنطقة الأقرب إليك أو التي يتم تشغيل تطبيقك فيها. تختلف فرص توفر خدمة الكلام من مناطق مختلفة. تأكد من إنشاء المورد الخاص بك في منطقة معتمدة. راجع دعم المنطقة لخدمات الكلام.
    • اختر إما فئة تسعير مجانية (F0) أو مدفوعة (S0). للحصول على معلومات كاملة حول التسعير وحصص الاستخدام لكل مستوى، حدد عرض تفاصيل التسعير الكاملة أو راجع تسعير خدمات الكلام. للحصول على حدود الموارد، راجع حدود الخدمات المعرفية في Azure.
    • أنشئ مجموعة موارد جديدة للاشتراك في الكلام هذا أو تعيين الاشتراك إلى مجموعة موارد موجودة. تساعدك مجموعات الموارد في الحفاظ على تنظيم اشتراكات Azure المتنوعة.
    • حدد Create. سوف يأخذك هذا إلى نظرة عامة على التوزيع وعرض رسائل تقدم التوزيع.

يستغرق الأمر بضع لحظات لتوزيع مورد الكلام الجديد.

البحث عن المفاتيح والموقع/المنطقة

للبحث عن مفاتيح وموقع/منطقة توزيع مكتملة اتبع الخطوات التالية:

  1. سجّل الدخول إلى مدخل Azure باستخدام حساب Microsoft.

  2. حدد All resources، وحدد اسم مورد الخدمات المعرفية.

  3. في الجزء الأيمن، ضمن RESOURCE MANAGEMENT، حدد Keys and Endpoint.

يحتوي كل اشتراك على مفتاحين؛ يمكنك استخدام أي مفتاح في التطبيق لديك. لنسخ/لصق مفتاح إلى محرر التعليمات البرمجية أو موقع آخر، حدد زر النسخ بجوار كل مفتاح، وبدل النوافذ للصق محتويات الحافظة إلى الموقع المطلوب.

بالإضافة إلى ذلك، انسخ قيمة LOCATION، وهو معرف المنطقة (على سبيل المثال، westus، westeurope) لاستدعاءات SDK.

هام

يتم استخدام مفاتيح الاشتراك هذه للوصول إلى واجهة برمجة تطبيقات الخدمة المعرفية. لا تشارك مفاتيحك. قم بتخزينها بأمان - على سبيل المثال، باستخدام Azure Key Vault. نوصي أيضاً بإعادة تجديد هذه المفاتيح بانتظام. مفتاح واحد فقط ضروري لإجراء استدعاء واجهة برمجة التطبيقات. عند تجديد المفتاح الأول، يمكنك استخدام المفتاح الثاني للوصول المستمر إلى الخدمة.

إكمال التشغيل السريع

نحن نقدم تشغيل سريع في لغات البرمجة الأكثر شعبية، كل مصممة ليعلمك أنماط التصميم الأساسية، ويكون لك تشغيل التعليمات البرمجية في أقل من 10 دقيقة. راجع القائمة التالية لبدء التشغيل السريع لكل ميزة.

بعد أن تكون قد حصلت على فرصة للبدء في خدمة الكلام، جرب برامجنا التعليمية التي توضح لك كيفية حل السيناريوهات المختلفة.

الحصول على نموذج التعليمات البرمجية

يتوفر نموذج التعليمات البرمجية على GitHub لخدمة الكلام. تغطي هذه العينات سيناريوهات شائعة مثل قراءة الصوت من ملف أو دفق ، والتعرف المستمر وعند البدء ، والعمل مع النماذج المخصصة. استخدم هذه الارتباطات لعرض نماذج SDK وREST:

تخصيص تجربة الكلام

تعمل خدمة الكلام بشكل جيد مع النماذج المضمنة، ومع ذلك، قد تحتاج إلى تخصيص وتجانس تجربة المنتج أو البيئة لديك. تتراوح خيارات التخصيص من ضبط النماذج الصوتية إلى الخطوط الصوتية الفريدة للعلامة التجارية.

تقدم منتجات أخرى نماذج الكلام التي تم ضبطها لأغراض محددة، مثل الرعاية الصحية أو التأمين، ولكنها متاحة للجميع بشكل متساوٍ. يصبح التخصيص في Azure Speech جزءًا من ميزتك التنافسية الفريدة غير المتوفرة لأي مستخدم أو عميل آخر. بعبارة أخرى، تكون نماذجك خاصة ومضبوطة خصيصًا لحالة الاستخدام الخاصة بك فقط.

خدمة الكلام النظام الأساسي الوصف
تحويل الكلام إلى نص Custom Speech تخصيص نماذج التعرف على الكلام لاحتياجاتك والبيانات المتاحة. تغلب على حواجز التعرف على الكلام، مثل أسلوب التحدث والمفردات وضوضاء الخلفية.
تحويل النص إلى كلام صوت مخصص أنشئ صوتا عصبيا واحدا من نوعه لتطبيقات تحويل النص إلى كلام مع توفر بيانات التحدث. يمكنك زيادة صقل مخرجات الصوت العصبي عن طريق ضبط مجموعة من معلمات الصوت العصبي.

التوزيع محلياً باستخدام حاويات Docker

استخدام حاويات خدمة الكلام لتوزيع ميزات API في الموقع. تمكنك حاويات Docker هذه من تقريب الخدمة من بياناتك لأسباب تتعلق بالتوافق أو الأمان أو لأسباب تشغيلية أخرى. خدمة الكلام توفر الحاويات التالية:

  • خطاب إلى نص قياسي
  • مخصص الكلام إلى نص
  • نص عصبي مسبق البناء إلى كلام
  • مخصص Neural النص إلى كلام (معاينة)
  • تعريف لغة الكلام (معاينة)

وثائق مرجعية

الخطوات التالية