ما المقصود من Speech CLI؟

Speech CLI هو أداة سطر أوامر لاستخدام خدمة Speech دون كتابة أية تعليمات برمجية. يتطلب Speech CLI الحد الأدنى من الإعداد. يمكنك استخدامه بسهولة لتجربة الميزات الرئيسية لخدمة Speech ومعرفة كيفية عملها مع حالات الاستخدام الخاصة بك. في غضون دقائق، يمكنك تشغيل مهام سير عمل اختبار بسيطة، مثل التعرف على الكلام الدفعي من دليل الملفات أو النص إلى الكلام على مجموعة من السلاسل من ملف. بالإضافة إلى عمليات سير العمل البسيطة، فإن Speech CLI جاهز للإنتاج، ويمكنك توسيعه لتشغيل عمليات أكبر باستخدام البرامج النصية التلقائية shell أو .bat.

تتوفر معظم الميزات في Speech SDK في Speech CLI ثم يتم تبسيط بعض الميزات المتقدمة والتخصيصات في Speech CLI. عندما تقرر متى تستخدم Speech CLI أو Speech SDK، ضع في اعتبارك الإرشادات التالية.

استخدم Speech CLI عندما:

  • تريد تجربة ميزات خدمة Speech مع الحد الأدنى من الإعداد ودون الحاجة إلى كتابة تعليمة برمجية.
  • لديك متطلبات بسيطة نسبياً لتطبيق إنتاج باستخدام خدمة Speech.

استخدم Speech SDK عند:

  • تريد دمج مهام خدمة Speech ضمن لغة أو نظام أساسي معين (على سبيل المثال، C# أو Python أو C++).
  • لديك متطلبات معقدة قد تتطلب طلبات خدمة متقدمة.
  • أنت تطور سلوكاً مخصصاً، بما في ذلك تدفق الاستجابة.

الميزات الأساسية

  • التعرف على الكلام: تحويل الكلام إلى نص إما من ملفات صوتية أو مباشرة من ميكروفون، أو نسخ محادثة مسجلة.

  • تجميع الكلام: تحويل النص إلى كلام إما باستخدام الإدخال من الملفات النصية أو عن طريق الإدخال مباشرة من سطر الأوامر. تخصيص خصائص إخراج الكلام باستخدام تكوينات لغة ترميز تركيب الكلام (SSML).

  • ترجمة الكلام: ترجمة الصوت بلغة مصدر إلى نص أو صوت بلغة مستهدفة.

  • التشغيل على موارد حساب Azure: إرسال أوامر Speech CLI للتشغيل على مورد حساب عن بُعد في Azure باستخدام spx webjob.

الشروع في العمل

لبدء استخدام تحويل الكلام إلى نص، راجع التشغيل السريع. توضح لك هذه المقالة كيفية تشغيل بعض الأوامر الأساسية. كما أنه يمنحك أوامر أكثر تقدما قليلا لتشغيل عمليات الدفعة لتحويل الكلام إلى نص والنص إلى كلام. بعد قراءة مقالة الأساسيات، يجب أن تفهم بناء الجملة بما يكفي لبدء كتابة بعض الأوامر المخصصة أو أتمتة عمليات خدمة الكلام البسيطة.

الخطوات التالية