Hızlı Başlangıç: Azure AI Konuşma CLI'sını kullanmaya başlama

Bu makalede, herhangi bir kod yazmak zorunda kalmadan konuşmayı metne dönüştürme, metin okuma ve konuşma çevirisi gibi Konuşma hizmetlerine erişmek için Azure AI Konuşma CLI'sını (SPX olarak da adlandırılır) kullanmayı öğreneceksiniz. Konuşma CLI'sı üretime hazırdır ve konuşma hizmetindeki basit iş akışlarını veya kabuk betiklerini kullanarak .bat otomatikleştirmek için kullanabilirsiniz.

Bu makalede Komut İstemi penceresi, terminal veya PowerShell hakkında bilgi sahibi olduğunuz varsayılır.

Not

PowerShell'de, ayrıştırmayı durdurma belirteci (--%) izlenmelidir spx. Örneğin, geçerli bölge yapılandırma değerini görüntülemek için komutunu çalıştırın spx --% config @region .

İndirme ve kurma

Konuşma CLI'sini Windows'a yüklemek için şu adımları izleyin:

  1. Platformunuz için Microsoft Visual Studio için Visual C++ Yeniden Dağıtılabilir 2019'u yükleyin. İlk kez yüklemek için yeniden başlatma gerekebilir.

  2. .NET 6'yi yükleyin.

  3. Şu komutu girerek Konuşma CLI'sini .NET CLI aracılığıyla yükleyin:

    dotnet tool install --global Microsoft.CognitiveServices.Speech.CLI
    

    Konuşma CLI'sını güncelleştirmek için şu komutu girin:

    dotnet tool update --global Microsoft.CognitiveServices.Speech.CLI
    

Konuşma CLI'sı için yardım almak için veya spx help yazınspx.

Yazı tipi sınırlamaları

Windows'da Konuşma CLI'si yalnızca yerel bilgisayardaki komut isteminde kullanılabilen yazı tiplerini gösterebilir. Windows Terminali , Konuşma CLI'sinin etkileşimli olarak ürettiği tüm yazı tiplerini destekler.

Bir dosyaya çıkış yaparsanız, Not Defteri gibi bir metin düzenleyicisi veya Microsoft Edge gibi bir web tarayıcısı da tüm yazı tiplerini gösterebilir.

Kaynak yapılandırması oluşturma

Başlamak için konuşma kaynak anahtarına ve bölge tanımlayıcısına (örneğin, , eastuswestus) ihtiyacınız vardır. Azure portalında konuşma kaynağı oluşturma. Daha fazla bilgi için bkz . Çok hizmetli kaynak oluşturma.

Kaynak anahtarınızı ve bölge tanımlayıcınızı yapılandırmak için aşağıdaki komutları çalıştırın:

spx config @key --set SPEECH-KEY
spx config @region --set SPEECH-REGION

Anahtar ve bölge, gelecekteki Konuşma CLI komutları için depolanır. Geçerli yapılandırmayı görüntülemek için aşağıdaki komutları çalıştırın:

spx config @key
spx config @region

Gerektiğinde, depolanan değerlerden clear birini kaldırma seçeneğini ekleyin:

spx config @key --clear
spx config @region --clear

Temel kullanım

Önemli

Konuşma CLI'sini bir kapsayıcıda kullanırken seçeneğini ekleyin --host . CLI'nın kimlik doğrulaması için Konuşma anahtarı kullanmadığından emin olmak için de belirtmelisiniz --key none . Örneğin, konuşmayı metin kapsayıcısında bir ses dosyasından tanımak için komutunu çalıştırınspx recognize --key none --host wss://localhost:5000/ --file myaudio.wav.

Bu bölümde, ilk kez test ve deneme için genellikle yararlı olan birkaç temel SPX komutu gösterilmektedir. Araç içi yardımı görüntülemek için aşağıdaki komutu çalıştırın:

spx

Yardım konularını anahtar sözcükle arayabilirsiniz. Örneğin, Konuşma CLI'sı kullanım örneklerinin listesini görmek için aşağıdaki komutu çalıştırın:

spx help find --topics "examples"

Komutun recognize seçeneklerini görmek için aşağıdaki komutu çalıştırın:

spx help recognize

Konsol çıkışında daha fazla yardım komutu listelenir. Alt komutlar hakkında ayrıntılı yardım almak için bu komutları girebilirsiniz.

Konuşmayı metne dönüştürme (konuşma tanıma)

Not

Konuşma CLI'sini bir Docker kapsayıcısında çalıştırdığınızda bilgisayarınızın mikrofonunu kullanamazsınız. Ancak, yerel bağlı dizininizde ses dosyalarını okuyabilir ve kaydedebilirsiniz.

Sisteminizin varsayılan mikrofonunu kullanarak konuşmayı metne dönüştürmek (konuşma tanıma) için aşağıdaki komutu çalıştırın:

spx recognize --microphone

Komutu çalıştırdıktan sonra, SPX geçerli etkin giriş cihazında ses dinlemeye başlar. Enter'ı seçtiğinizde dinlemeyi durdurur. Daha sonra konuşulan ses tanınır ve konsol çıkışındaki metne dönüştürülür.

Konuşma CLI'sı ile ses dosyasındaki konuşmayı da tanıyabilirsiniz. Şu komutu çalıştırın:

spx recognize --file /path/to/file.wav

İpucu

Takılırsanız veya Konuşma CLI'sı tanıma seçenekleri hakkında daha fazla bilgi edinmek isterseniz komutunu çalıştırabilirsiniz spx help recognize.

Metin okuma (konuşma sentezi)

Aşağıdaki komut, girdi olarak metni alır ve ardından sentezlenen konuşmayı geçerli etkin çıkış cihazına (örneğin, bilgisayar hoparlörleriniz) çıkarır.

spx synthesize --text "Testing synthesis using the Speech CLI" --speakers

Sentezlenen çıkışı bir dosyaya da kaydedebilirsiniz. Bu örnekte, komutunu çalıştırdığınız dizinde my-sample.wav adlı bir dosya oluşturalım.

spx synthesize --text "Enjoy using the Speech CLI." --audio output my-sample.wav

Bu örneklerde İngilizce test ettiğiniz varsayılıyor. Ancak, Konuşma tanıma hizmeti birçok dilde konuşma sentezi destekler. Aşağıdaki komutu çalıştırarak veya dil destek sayfasını ziyaret ederek seslerin tam listesini aşağı çekebilirsiniz.

spx synthesize --voices

İşte keşfettiğiniz seslerden birini kullanmaya yönelik bir komut.

spx synthesize --text "Bienvenue chez moi." --voice fr-FR-AlainNeural --speakers

İpucu

Takılırsanız veya Konuşma CLI'sı tanıma seçenekleri hakkında daha fazla bilgi edinmek isterseniz komutunu çalıştırabilirsiniz spx help synthesize.

Konuşmayı metin çevirisine dönüştürme

Konuşma CLI'sı ile metin çevirisine konuşma da yapabilirsiniz. Varsayılan mikrofonunuzdan ses yakalamak ve çeviriyi metin olarak çıkarmak için aşağıdaki komutu çalıştırın. komutuyla translate ve target dilini sağlamanız source gerektiğini unutmayın.

spx translate --microphone --source en-US --target ru-RU

Birden çok dile çevirirken, dil kodlarını noktalı virgülle (;) ayırın.

spx translate --microphone --source en-US --target ru-RU;fr-FR;es-ES

Çevirinizin çıkışını kaydetmek istiyorsanız bayrağını --output kullanın. Bu örnekte, bir dosyadan da okursunuz.

spx translate --file /some/file/path/input.wav --source en-US --target ru-RU --output file /some/file/path/russian_translation.txt

İpucu

Takılırsanız veya Konuşma CLI'sı tanıma seçenekleri hakkında daha fazla bilgi edinmek isterseniz komutunu çalıştırabilirsiniz spx help translate.

Sonraki adımlar