Menginstal Speech SDK

Dokumentasi referensi | Paket (NuGet) | Sampel Tambahan pada GitHub

Panduan ini menunjukkan cara menginstal Speech SDK untuk C#.

Sampel kode dalam dokumentasi ditulis dalam C# 8 dan dijalankan pada .NET standar 2.0.

Persyaratan platform

Speech SDK untuk C# kompatibel dengan Windows, Linux, dan macOS.

Di Windows, Anda harus menggunakan arsitektur target x64.

Anda harus menginstal Microsoft Visual C++ Redistributable untuk Visual Studio 2015, 2017, 2019 atau 2022 untuk platform Anda. Memasang paket ini untuk pertama kalinya mungkin memerlukan menghidupkan ulang.

Menginstal Speech SDK

Speech SDK untuk C# tersedia sebagai paket NuGet dan menerapkan .NET Standar 2.0. Untuk informasi selengkapnya, lihat Microsoft.CognitiveServices.Speech .

Speech SDK untuk C# dapat diinstal dari .NET CLI dengan perintah dotnet add berikut:

dotnet add package Microsoft.CognitiveServices.Speech

Speech SDK untuk C# dapat diinstal dengan perintah Install-Package berikut:

Install-Package Microsoft.CognitiveServices.Speech

Anda dapat mengikuti panduan di bawah ini untuk opsi tambahan.

Memilih target lingkungan Anda

Panduan ini memperlihatkan cara menginstal Speech SDK untuk aplikasi konsol .NET Framework (Windows).

Prasyarat

Panduan ini memerlukan:

Membuat proyek Visual Studio dan memasang SDK Speech

Anda harus memasang paket NuGet Speech SDK agar dapat mereferensikannya dalam kode Anda. Untuk melakukannya, pertama-tama Anda perlu membuat proyek helloworld. Jika sudah memiliki proyek dengan beban kerja pengembangan desktop .NET yang tersedia, Anda dapat menggunakan proyek tersebut dan melompat ke Menggunakan Pengelola Paket NuGet untuk memasang SDK Speech.

Membuat proyek helloworld

  1. Buka Visual Studio Code 2019.

  2. Di jendela Mulai, pilih Buat proyek baru.

  3. Di jendela Buat proyek baru, pilih Aplikasi Konsol (.NET Framework) , lalu pilih Berikutnya.

  4. Di jendela Konfigurasikan proyek baru, masukkan helloworld di Nama proyek, pilih atau buat jalur direktori di Lokasi, lalu pilih Buat.

  5. Dari bilah menu Visual Studio, pilih Alat>Dapatkan Alat dan Fitur. Langkah ini membuka pemasang Visual Studio dan menampilkan dialog Memodifikasi.

  6. Periksa apakah beban kerja pengembangan desktop .NET tersedia. Jika beban kerja belum diinstal, pilih kotak centang di sampingnya, lalu pilih Ubah untuk memulai penginstalan. Mungkin perlu beberapa menit untuk mengunduh dan memasang.

    Jika kotak centang di samping pengembangan desktop .NET sudah centang, pilih Tutup untuk keluar dari kotak dialog.

    Screenshot that shows enabling .NET desktop development.

  7. Tutup Alat Penginstal Visual Studio.

Gunakan Pengelola Paket NuGet untuk memasang SDK Speech

  1. Di Penjelajah Solusi, klik kanan proyek helloworld, lalu pilih Kelola Paket NuGet untuk menampilkan Pengelola Paket NuGet.

  2. Di pojok kanan atas, temukan kotak drop-down Sumber Paket, dan pastikan nuget.org dipilih.

    Screenshot that shows NuGet Package Manager.

  3. Di pojok kiri atas, pilih Telusuri.

  4. Dalam kotak pencarian, ketik Microsoft.CognitiveServices.Speech dan pilih Enter.

  5. Dari hasil pencarian, pilih paket Microsoft.CognitiveServices.Speech, lalu pilih Instal untuk menginstal versi stabil terbaru.

    Screenshot that shows installing the Microsoft.CognitiveServices.Speech NuGet package.

  6. Terima semua perjanjian dan lisensi untuk memulai penginstalan.

    Setelah paket dipasang, konfirmasi akan muncul di jendela Konsol Pengelola Paket.

Memilih arsitektur target

Sekarang, untuk membuat dan menjalankan aplikasi konsol, buat konfigurasi platform yang sesuai dengan arsitektur komputer Anda.

  1. Dari bilah menu, pilih Build>Configuration Manager. Kotak dialog Pengelola Konfigurasi akan muncul.

  2. Di kotak drop-down Platform solusi aktif, pilih Baru. Kotak dialog Platform Solusi Baru akan muncul.

    Screenshot that shows the Configuration Manager dialog.

  3. Di kotak drop-down Ketik atau pilih platform baru:

    • Jika Anda menjalankan Windows 64-bit, pilih x64.
    • Jika Anda menjalankan Windows 32-bit, pilih x86.
  4. Pilih OK lalu Tutup.

Dokumentasi referensi | Paket (NuGet) | Sampel Tambahan pada GitHub

Panduan ini menunjukkan cara menginstal Speech SDK untuk C++.

Persyaratan platform

Speech SDK untuk C++ kompatibel dengan Windows, Linux, dan macOS.

Pada Windows, Anda dapat menggunakan arsitektur target x64 atau x86.

Anda harus menginstal Microsoft Visual C++ Redistributable untuk Visual Studio 2015, 2017, 2019 atau 2022 untuk platform Anda. Memasang paket ini untuk pertama kalinya mungkin memerlukan menghidupkan ulang.

Menginstal Speech SDK

Speech SDK untuk C++ tersedia sebagai paket NuGet. Untuk informasi selengkapnya, lihat Microsoft.CognitiveServices.Speech .

Speech SDK untuk C++ dapat diinstal dari .NET CLI dengan perintah dotnet add berikut:

dotnet add package Microsoft.CognitiveServices.Speech

Speech SDK untuk C# dapat diinstal dengan perintah Install-Package berikut:

Install-Package Microsoft.CognitiveServices.Speech

Anda dapat mengikuti panduan di bawah ini untuk opsi tambahan.

Memilih target lingkungan Anda

Panduan ini menunjukkan cara memasang Speech SDK pada Linux.

Gunakan prosedur berikut untuk mengunduh dan memasang SDK. Langkah ini termasuk pengunduhan pustaka yang dibutuhkan dan file header sebagai file .tar dari https://aka.ms/csspeech/linuxbinary.

  1. Pilih direktori tempat file Speech SDK harus diekstraksi, dan set SPEECHSDK_ROOT variabel lingkungan untuk mengarahkan ke direktori tersebut. Variabel ini memudahkan untuk merujuk ke direktori pada perintah di masa mendatang.

    Misalnya, jika Anda ingin menggunakan direktori speechsdk di direktori rumah Anda, gunakan perintah seperti berikut:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Buat direktori jika belum ada:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Unduh dan ekstrak arsip .tar.gz yang berisi biner Speech SDK:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Validasi konten direktori tingkat atas dari paket yang diekstrak:

    ls -l "$SPEECHSDK_ROOT"
    

    Daftar direktori harus berisi pemberitahuan pihak ketiga dan file lisensi. Daftar juga harus berisi direktori yang include menyimpan file header (.h) dan direktori yang lib menyimpan pustaka untuk arm32, arm64, x64, dan x86.

    Jalur Deskripsi
    license.md Lisensi
    ThirdPartyNotices.md Pengumuman pihak ketiga
    REDIST.txt Pemberitahuan redistribusi
    include File header yang diperlukan untuk C ++
    lib/arm32 Library native untuk ARM32 yang diperlukan untuk menautkan aplikasi Anda
    lib/arm64 Library native untuk ARM64 yang diperlukan untuk menautkan aplikasi Anda
    lib/x64 Library native untuk x64 yang diperlukan untuk menautkan aplikasi Anda
    lib/x86 Library native untuk x86 yang diperlukan untuk menautkan aplikasi Anda

Dokumentasi referensi | Paket (Go) | Sampel Tambahan pada GitHub

Panduan ini menunjukkan cara menginstal Speech SDK untuk Go.

Persyaratan platform

SDK Ucapan hanya mendukung Ubuntu 18.04/20.04/22.04, Debian 9/10/11, Red Hat Enterprise Linux (RHEL) 8, and CentOS 8 pada arsitektur x64 saat digunakan dengan Linux.

Penting

Gunakan rilis LTS terbaru dari distribusi Linux. Misalnya, jika Anda menggunakan Ubuntu 20.04 LTS, gunakan rilis terbaru Ubuntu 20.04.X.

Untuk aplikasi native, Speech SDK bergantung pada libMicrosoft.CognitiveServices.Speech.core.so. Pastikan arsitektur target (x86, x64) cocok dengan aplikasi. Tergantung pada versi Linux, dependensi lain mungkin diperlukan:

  • Pustaka bersama dari pustaka GNU C, termasuk pustaka Pemrograman Thread POSIX, libpthreads
  • Pustaka OpenSSL (libssl) versi 1.x
  • Pustaka bersama untuk aplikasi ALSA (libasound)
sudo apt-get update
sudo apt-get install build-essential libssl-dev libasound2 wget

Penting

Pada Ubuntu 22.04, instal libssl1.1 baik sebagai paket biner seperti libssl1.1_1.1.1l-1ubuntu1.3_amd64.deb, atau dengan mengompilasinya dari sumber. Speech SDK tidak mendukung OpenSSL 3.0, yang merupakan default di Ubuntu 22.04.

Berikut adalah contoh penginstalan libssl1.1 pada Ubuntu 22.04:

wget http://security.ubuntu.com/ubuntu/pool/main/o/openssl/libssl1.1_1.1.1l-1ubuntu1.3_amd64.deb
sudo dpkg -i libssl1.1_1.1.1l-1ubuntu1.3_amd64.deb

Anda harus menginstal Go biner versi 1.13 atau yang lebih baru.

Menginstal Speech SDK

Gunakan prosedur berikut untuk mengunduh dan memasang SDK. Langkah ini termasuk pengunduhan pustaka yang dibutuhkan dan file header sebagai file .tar dari https://aka.ms/csspeech/linuxbinary.

  1. Pilih direktori tempat file Speech SDK harus diekstraksi, dan set SPEECHSDK_ROOT variabel lingkungan untuk mengarahkan ke direktori tersebut. Variabel ini memudahkan untuk merujuk ke direktori pada perintah di masa mendatang.

    Misalnya, jika Anda ingin menggunakan direktori speechsdk di direktori rumah Anda, gunakan perintah seperti berikut:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Buat direktori jika belum ada:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Unduh dan ekstrak arsip .tar.gz yang berisi biner Speech SDK:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Validasi konten direktori tingkat atas dari paket yang diekstrak:

    ls -l "$SPEECHSDK_ROOT"
    

    Daftar direktori harus berisi pemberitahuan pihak ketiga dan file lisensi. Daftar juga harus berisi direktori yang include menyimpan file header (.h) dan direktori yang lib menyimpan pustaka untuk arm32, arm64, x64, dan x86.

    Jalur Deskripsi
    license.md Lisensi
    ThirdPartyNotices.md Pengumuman pihak ketiga
    REDIST.txt Pemberitahuan redistribusi
    include File header yang diperlukan untuk C ++
    lib/arm32 Library native untuk ARM32 yang diperlukan untuk menautkan aplikasi Anda
    lib/arm64 Library native untuk ARM64 yang diperlukan untuk menautkan aplikasi Anda
    lib/x64 Library native untuk x64 yang diperlukan untuk menautkan aplikasi Anda
    lib/x86 Library native untuk x86 yang diperlukan untuk menautkan aplikasi Anda

Mengonfigurasi lingkungan Go

Lakukan langkah-langkah berikut untuk menyiapkan lingkungan Go Anda untuk menemukan Speech SDK. Dalam kedua langkah, ganti <architecture> dengan arsitektur prosesor CPU Anda. Arsitektur ini akan menjadi x86, x64, arm32, atau arm64.

  1. Karena pengikatan mengandalkan cgo, Anda perlu mengatur variabel lingkungan agar Go dapat menemukan SDK.

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    
  2. Untuk menjalankan aplikasi dan SDK, Anda perlu memberi tahu sistem operasi tempat menemukan pustaka.

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

Dokumentasi referensi | Sampel Tambahan pada GitHub

Panduan ini menunjukkan cara memasang Speech SDK untuk Java.

Persyaratan platform

Memilih target lingkungan Anda

Speech SDK untuk Java kompatibel dengan Windows, Linux, dan macOS.

Di Windows, Anda harus menggunakan arsitektur target x64.

Anda harus menginstal Microsoft Visual C++ Redistributable untuk Visual Studio 2015, 2017, 2019 atau 2022 untuk platform Anda. Memasang paket ini untuk pertama kalinya mungkin memerlukan menghidupkan ulang.

Anda harus menginstal Java Development Kit seperti Azul Zulu OpenJDK. Microsoft Build of OpenJDK atau JDK pilihan Anda juga harus berfungsi.

Menginstal Speech SDK

Beberapa instruksi menggunakan versi SDK tertentu seperti 1.22.0. Anda dapat memeriksa versi terbaru dengan mencari repositori GitHub kami.

Memilih target lingkungan Anda

Panduan ini menunjukkan cara menginstal Speech SDK untuk Java pada Java Runtime.

Catatan

Speech SDK untuk Java tidak tersedia di repositori pusat Maven. Baik Anda menggunakan Gradle atau file dependensi pom.xml, Anda perlu menambahkan repositori kustom yang menunjuk ke https://azureai.azureedge.net/maven/. (Lihat di bawah untuk nama paket.)

Sistem operasi yang didukung

Paket Java Speech SDK tersedia untuk sistem operasi berikut:

Ikuti langkah-langkah berikut untuk menginstal Speech SDK untuk Java menggunakan Apache Maven:

  1. Menginstal Apache Maven.
  2. Buka perintah tempat Anda menginginkan proyek baru berada dan buat file pom.xml baru.
  3. Salin konten XML berikut ke pom.xml:
    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <repositories>
            <repository>
            <id>maven-cognitiveservices-speech</id>
            <name>Microsoft Cognitive Services Speech Maven Repository</name>
            <url>https://azureai.azureedge.net/maven/</url>
            </repository>
        </repositories>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.22.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. Jalankan perintah Maven berikut untuk menginstal SDK Azure Cognitive Service untuk Ucapan dan dependensi.
    mvn clean dependency:copy-dependencies
    

Dokumentasi referensi | Paket (npm) | Sampel Tambahan pada kode sumber GitHub | Library

Panduan ini menunjukkan cara menginstal Speech SDK untuk JavaScript.

Speech SDK untuk JavaScript tersedia sebagai paket npm. Lihat microsoft-cognitiveservices-speech-sdk dan repositori GitHub pendampingnya cognitive-services-speech-sdk-js.

Persyaratan platform

Pastikan untuk mempertimbangkan berbagai implikasi arsitektur antara Node.js dan browser web klien. Misalnya, model objek dokumen (DOM) tidak tersedia untuk aplikasi sisi server seperti halnya sistem file Node.js yang tidak tersedia untuk aplikasi sisi klien.

Menginstal Speech SDK

Bergantung pada lingkungan target, gunakan salah satu panduan berikut ini:

Memilih target lingkungan Anda

Panduan ini menunjukkan cara memasang Speech SDK untuk JavaScript untuk digunakan dengan Node.js. Jika Anda hanya ingin nama paket memulainya sendiri, jalankan npm install microsoft-cognitiveservices-speech-sdk dalam proyek yang ada.

Prasyarat

Mulai cepat ini membutuhkan Node.js.

Membuat proyek npm

Buat direktori baru, jalankan npm init dan pelajari perintahnya.

Menambahkan paket SDK Ucapan

Jalankan npm install microsoft-cognitiveservices-speech-sdk.

Panduan ini menunjukkan cara memasang Speech SDK untuk JavaScript untuk digunakan dengan Node.js.

  1. Instal Node.js.

  2. Buat direktori baru, jalankan npm init dan pelajari perintahnya.

  3. Untuk menginstal Speech SDK untuk JavaScript, jalankan perintah npm install berikut:

    npm install microsoft-cognitiveservices-speech-sdk
    

Untuk informasi selengkapnya, lihat sampel Node.js.

Menggunakan Speech SDK

Tambahkan pernyataan impor berikut untuk menggunakan Speech SDK di proyek JavaScript Anda:

import * as sdk from "microsoft-cognitiveservices-speech-sdk";

Untuk informasi importselengkapnya tentang, lihat Ekspor dan Impor di situs web JavaScript.

Atau, Anda dapat menggunakan pernyataan persyaratan:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

Untuk informasi lebih lanjut tentang require, lihat Apa yang diperlukan? di situs web Node.js.

Dokumentasi referensi | Paket (Unduh) | Sampel Tambahan pada GitHub

Panduan ini menunjukkan cara menginstal Speech SDK untuk Objective-C.

Tip

Untuk detail tentang penggunaan Speech SDK untuk Swift, lihat Mengimpor Objective-C ke Swift.

Menginstal Speech SDK

Speech SDK untuk Objective-C tersedia secara native sebagai paket CocoaPod untuk Mac x64 dan silikon berbasis ARM.

Persyaratan sistem untuk Mac:

  • MacOS versi 10.14 atau yang lebih baru

Paket macOS CocoaPod tersedia untuk diunduh dan digunakan dengan lingkungan pengembangan terintegrasi (IDE) Xcode 9.4.1 (atau yang lebih baru).

  1. Buka direktori Xcode di mana file proyek .xcodeproj Anda berada.

  2. Jalankan pod init untuk membuat file pod bernama Podfile.

  3. Ganti isi Podfile dengan yang berikut ini. Perbarui nama target dari 'AppName' ke nama aplikasi Anda. Perbarui platform atau versi pod sesuai kebutuhan.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.22.0'
    end
    
  4. Jalankan pod install untuk menginstal Speech SDK.

Atau, Anda dapat mengunduh CocoaPod biner dan membuka zip untuk mengekstrak kontennya. Dalam proyek Xcode Anda, tambahkan referensi ke folder "MicrosoftCognitiveServicesSpeech.xcframework" yang diekstrak dan isinya.

Catatan

Pengembang .NET dapat membangun aplikasi macOS asli dengan menggunakan kerangka kerja aplikasi Xamarin.Mac. Untuk informasi selengkapnya, lihat Xamarin.Mac.

Dokumentasi referensi | Paket (Unduh) | Sampel Tambahan pada GitHub

Panduan ini menunjukkan cara memasang Speech SDK untuk Swift.

Tip

Untuk detail tentang penggunaan Speech SDK untuk Swift, lihat Mengimpor Objective-C ke Swift.

Menginstal Speech SDK

Speech SDK untuk Swift tersedia secara native sebagai paket CocoaPod untuk Mac x64 dan silikon berbasis ARM.

Persyaratan sistem untuk Mac:

  • MacOS versi 10.14 atau yang lebih baru

Paket macOS CocoaPod tersedia untuk diunduh dan digunakan dengan lingkungan pengembangan terintegrasi (IDE) Xcode 9.4.1 (atau yang lebih baru).

  1. Buka direktori Xcode di mana file proyek .xcodeproj Anda berada.

  2. Jalankan pod init untuk membuat file pod bernama Podfile.

  3. Ganti isi Podfile dengan yang berikut ini. Perbarui nama target dari 'AppName' ke nama aplikasi Anda. Perbarui platform atau versi pod sesuai kebutuhan.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.22.0'
    end
    
  4. Jalankan pod install untuk menginstal Speech SDK.

Atau, Anda dapat mengunduh CocoaPod biner dan membuka zip untuk mengekstrak kontennya. Dalam proyek Xcode Anda, tambahkan referensi ke folder "MicrosoftCognitiveServicesSpeech.xcframework" yang diekstrak dan isinya.

Catatan

Pengembang .NET dapat membangun aplikasi macOS asli dengan menggunakan kerangka kerja aplikasi Xamarin.Mac. Untuk informasi selengkapnya, lihat Xamarin.Mac.

Dokumentasi referensi | Paket (PyPi) | Sampel Tambahan pada GitHub

Panduan ini menunjukkan cara memasang SDK Ucapan pada Python.

Persyaratan platform

Speech SDK untuk Python kompatibel dengan Windows, Linux, dan macOS.

Pada Windows, Anda dapat menggunakan arsitektur target x64 atau x86.

Anda harus menginstal Microsoft Visual C++ Redistributable untuk Visual Studio 2015, 2017, 2019 atau 2022 untuk platform Anda. Memasang paket ini untuk pertama kalinya mungkin memerlukan menghidupkan ulang.

Pasang versi Python dari 3.7 hingga 3.10. Untuk memeriksa penginstalan Anda, buka terminal dan jalankan perintah python --version. Jika terpasang dengan benar, Anda akan mendapatkan respons seperti "Python 3.8.2".

Penting

Pastikan paket dari platform yang sama (x64 atau x86) dipasang. Misalnya, jika Anda menginstal paket x64 yang dapat didistribusikan ulang, maka Anda perlu menginstal paket Python x64.

Menginstal Speech SDK

Sebelum Anda memasang Speech SDK untuk Python, pastikan untuk memenuhi persyaratan platform.

Pilih alat atau IDE Anda

Menginstal dari PyPI

Untuk memasang Speech SDK untuk Python, jalankan perintah ini di terminal.

pip install azure-cognitiveservices-speech

Meningkatkan ke Speech SDK terbaru

Untuk meningkatkan ke Speech SDK terbaru, jalankan perintah ini di terminal:

pip install --upgrade azure-cognitiveservices-speech

Anda dapat memeriksa versi Speech SDK untuk Python mana yang saat ini diinstal dengan memeriksa variabel azure.cognitiveservices.speech.__version__. Misalnya, jalankan perintah ini di terminal:

pip list

Menggunakan Speech SDK

Tambahkan pernyataan impor berikut untuk menggunakan Speech SDK di proyek Python Anda:

import azure.cognitiveservices.speech as speechsdk

Langkah berikutnya