Speech SDK hanya mendukung Ubuntu 18.04/20.04/22.04, Debian 9/10/11, Red Hat Enterprise Linux (RHEL) 7/8, dan CentOS 7/8 pada arsitektur target berikut saat digunakan dengan Linux: x64, ARM32 (Debian/Ubuntu), dan ARM64 (Debian/Ubuntu)
Penting
Gunakan rilis LTS terbaru dari distribusi Linux. Misalnya, jika Anda menggunakan Ubuntu 20.04 LTS, gunakan rilis terbaru Ubuntu 20.04.X.
Untuk aplikasi native, Speech SDK bergantung pada libMicrosoft.CognitiveServices.Speech.core.so. Pastikan arsitektur target (x86, x64) cocok dengan aplikasi. Tergantung pada versi Linux, dependensi lain mungkin diperlukan:
Pustaka bersama dari pustaka GNU C, termasuk pustaka Pemrograman Thread POSIX, libpthreads
Pada Ubuntu 22.04, instal libssl1.1 baik sebagai paket biner seperti libssl1.1_1.1.1l-1ubuntu1.3_amd64.deb, atau dengan mengompilasinya dari sumber. Speech SDK tidak mendukung OpenSSL 3.0, yang merupakan default di Ubuntu 22.04.
Berikut adalah contoh penginstalan libssl1.1 pada Ubuntu 22.04:
Untuk menggunakan Speech SDK di Alpine Linux, buat lingkungan chroot Debian seperti yang didokumentasikan di Alpine Linux Wiki tentang menjalankan program glibc. Kemudian ikuti instruksi Debian di sini.
Diperlukan macOS versi 10.14 atau yang lebih baru.
Menginstal Speech SDK
Speech SDK untuk C# tersedia sebagai paket NuGet dan menerapkan .NET Standar 2.0. Untuk informasi selengkapnya, lihat Microsoft.CognitiveServices.Speech .
Speech SDK untuk C# dapat diinstal dari .NET CLI dengan perintah dotnet add berikut:
Membuat proyek Visual Studio dan memasang SDK Speech
Anda harus memasang paket NuGet Speech SDK agar dapat mereferensikannya dalam kode Anda. Untuk melakukannya, pertama-tama Anda perlu membuat proyek helloworld. Jika sudah memiliki proyek dengan beban kerja pengembangan desktop .NET yang tersedia, Anda dapat menggunakan proyek tersebut dan melompat ke Menggunakan Pengelola Paket NuGet untuk memasang SDK Speech.
Membuat proyek helloworld
Buka Visual Studio Code 2019.
Di jendela Mulai, pilih Buat proyek baru.
Di jendela Buat proyek baru, pilih Aplikasi Konsol (.NET Framework) , lalu pilih Berikutnya.
Di jendela Konfigurasikan proyek baru, masukkan helloworld di Nama proyek, pilih atau buat jalur direktori di Lokasi, lalu pilih Buat.
Dari bilah menu Visual Studio, pilih Alat>Dapatkan Alat dan Fitur. Langkah ini membuka pemasang Visual Studio dan menampilkan dialog Memodifikasi.
Periksa apakah beban kerja pengembangan desktop .NET tersedia. Jika beban kerja belum diinstal, pilih kotak centang di sampingnya, lalu pilih Ubah untuk memulai penginstalan. Mungkin perlu beberapa menit untuk mengunduh dan memasang.
Jika kotak centang di samping pengembangan desktop .NET sudah centang, pilih Tutup untuk keluar dari kotak dialog.
Tutup Alat Penginstal Visual Studio.
Gunakan Pengelola Paket NuGet untuk memasang SDK Speech
Di Penjelajah Solusi, klik kanan proyek helloworld, lalu pilih Kelola Paket NuGet untuk menampilkan Pengelola Paket NuGet.
Di pojok kanan atas, temukan kotak drop-down Sumber Paket, dan pastikan nuget.org dipilih.
Di pojok kiri atas, pilih Telusuri.
Dalam kotak pencarian, ketik Microsoft.CognitiveServices.Speech dan pilih Enter.
Dari hasil pencarian, pilih paket Microsoft.CognitiveServices.Speech, lalu pilih Instal untuk menginstal versi stabil terbaru.
Terima semua perjanjian dan lisensi untuk memulai penginstalan.
Setelah paket dipasang, konfirmasi akan muncul di jendela Konsol Pengelola Paket.
Memilih arsitektur target
Sekarang, untuk membuat dan menjalankan aplikasi konsol, buat konfigurasi platform yang sesuai dengan arsitektur komputer Anda.
Dari bilah menu, pilih Build>Configuration Manager. Kotak dialog Pengelola Konfigurasi akan muncul.
Di kotak drop-down Platform solusi aktif, pilih Baru. Kotak dialog Platform Solusi Baru akan muncul.
Di kotak drop-down Ketik atau pilih platform baru:
Jika Anda menjalankan Windows 64-bit, pilih x64.
Jika Anda menjalankan Windows 32-bit, pilih x86.
Pilih OK lalu Tutup.
Panduan ini menunjukkan cara menginstal Speech SDK untuk aplikasi konsol .NET Core. .NET Core adalah platform .NET sumber terbuka, lintas platform yang mengimplementasikan spesifikasi .NET Standard.
Membuat proyek Visual Studio dan memasang SDK Speech
Mulai Visual Studio 2019.
Pastikan beban kerja pengembangan .NET cross-platform tersedia. Pilih Alat>Dapatkan Alat dan Fitur dari bilah menu Visual Studio untuk membuka alat penginstal Visual Studio. Jika beban kerja ini sudah diaktifkan, tutup kotak dialog.
Jika tidak, pilih kotak di samping pengembangan l.NET Core cross-platform, dan pilih Modifikasi di sudut kanan bawah kotak dialog. Pemasangan fitur baru akan memakan waktu sejenak.
Buat aplikasi konsol Inti Visual C# .NET baru. Dalam kotak dialog Proyek Baru, dari panel kiri, perluas Visual C#>.NET Core>yang Terpasang. Kemudian pilih Console App (.NET Core) . Untuk nama proyek, masukkan helloworld.
Instal dan referensi paket Speech SDK NuGet. Di Penjelajah Solusi, klik kanan solusi dan pilih Kelola Paket NuGet untuk Solusi.
Di sudut kanan atas, di kotak Sumber Paket, pilih nuget.org. Cari paket Microsoft.CognitiveServices.Speech, dan instal ke dalam proyek helloworld.
Terima lisensi yang ditampilkan untuk memulai instalasi paket NuGet.
Setelah paket diinstal, konfirmasi akan muncul di konsol Package Manager.
Panduan ini menunjukkan cara menginstal SDK Ucapan untuk Unity.
Untuk pengembangan Unity, Speech SDK mendukung Desktop Windows (x86 dan x64) atau Platform Windows Universal (x86, x64, ARM/ARM64), Android (x86, ARM32/64), iOS (simulator x64 dan ARM64), dan Mac (x64).
Di Android, Anda memerlukan perangkat Android berbasis ARM (API 23: Android 6.0 Marshmallow atau yang lebih tinggi) yang diaktifkan untuk pengembangan dengan mikrofon yang berfungsi.
Di iOS, Anda memerlukan perangkat iOS (ARM64) yang diaktifkan untuk pengembangan dengan mikrofon yang berfungsi.
Di macOS, perangkat Mac (x64) dan versi LTS terbaru Unity 2019 (atau versi lebih tinggi) untuk dukungan terintegrasi untuk akses mikrofon di pengaturan Unity Player.
Menginstal SDK Ucapan
Untuk menginstal SDK Ucapan untuk Unity, ikuti langkah-langkah berikut:
Unduh dan buka Speech SDK untuk Unity. Unduh dan buka Speech SDK untuk Unity, yang dikemas sebagai paket aset Unity (.unitypackage), dan harus sudah dikaitkan dengan Unity. Saat paket aset dibuka, kotak dialog Impor Paket Unity akan muncul. Anda mungkin perlu membuat dan membuka proyek kosong agar langkah ini berfungsi.
Pastikan bahwa semua file dipilih, dan pilih Impor. Setelah beberapa saat, paket aset Unity diimpor ke dalam proyek Anda.
Untuk informasi selengkapnya tentang mengimpor paket aset ke Unity, lihat dokumentasi Unity.
Panduan ini menunjukkan cara membuat proyek Universal Windows Platform (UWP) dan menginstal Speech SDK untuk C#. Universal Windows Platform memungkinkan Anda mengembangkan aplikasi yang berjalan di perangkat apa pun yang mendukung Windows 10, termasuk PC, Xbox, Surface Hub, dan perangkat lainnya.
Membuat proyek Visual Studio dan memasang SDK Speech
Untuk membuat proyek Visual Studio untuk pengembangan UWP, Anda perlu:
Menyiapkan opsi pengembangan Visual Studio.
Membuat proyek dan memilih arsitektur target.
Menyiapkan pengambilan audio.
Menginstal SDK Ucapan.
Menyiapkan opsi pengembangan Visual Studio
Untuk memulai, pastikan Anda melakukan persiapan dengan benar di Visual Studio untuk pengembangan UWP:
Buka Visual Studio 2019 untuk menampilkan jendela mulai.
Pilih Lanjutkan tanpa kode untuk membuka Visual Studio IDE.
Dari bilah menu Visual Studio, pilih Alat>Dapatkan Alat dan Fitur untuk membuka Alat Penginstal Visual Studio dan menampilkan kotak dialog Mengubah.
Pada tab Beban Kerja, di bawah Windows, temukan beban kerja pengembangan Universal Windows Platform. Jika kotak centang di samping beban kerja tersebut sudah dipilih, tutup kotak dialog Mengubah, lalu lanjutkan ke langkah 7.
Pilih kotak centang Pengembangan Platform Windows Universal, lalu pilih Ubah.
Dalam kotak dialog Sebelum kita memulai, pilih Lanjutkan untuk memasang beban kerja pengembangan UWP. Penginstalan fitur baru mungkin memakan waktu beberapa saat.
Tutup Alat penginstal Visual Studio.
Membuat proyek
Selanjutnya, buat proyek Anda dan pilih arsitektur target:
Pada bilah menu Visual Studio, pilih File>New>Project untuk menampilkan jendela Buat proyek baru.
Temukan dan pilih Aplikasi Kosong (Universal Windows) . Pastikan Anda memilih versi C# dari jenis proyek ini (dibandingkan dengan Visual Basic).
Pilih Selanjutnya.
Dalam dialog Konfigurasikan proyek baru Anda, dalam nama Project, masukkan helloworld.
Di Lokasi, buka dan pilih (atau buat) folder tempat Anda ingin menyimpan proyek Anda.
Pilih Buat.
Di jendela Project Platform universal Windows Baru, dalam versi minimum (kotak drop-down kedua), pilih Windows 10 Fall Creators Update (10.0; Build 16299). Itu adalah persyaratan minimum untuk Speech SDK.
Dalam Versi target (kotak drop-down pertama), pilih nilai yang identik dengan atau lebih baru dari nilai dalam Versi minimum.
PilihOK. Anda kembali ke IDE Visual Studio, dengan proyek baru dibuat dan terlihat di panel Penjelajah Solusi.
Pilih arsitektur platform target Anda. Pada bilah alat Visual Studio, temukan kotak drop-down Platform Solusi. Jika Anda tidak melihatnya, pilih View>Toolbars>Standard untuk menampilkan bar alat yang berisi Platform Solusi.
Jika Anda menjalankan Windows 64-bit, pilih x64 di kotak drop-down. Windows 64 bit juga dapat menjalankan aplikasi 32 bit, sehingga Anda dapat memilih x86 jika ingin.
Catatan
Speech SDK mendukung semua prosesor yang kompatibel dengan Intel, tetapi hanya prosesor ARM versi x64.
Menyiapkan pengambilan audio
Izinkan proyek mengambil input audio:
Di Penjelajah Solusi, klik dua kali Package.appxmanifest untuk membuka manifes aplikasi paket.
Pilih tab Kemampuan.
Pilih kotak untuk kemampuan Mikrofon.
Dari bilah menu, pilih File>Save Package.appxmanifest untuk menyimpan perubahan Anda.
Di Penjelajah Solusi, klik kanan solusi Anda, dan pilih Kelola Paket NuGet untuk Solusi untuk masuk ke jendela NuGet - Solusi.
Pilih Telusuri.
Di Sumber paket, pilih nuget.org.
Dalam kotak Pencarian, masukkan Microsoft.CognitiveServices.Speech. Kemudian pilih paket itu setelah muncul di hasil pencarian.
Di panel status paket di samping hasil pencarian, pilih proyek helloworld Anda.
Pilih Pasang.
Di kotak dialog Pratinjau Perubahan, pilih OK.
Di kotak dialog Penerimaan Lisensi, tampilkan lisensi, lalu pilih Saya Terima. Penginstalan paket dimulai. Saat penginstalan selesai, dan saat penginstalan selesai, panel Output menampilkan pesan yang mirip dengan teks berikut: Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld.
Panduan ini menunjukkan cara membuat proyek formulir Xamarin dan menginstal Speech SDK. Xamarin adalah platform sumber terbuka untuk membangun aplikasi modern dan berperforma untuk iOS, Android, dan Windows menggunakan .NET.
Untuk pengembangan Xamarin, Speech SDK mendukung Windows Desktop (x86 dan x64) atau Universal Windows Platform (x86, x64, ARM/ARM64), Android (x86, ARM32/64), dan iOS (simulator x64 dan ARM64).
Membuat proyek Visual Studio dan memasang SDK Speech
Untuk membuat proyek Visual Studio untuk pengembangan aplikasi seluler lintas platform .NET dengan Xamarin, Anda perlu:
Menyiapkan opsi pengembangan Visual Studio.
Membuat proyek dan memilih arsitektur target.
Menginstal SDK Ucapan.
Menyiapkan opsi pengembangan Visual Studio
Untuk memulai, pastikan Anda telah melakukan persiapan dengan benar di Visual Studio untuk pengembangan seluler lintas platform dengan .NET:
Buka Visual Studio 2019.
Dari bilah menu Visual Studio, pilih Alat>Dapatkan Alat dan Fitur untuk membuka Alat Penginstal Visual Studio dan menampilkan kotak dialog Mengubah.
Pada tab Beban Kerja, di bawah Windows,temukan pengembangan Seluler dengan beban kerja .NET. Jika kotak centang di samping beban kerja tersebut sudah dipilih, tutup kotak dialog Mengubah, lalu lanjutkan ke langkah 6.
Pilih kotak centang Pengembangan seluler dengan .NET, lalu pilih Ubah.
Dalam kotak dialog Sebelum kita memulai, pilih Lanjutkan untuk memasang beban kerja untuk pengembangan seluler dengan .NET. Penginstalan fitur baru mungkin memakan waktu beberapa saat.
Tutup Alat penginstal Visual Studio.
Membuat proyek
Selanjutnya, buat proyek Anda dan pilih arsitektur target:
Pada bilah menu Visual Studio, pilih File>New>Project untuk menampilkan jendela Buat proyek baru.
Temukan dan pilih Aplikasi Seluler (Xamarin.Forms) .
Pilih Selanjutnya.
Dalam dialog Konfigurasikan proyek baru Anda, dalam nama Project, masukkan helloworld.
Di Lokasi, buka dan pilih atau buat folder tempat Anda ingin menyimpan proyek Anda.
Pilih Buat.
Di jendela Aplikasi Lintas Platform Baru , pilih templat Kosong, lalu pilih OK.
Di Platform, pilih kotak untuk Android,iOS, dan Windows (UWP) .
PilihOK. Anda kembali ke Visual Studio IDE, dengan proyek baru dibuat dan terlihat di panel Penjelajah Solusi.
Sekarang pilih arsitektur platform target dan proyek startup Anda. Pada bilah alat Visual Studio, temukan kotak drop-down Platform Solusi. Jika Anda tidak melihatnya, pilih View>Toolbars>Standard untuk menampilkan bar alat yang berisi Platform Solusi.
Jika Anda menjalankan Windows 64-bit, pilih x64 di kotak drop-down. Anda dapat memilih x86 jika Anda mau karena Windows 64-bit juga dapat menjalankan aplikasi 32-bit.
Dalam kotak drop-down Proyek Start-up, atur helloworld.UWP (Universal Windows).
Di Penjelajah Solusi, klik kanan solusi Anda. Pilih Kelola Paket NuGet untuk Solusi untuk masuk ke jendela NuGet - Solusi.
Pilih Telusuri.
Di Sumber paket, pilih nuget.org.
Dalam kotak Pencarian, masukkan Microsoft.CognitiveServices.Speech. Kemudian pilih paket itu setelah muncul di hasil pencarian.
Catatan
Pustaka iOS di dalam Microsoft.CognitiveServices.Speech NuGet tidak mempunyai bitcode yang diaktifkan. Jika Anda memerlukan pustaka bitcode yang diaktifkan untuk aplikasi Anda, gunakan NuGet Microsoft.CognitiveServices.Speech.Xamarin.iOS khususnya untuk proyek iOS.
Di panel status paket di samping hasil pencarian, pilih semua proyek: helloworld, helloworld. Android,helloworld.iOS, dan helloworld. UWP, apa yang terjadi?
Pilih Pasang.
Di kotak dialog Pratinjau Perubahan, pilih OK.
Di kotak dialog Penerimaan Lisensi, tampilkan lisensi, lalu pilih Saya Terima. Instal referensi paket SDK Ucapan ke semua proyek.
Setelah penginstalan berhasil diselesaikan, Anda mungkin melihat peringatan berikut untuk helloworld.iOS. Ini adalah masalah yang diketahui dan tidak boleh memengaruhi fungsionalitas aplikasi Anda.
Could not resolve reference "C:\Users\Default\.nuget\packages\microsoft.cognitiveservices.speech\1.7.0\build\Xamarin.iOS\libMicrosoft.CognitiveServices.Speech.core.a". If this reference is required by your code, you may get compilation errors.
SDK Ucapan kini sudah dipasang. Sekarang Anda bisa menghapus atau menggunakan kembali proyek helloworld yang Anda buat di langkah-langkah sebelumnya.
Speech SDK untuk C++ hanya mendukung Ubuntu 18.04/20.04/22.04, Debian 9/10/11, Red Hat Enterprise Linux (RHEL) 7/8, dan CentOS 7/8 pada arsitektur target berikut saat digunakan dengan Linux: x86 (Debian/Ubuntu), x64, ARM32 (Debian/Ubuntu), dan ARM64 (Debian/Ubuntu)
Penting
Gunakan rilis LTS terbaru dari distribusi Linux. Misalnya, jika Anda menggunakan Ubuntu 20.04 LTS, gunakan rilis terbaru Ubuntu 20.04.X.
Untuk aplikasi native, Speech SDK bergantung pada libMicrosoft.CognitiveServices.Speech.core.so. Pastikan arsitektur target (x86, x64) cocok dengan aplikasi. Tergantung pada versi Linux, dependensi lain mungkin diperlukan:
Pustaka bersama dari pustaka GNU C, termasuk pustaka Pemrograman Thread POSIX, libpthreads
Pada Ubuntu 22.04, instal libssl1.1 baik sebagai paket biner seperti libssl1.1_1.1.1l-1ubuntu1.3_amd64.deb, atau dengan mengompilasinya dari sumber. Speech SDK tidak mendukung OpenSSL 3.0, yang merupakan default di Ubuntu 22.04.
Berikut adalah contoh penginstalan libssl1.1 pada Ubuntu 22.04:
Untuk menggunakan Speech SDK di Alpine Linux, buat lingkungan chroot Debian seperti yang didokumentasikan di Alpine Linux Wiki tentang menjalankan program glibc. Kemudian ikuti instruksi Debian di sini.
Panduan ini menunjukkan cara memasang Speech SDK pada Linux.
Gunakan prosedur berikut untuk mengunduh dan memasang SDK. Langkah ini termasuk pengunduhan pustaka yang dibutuhkan dan file header sebagai file .tar dari https://aka.ms/csspeech/linuxbinary.
Pilih direktori tempat file Speech SDK harus diekstraksi, dan set SPEECHSDK_ROOT variabel lingkungan untuk mengarahkan ke direktori tersebut. Variabel ini memudahkan untuk merujuk ke direktori pada perintah di masa mendatang.
Misalnya, jika Anda ingin menggunakan direktori speechsdk di direktori rumah Anda, gunakan perintah seperti berikut:
export SPEECHSDK_ROOT="$HOME/speechsdk"
Buat direktori jika belum ada:
mkdir -p "$SPEECHSDK_ROOT"
Unduh dan ekstrak arsip .tar.gz yang berisi biner Speech SDK:
Validasi konten direktori tingkat atas dari paket yang diekstrak:
ls -l "$SPEECHSDK_ROOT"
Daftar direktori harus berisi pemberitahuan pihak ketiga dan file lisensi. Daftar juga harus berisi direktori yang include menyimpan file header (.h) dan direktori yang lib menyimpan pustaka untuk arm32, arm64, x64, dan x86.
Jalur
Deskripsi
license.md
Lisensi
ThirdPartyNotices.md
Pengumuman pihak ketiga
REDIST.txt
Pemberitahuan redistribusi
include
File header yang diperlukan untuk C ++
lib/arm32
Library native untuk ARM32 yang diperlukan untuk menautkan aplikasi Anda
lib/arm64
Library native untuk ARM64 yang diperlukan untuk menautkan aplikasi Anda
lib/x64
Library native untuk x64 yang diperlukan untuk menautkan aplikasi Anda
lib/x86
Library native untuk x86 yang diperlukan untuk menautkan aplikasi Anda
Panduan ini menunjukkan cara menginstal Speech SDK untuk C++ di macOS 10.14 dan yang lebih baru. Langkah ini termasuk pengunduhan pustaka yang diperlukan dan file header sebagai file .zip dari https://aka.ms/csspeech/macosbinary.
Pilih direktori tempat file Speech SDK harus diekstraksi, dan set SPEECHSDK_ROOT variabel lingkungan untuk mengarahkan ke direktori tersebut. Variabel ini memudahkan untuk merujuk ke direktori pada perintah di masa mendatang.
Misalnya, jika Anda ingin menggunakan direktori speechsdk di direktori rumah Anda, gunakan perintah seperti berikut:
export SPEECHSDK_ROOT="$HOME/speechsdk"
Buat direktori jika belum ada:
mkdir -p "$SPEECHSDK_ROOT"
Unduh dan ekstrak arsip .zip yang berisi Speech SDK XCFramework:
Membuat proyek Visual Studio dan menginstal Speech SDK
Untuk membuat proyek Visual Studio untuk pengembangan desktop C++, Anda perlu:
Menyiapkan opsi pengembangan Visual Studio.
Membuat proyek.
Memilih arsitektur target.
Menginstal SDK Ucapan.
Menyiapkan opsi pengembangan Visual Studio
Untuk memulai, pastikan Anda telah melakukan persiapan dengan benar di Visual Studio untuk pengembangan desktop C++:
Buka Visual Studio 2019 untuk menampilkan jendela mulai.
Pilih Lanjutkan tanpa kode untuk membuka Visual Studio IDE.
Dari bilah menu Visual Studio, pilih Alat>Dapatkan Alat dan Fitur untuk membuka Alat Penginstal Visual Studio dan menampilkan kotak dialog Mengubah.
Pada tab Beban Kerja, di bawah Windows, temukan pengembangan Desktop dengan beban kerja C++. Jika kotak centang di samping beban kerja tersebut belum dipilih, pilih kotak centang tersebut.
Di tab Komponen individual, temukan kotak centang Manajer paket NuGet. Jika kotak centang belum dipilih, pilih kotak centang.
Di sudut, pilih tombol berlabel Tutup atau Modifikasi. Nama tombol bervariasi tergantung apakah Anda memilih fitur apa pun untuk penginstalan.
Jika Anda memilih Ubah, penginstalan dimulai. Proses ini mungkin memakan waktu beberapa saat.
Tutup Alat penginstal Visual Studio.
Membuat proyek
Selanjutnya, buat proyek Anda dan pilih arsitektur target:
Pada bilah menu Visual Studio, pilih File>New>Project untuk menampilkan jendela Buat proyek baru.
Temukan dan pilih Aplikasi Konsol. Pastikan Anda memilih versi C++ dari jenis proyek ini, dibandingkan dengan C# atau Visual Basic.
Pilih Selanjutnya.
Dalam dialog Konfigurasikan proyek baru Anda, dalam nama Project, masukkan helloworld.
Di Lokasi, buka dan pilih (atau buat) folder tempat Anda ingin menyimpan proyek Anda, lalu pilih Buat.
Pilih arsitektur platform target Anda. Pada bilah alat Visual Studio, temukan kotak drop-down Platform Solusi. Jika Anda tidak melihatnya, pilih View>Toolbars>Standard untuk menampilkan bar alat yang berisi Platform Solusi.
Jika Anda menjalankan Windows 64-bit, pilih x64 di kotak drop-down. Windows 64 bit juga dapat menjalankan aplikasi 32 bit, sehingga Anda dapat memilih x86 jika ingin.
Di Penjelajah Solusi, klik kanan solusi Anda, lalu pilih Kelola Paket NuGet untuk Solusi untuk masuk ke jendela NuGet - Solusi.
Pilih Telusur.
Di Sumber paket, pilih nuget.org.
Dalam kotak Pencarian, masukkan Microsoft.CognitiveServices.Speech. Kemudian pilih paket itu setelah muncul di hasil pencarian.
Di panel status paket di samping hasil pencarian, pilih proyek helloworld Anda.
Pilih Pasang.
Di kotak dialog Pratinjau Perubahan, pilih OK.
Di kotak dialog Penerimaan Lisensi, tampilkan lisensi, lalu pilih Saya Terima. Penginstalan paket dimulai. Saat penginstalan selesai, dan saat penginstalan selesai, panel Output menampilkan pesan yang mirip dengan teks berikut: Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld.
Panduan ini menunjukkan cara menginstal Speech SDK untuk Go.
Persyaratan platform
SDK Ucapan hanya mendukung Ubuntu 18.04/20.04/22.04, Debian 9/10/11, Red Hat Enterprise Linux (RHEL) 8, and CentOS 8 pada arsitektur x64 saat digunakan dengan Linux.
Penting
Gunakan rilis LTS terbaru dari distribusi Linux. Misalnya, jika Anda menggunakan Ubuntu 20.04 LTS, gunakan rilis terbaru Ubuntu 20.04.X.
Untuk aplikasi native, Speech SDK bergantung pada libMicrosoft.CognitiveServices.Speech.core.so. Pastikan arsitektur target (x86, x64) cocok dengan aplikasi. Tergantung pada versi Linux, dependensi lain mungkin diperlukan:
Pustaka bersama dari pustaka GNU C, termasuk pustaka Pemrograman Thread POSIX, libpthreads
Pada Ubuntu 22.04, instal libssl1.1 baik sebagai paket biner seperti libssl1.1_1.1.1l-1ubuntu1.3_amd64.deb, atau dengan mengompilasinya dari sumber. Speech SDK tidak mendukung OpenSSL 3.0, yang merupakan default di Ubuntu 22.04.
Berikut adalah contoh penginstalan libssl1.1 pada Ubuntu 22.04:
Untuk menggunakan Speech SDK di Alpine Linux, buat lingkungan chroot Debian seperti yang didokumentasikan di Alpine Linux Wiki tentang menjalankan program glibc. Kemudian ikuti instruksi Debian di sini.
Gunakan prosedur berikut untuk mengunduh dan memasang SDK. Langkah ini termasuk pengunduhan pustaka yang dibutuhkan dan file header sebagai file .tar dari https://aka.ms/csspeech/linuxbinary.
Pilih direktori tempat file Speech SDK harus diekstraksi, dan set SPEECHSDK_ROOT variabel lingkungan untuk mengarahkan ke direktori tersebut. Variabel ini memudahkan untuk merujuk ke direktori pada perintah di masa mendatang.
Misalnya, jika Anda ingin menggunakan direktori speechsdk di direktori rumah Anda, gunakan perintah seperti berikut:
export SPEECHSDK_ROOT="$HOME/speechsdk"
Buat direktori jika belum ada:
mkdir -p "$SPEECHSDK_ROOT"
Unduh dan ekstrak arsip .tar.gz yang berisi biner Speech SDK:
Validasi konten direktori tingkat atas dari paket yang diekstrak:
ls -l "$SPEECHSDK_ROOT"
Daftar direktori harus berisi pemberitahuan pihak ketiga dan file lisensi. Daftar juga harus berisi direktori yang include menyimpan file header (.h) dan direktori yang lib menyimpan pustaka untuk arm32, arm64, x64, dan x86.
Jalur
Deskripsi
license.md
Lisensi
ThirdPartyNotices.md
Pengumuman pihak ketiga
REDIST.txt
Pemberitahuan redistribusi
include
File header yang diperlukan untuk C ++
lib/arm32
Library native untuk ARM32 yang diperlukan untuk menautkan aplikasi Anda
lib/arm64
Library native untuk ARM64 yang diperlukan untuk menautkan aplikasi Anda
lib/x64
Library native untuk x64 yang diperlukan untuk menautkan aplikasi Anda
lib/x86
Library native untuk x86 yang diperlukan untuk menautkan aplikasi Anda
Mengonfigurasi lingkungan Go
Lakukan langkah-langkah berikut untuk menyiapkan lingkungan Go Anda untuk menemukan Speech SDK. Dalam kedua langkah, ganti <architecture> dengan arsitektur prosesor CPU Anda. Arsitektur ini akan menjadi x86, x64, arm32, atau arm64.
Karena pengikatan mengandalkan cgo, Anda perlu mengatur variabel lingkungan agar Go dapat menemukan SDK.
Speech SDK untuk Java hanya mendukung Ubuntu 18.04/20.04/22.04, Debian 9/10/11, Red Hat Enterprise Linux (RHEL) 7/8, dan CentOS 7/8 pada arsitektur berikut saat digunakan dengan Linux: x64, ARM32 (Debian/Ubuntu), dan ARM64 (Debian/Ubuntu)
Penting
Gunakan rilis LTS terbaru dari distribusi Linux. Misalnya, jika Anda menggunakan Ubuntu 20.04 LTS, gunakan rilis terbaru Ubuntu 20.04.X.
Untuk aplikasi native, Speech SDK bergantung pada libMicrosoft.CognitiveServices.Speech.core.so. Pastikan arsitektur target (x86, x64) cocok dengan aplikasi. Tergantung pada versi Linux, dependensi lain mungkin diperlukan:
Pustaka bersama dari pustaka GNU C, termasuk pustaka Pemrograman Thread POSIX, libpthreads
Pada Ubuntu 22.04, instal libssl1.1 baik sebagai paket biner seperti libssl1.1_1.1.1l-1ubuntu1.3_amd64.deb, atau dengan mengompilasinya dari sumber. Speech SDK tidak mendukung OpenSSL 3.0, yang merupakan default di Ubuntu 22.04.
Berikut adalah contoh penginstalan libssl1.1 pada Ubuntu 22.04:
Untuk menggunakan Speech SDK di Alpine Linux, buat lingkungan chroot Debian seperti yang didokumentasikan di Alpine Linux Wiki tentang menjalankan program glibc. Kemudian ikuti instruksi Debian di sini.
Panduan ini menunjukkan cara menginstal Speech SDK untuk Java pada Java Runtime.
Catatan
Speech SDK untuk Java tidak tersedia di repositori pusat Maven. Baik Anda menggunakan Gradle atau file dependensi pom.xml, Anda perlu menambahkan repositori kustom yang menunjuk ke https://azureai.azureedge.net/maven/. (Lihat di bawah untuk nama paket.)
Sistem operasi yang didukung
Paket Java Speech SDK tersedia untuk sistem operasi berikut:
Jalankan perintah Maven berikut untuk menginstal SDK Azure Cognitive Service untuk Ucapan dan dependensi.
mvn clean dependency:copy-dependencies
Membuat proyek Eclipse dan menginstal Speech SDK
Instal Eclipse Java IDE. IDE ini mengharuskan Java sudah dipasang.
Mulai Eclipse.
Di Eclipse Launcher, di bidang Ruang Kerja, masukkan nama direktori ruang kerja baru. Lalu pilih Luncurkan.
Dalam sekejap, jendela utama Eclipse IDE muncul. Tutup layar Selamat Datang jika ada.
Dari bilah menu Eclipse, buat proyek baru dengan memilih File>New>Project.
Dialog Project Baru muncul. Pilih Proyek Java, dan pilih Berikutnya.
Wizard Proyek Java Baru dimulai. Di bidang Nama proyek, masukkan mulai cepat. Pilih JavaSE-1.8 sebagai lingkungan eksekusi. Pilih Selesai.
Jika jendela Buka Perspektif Terkait muncul, pilih Buka Perspektif.
Di penjelajah Paket, klik kanan proyek mulai cepat. Pilih Konfigurasi>Konversi ke Proyek Maven dari menu pintasan.
Jendela Buat POM baru muncul. Di bidang Group Id, masukkan com.microsoft.cognitiveservices.speech.samples. Di bidang Id Artefak, masukkan mulai cepat. Selanjutnya pilih Selesai.
Buka file pom.xml dan edit:
Di akhir file, sebelum tag penutup </project>, buat repositories elemen dengan referensi ke repositori Maven untuk Speech SDK:
Panduan ini menunjukkan cara memasang SDK Ucapan untuk Java pada Android.
Speech SDK untuk Android dikemas sebagai file Android Archive (AAR), yang mencakup pustaka yang diperlukan dan izin Android yang diperlukan.
Di hosting di repositori Maven di https://azureai.azureedge.net/maven/.
Pasang Speech SDK menggunakan Android Studio
Buat proyek baru di Android Studio dan tambahkan Speech SDK untuk Java sebagai dependensi pustaka. Penyiapan didasarkan pada Paket Maven Speech SDK, dan Android Studio 2021.2.1.
Membuat proyek Kosong
Buka Android Studio dan pilih Proyek baru.
Di jendela Proyek baru yang muncul, pilih Telepon dan Tablet>Aktivitas Kosong, lalu pilih Berikutnya.
Masukkan SpeechQuickstart di kotak teks Nama.
Masukkan samples.speech.cognitiveservices.microsoft.com, dalam kotak teks Nama paket.
Pilih direktori proyek dalam kotak pilihan Simpan lokasi.
Pilih Java dalam kotak pilihan Bahasa.
Pilih API 23: Android 6.0 (Marshmallow) dalam kotak pilihan Level API minimum.
Pilih Selesai.
Android Studio membutuhkan waktu beberapa saat untuk mempersiapkan proyek baru Anda. Jika ini adalah pertama kalinya Anda menggunakan Android Studio, mungkin perlu beberapa menit untuk mengatur preferensi, menerima lisensi, dan menyelesaikan wizard.
Menginstal Speech SDK
Tambahkan Speech SDK sebagai dependensi dalam proyek Anda.
Pilih File>Struktur proyek>Dependensi>aplikasi.
Pilih simbol plus (+) untuk menambahkan dependensi di bawah Dependensi yang Dinyatakan. Lalu pilih Dependensi pustaka dari menu drop-down.
Di jendela Tambahkan Dependensi Pustaka yang muncul, masukkan nama dan versi Speech SDK untuk Java: com.microsoft.cognitiveservices.speech:client-sdk:1.22.0. Lalu pilih Cari.
Pastikan ID Grup yang dipilih adalah com.microsoft.cognitiveservices.speech, lalu pilih OK.
Pilih OKE untuk menutup jendela Struktur Proyek dan menerapkan perubahan Anda pada proyek.
Pastikan untuk mempertimbangkan berbagai implikasi arsitektur antara Node.js dan browser web klien. Misalnya, model objek dokumen (DOM) tidak tersedia untuk aplikasi sisi server seperti halnya sistem file Node.js yang tidak tersedia untuk aplikasi sisi klien.
Menginstal Speech SDK
Bergantung pada lingkungan target, gunakan salah satu panduan berikut ini:
Panduan ini menunjukkan cara memasang Speech SDK untuk JavaScript untuk digunakan dengan Node.js. Jika Anda hanya ingin nama paket memulainya sendiri, jalankan npm install microsoft-cognitiveservices-speech-sdk dalam proyek yang ada.
Panduan ini memperlihatkan cara memasang Speech SDK untuk JavaScript untuk digunakan dengan halaman web.
Membongkar ke folder
Membuat folder baru yang kosong. Jika Anda ingin menghosting sampel di server web, pastikan server web dapat mengakses folder.
Unduh SDK Ucapan sebagai paket .zip dan bongkar ke folder yang baru dibuat. File-file ini dibongkar:
microsoft.cognitiveservices.speech.sdk.bundle.js: Versi Speech SDK yang dapat dibaca manusia.
microsoft.cognitiveservices.speech.sdk.bundle.js.map: File peta yang digunakan untuk men-debug kode SDK.
microsoft.cognitiveservices.speech.sdk.bundle.d.ts: Definisi objek untuk digunakan dengan TypeScript.
microsoft.cognitiveservices.speech.sdk.bundle-min.js: Versi yang di minimumkan dari Speech SDK.
speech-processor.js: Kode untuk meningkatkan performa di beberapa browser.
Buat file baru di folder bernama index.html di folder, dan buka file ini dengan editor teks.
Tag skrip HTML
Unduh dan ekstrak file microsoft.cognitiveservices.speech.sdk.bundle.js dari Speech SDK untuk JavaScript. Tempatkan di folder yang file HTML Anda dapat mengakses.
Jika Anda menargetkan browser web, dan menggunakan tag <script>, awalan sdk tidak diperlukan. Awalan sdk adalah alias yang digunakan untuk memberi nama modul require.
Atau, Anda dapat langsung menyertakan tag <script> dalam elemen <head> HTML, mengandalkan sindikat NPM JSDelivr.
Speech SDK untuk Objective-C tersedia secara native sebagai paket CocoaPod untuk Mac x64 dan silikon berbasis ARM.
Persyaratan sistem untuk Mac:
MacOS versi 10.14 atau yang lebih baru
Paket macOS CocoaPod tersedia untuk diunduh dan digunakan dengan lingkungan pengembangan terintegrasi (IDE) Xcode 9.4.1 (atau yang lebih baru).
Buka direktori Xcode di mana file proyek .xcodeproj Anda berada.
Jalankan pod init untuk membuat file pod bernama Podfile.
Ganti isi Podfile dengan yang berikut ini. Perbarui nama target dari 'AppName' ke nama aplikasi Anda. Perbarui platform atau versi pod sesuai kebutuhan.
platform :osx, 10.14
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.22.0'
end
Jalankan pod install untuk menginstal Speech SDK.
Atau, Anda dapat mengunduh CocoaPod biner dan membuka zip untuk mengekstrak kontennya. Dalam proyek Xcode Anda, tambahkan referensi ke folder "MicrosoftCognitiveServicesSpeech.xcframework" yang diekstrak dan isinya.
Catatan
Pengembang .NET dapat membangun aplikasi macOS asli dengan menggunakan kerangka kerja aplikasi Xamarin.Mac. Untuk informasi selengkapnya, lihat Xamarin.Mac.
Speech SDK untuk Objective-C tersedia secara native sebagai paket CocoaPod.
Persyaratan sistem untuk iOS:
MacOS versi 10.14 atau yang lebih baru
Menargetkan iOS 9.3 atau yang lebih baru
Paket macOS CocoaPod tersedia untuk diunduh dan digunakan dengan lingkungan pengembangan terintegrasi (IDE) Xcode 9.4.1 (atau yang lebih baru).
Buka direktori Xcode di mana file proyek .xcodeproj Anda berada.
Jalankan pod init untuk membuat file pod bernama Podfile.
Ganti isi Podfile dengan yang berikut ini. Perbarui nama target dari 'AppName' ke nama aplikasi Anda. Perbarui platform atau versi pod sesuai kebutuhan.
platform :ios, '9.3'
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.22.0'
end
Jalankan pod install untuk menginstal Speech SDK.
Atau, Anda dapat mengunduh CocoaPod biner dan membuka zip untuk mengekstrak kontennya. Dalam proyek Xcode Anda, tambahkan referensi ke folder "MicrosoftCognitiveServicesSpeech.xcframework" yang diekstrak dan isinya.
Catatan
Pengembang .NET dapat membangun aplikasi iOS asli dengan menggunakan kerangka kerja aplikasi Xamarin.iOS Untuk informasi selengkapnya, lihat Xamarin.iOS.
Speech SDK untuk Swift tersedia secara native sebagai paket CocoaPod untuk Mac x64 dan silikon berbasis ARM.
Persyaratan sistem untuk Mac:
MacOS versi 10.14 atau yang lebih baru
Paket macOS CocoaPod tersedia untuk diunduh dan digunakan dengan lingkungan pengembangan terintegrasi (IDE) Xcode 9.4.1 (atau yang lebih baru).
Buka direktori Xcode di mana file proyek .xcodeproj Anda berada.
Jalankan pod init untuk membuat file pod bernama Podfile.
Ganti isi Podfile dengan yang berikut ini. Perbarui nama target dari 'AppName' ke nama aplikasi Anda. Perbarui platform atau versi pod sesuai kebutuhan.
platform :osx, 10.14
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.22.0'
end
Jalankan pod install untuk menginstal Speech SDK.
Atau, Anda dapat mengunduh CocoaPod biner dan membuka zip untuk mengekstrak kontennya. Dalam proyek Xcode Anda, tambahkan referensi ke folder "MicrosoftCognitiveServicesSpeech.xcframework" yang diekstrak dan isinya.
Catatan
Pengembang .NET dapat membangun aplikasi macOS asli dengan menggunakan kerangka kerja aplikasi Xamarin.Mac. Untuk informasi selengkapnya, lihat Xamarin.Mac.
Speech SDK untuk Swift tersedia secara native sebagai paket CocoaPod.
Persyaratan sistem untuk iOS:
MacOS versi 10.14 atau yang lebih baru
Menargetkan iOS 9.3 atau yang lebih baru
Paket macOS CocoaPod tersedia untuk diunduh dan digunakan dengan lingkungan pengembangan terintegrasi (IDE) Xcode 9.4.1 (atau yang lebih baru).
Buka direktori Xcode di mana file proyek .xcodeproj Anda berada.
Jalankan pod init untuk membuat file pod bernama Podfile.
Ganti isi Podfile dengan yang berikut ini. Perbarui nama target dari 'AppName' ke nama aplikasi Anda. Perbarui platform atau versi pod sesuai kebutuhan.
platform :ios, '9.3'
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.22.0'
end
Jalankan pod install untuk menginstal Speech SDK.
Atau, Anda dapat mengunduh CocoaPod biner dan membuka zip untuk mengekstrak kontennya. Dalam proyek Xcode Anda, tambahkan referensi ke folder "MicrosoftCognitiveServicesSpeech.xcframework" yang diekstrak dan isinya.
Catatan
Pengembang .NET dapat membangun aplikasi iOS asli dengan menggunakan kerangka kerja aplikasi Xamarin.iOS Untuk informasi selengkapnya, lihat Xamarin.iOS.
Speech SDK untuk Python hanya mendukung Ubuntu 18.04/20.04/22.04, Debian 9/10/11, Red Hat Enterprise Linux (RHEL) 8, dan CentOS 8 pada arsitektur x64 berikut saat digunakan dengan Linux.
Penting
Gunakan rilis LTS terbaru dari distribusi Linux. Misalnya, jika Anda menggunakan Ubuntu 20.04 LTS, gunakan rilis terbaru Ubuntu 20.04.X.
Untuk aplikasi native, Speech SDK bergantung pada libMicrosoft.CognitiveServices.Speech.core.so. Pastikan arsitektur target (x86, x64) cocok dengan aplikasi. Tergantung pada versi Linux, dependensi lain mungkin diperlukan:
Pustaka bersama dari pustaka GNU C, termasuk pustaka Pemrograman Thread POSIX, libpthreads
Pada Ubuntu 22.04, instal libssl1.1 baik sebagai paket biner seperti libssl1.1_1.1.1l-1ubuntu1.3_amd64.deb, atau dengan mengompilasinya dari sumber. Speech SDK tidak mendukung OpenSSL 3.0, yang merupakan default di Ubuntu 22.04.
Berikut adalah contoh penginstalan libssl1.1 pada Ubuntu 22.04:
Untuk menggunakan Speech SDK di Alpine Linux, buat lingkungan chroot Debian seperti yang didokumentasikan di Alpine Linux Wiki tentang menjalankan program glibc. Kemudian ikuti instruksi Debian di sini.
Diperlukan macOS versi 10.14 atau yang lebih baru.
Pasang versi Python dari 3.7 hingga 3.10. Untuk memeriksa penginstalan Anda, buka terminal dan jalankan perintah python --version. Jika terpasang dengan benar, Anda akan mendapatkan respons seperti "Python 3.8.2".
Penting
Pastikan paket dari platform yang sama (x64 atau x86) dipasang. Misalnya, jika Anda menginstal paket x64 yang dapat didistribusikan ulang, maka Anda perlu menginstal paket Python x64.
Menginstal Speech SDK
Sebelum Anda memasang Speech SDK untuk Python, pastikan untuk memenuhi persyaratan platform.
Anda dapat memeriksa versi Speech SDK untuk Python mana yang saat ini diinstal dengan memeriksa variabel azure.cognitiveservices.speech.__version__. Misalnya, jalankan perintah ini di terminal:
pip list
Memasang Speech SDK menggunakan Visual Studio Code