Bagikan melalui


Menampilkan pemformatan teks dengan ucapan ke teks

Ucapan ke teks menawarkan berbagai fitur pemformatan untuk memastikan bahwa teks yang ditranskripsikan jelas dan dapat dibaca. Lihat bagian di bawah ini untuk gambaran umum tentang bagaimana setiap fitur digunakan untuk meningkatkan kejelasan keseluruhan output teks akhir.

ITN

Normalisasi Teks Terbalik (ITN) adalah proses yang mengonversi kata-kata lisan ke dalam bentuk tertulisnya. Misalnya, kata lisan "empat" dikonversi ke bentuk tertulis "4". Layanan ucapan ke teks menyelesaikan proses ini dan tidak dapat dikonfigurasi. Beberapa format teks yang didukung termasuk tanggal, waktu, desimal, mata uang, alamat, email, dan nomor telepon. Anda dapat berbicara secara alami, dan layanan memformat teks seperti yang diharapkan. Tabel berikut ini memperlihatkan aturan ITN yang diterapkan ke output teks.

Ucapan yang dikenali Menampilkan teks
that will cost nine hundred dollars That will cost $900.
my phone number is one eight hundred, four five six, eight nine ten My phone number is 1-800-456-8910.
the time is six forty five p m The time is 6:45 PM.
I live on thirty five lexington avenue I live on 35 Lexington Ave.
the answer is six point five The answer is 6.5.
send it to support at help dot com Send it to support@help.com.

Kapitalisasi

Model ucapan ke teks mengenali kata-kata yang harus dimodalkan untuk meningkatkan keterbacaan, akurasi, dan tata bahasa. Misalnya, layanan Ucapan secara otomatis memanfaatkan kata benda dan kata benda yang tepat di awal kalimat. Beberapa contoh diperlihatkan dalam tabel ini.

Ucapan yang dikenali Menampilkan teks
i got an x l t shirt I got an XL t-shirt.
my name is jennifer smith My name is Jennifer Smith.
i want to visit new york city I want to visit New York City.

Penghapusan disfluensi

Ketika berbicara, adalah umum bagi seseorang untuk gagap, menduplikasi kata-kata, dan mengucapkan kata-kata pengisi seperti "uhm" atau "uh". Ucapan ke teks dapat mengenali disfluencies tersebut dan menghapusnya dari teks tampilan. Penghapusan disfluensi sangat bagus untuk menerjemahkan ucapan yang tidak diskrip langsung untuk membacanya kembali nanti. Beberapa contoh diperlihatkan dalam tabel ini.

Ucapan yang dikenali Menampilkan teks
i uh said that we can go to the uhmm movies I said that we can go to the movies.
its its not that big of uhm a deal It's not that big of a deal.
umm i think tomorrow should work I think tomorrow should work.

Tanda Baca

Ucapan ke teks secara otomatis menjuluki teks Anda untuk meningkatkan kejelasan. Tanda baca berguna untuk membaca kembali transkripsi panggilan atau percakapan. Beberapa contoh diperlihatkan dalam tabel ini.

Ucapan yang dikenali Menampilkan teks
how are you How are you?
we can go to the mall park or beach We can go to the mall, park, or beach.

Saat menggunakan ucapan ke teks dengan pengenalan berkelanjutan, Anda dapat mengonfigurasi layanan Ucapan untuk mengenali tanda baca eksplisit. Kemudian Anda dapat berbicara tanda baca dengan lantang untuk membuat teks Anda lebih mudah terbalik. Ini sangat berguna dalam situasi di mana Anda ingin menggunakan tanda baca yang kompleks tanpa harus menggabungkannya nanti. Beberapa contoh diperlihatkan dalam tabel ini.

Ucapan yang dikenali Menampilkan teks
they entered the room dot dot dot They entered the room...
i heart emoji you period I <3 you.
the options are apple forward slash banana forward slash orange period The options are apple/banana/orange.
are you sure question mark Are you sure?

Gunakan Speech SDK untuk mengaktifkan mode dikte saat Anda menggunakan ucapan ke teks dengan pengenalan berkelanjutan. Mode ini menyebabkan instans konfigurasi ucapan menginterpretasikan deskripsi kata dari struktur kalimat seperti tanda baca.

speechConfig.EnableDictation();
speechConfig->EnableDictation();
speechConfig.EnableDictation()
speechConfig.enableDictation();
speechConfig.enableDictation();
[self.speechConfig enableDictation];
self.speechConfig!.enableDictation()
speech_config.enable_dictation()

Filter kata-kata kasar

Anda dapat menentukan apakah akan menutupi, menghapus, atau menampilkan kata-kata kotor dalam teks yang ditranskripsikan akhir. Masking menggantikan kata-kata yang tidak senonoh dengan karakter tanda bintang (*) sehingga Anda dapat menyimpan sentimen asli teks Anda sekaligus membuatnya lebih sesuai untuk situasi tertentu

Catatan

Microsoft juga berhak untuk menyembunyikan atau menghapus kata apa pun yang dianggap tidak pantas. Kata-kata seperti itu tidak akan dikembalikan oleh layanan Ucapan, baik Anda mengaktifkan pemfilteran kata-kata kasar maupun tidak.

Opsi filter kata-kata kasar adalah:

  • Masked: Mengganti huruf pada kata-kata kotor dengan karakter tanda bintang (*). Masked adalah opsi default.
  • Raw: Menyertakan verbatim kata-kata kotor.
  • Removed: Menghapus kata-kata kotor.

Misalnya, untuk menghapus kata-kata kotor dari hasil pengenalan ucapan, atur filter kata-kata kotor ke Removed seperti yang ditunjukkan di sini:

speechConfig.SetProfanity(ProfanityOption.Removed);
speechConfig->SetProfanity(ProfanityOption::Removed);
speechConfig.SetProfanity(common.Removed)
speechConfig.setProfanity(ProfanityOption.Removed);
speechConfig.setProfanity(sdk.ProfanityOption.Removed);
[self.speechConfig setProfanityOptionTo:SPXSpeechConfigProfanityOption.SPXSpeechConfigProfanityOption_ProfanityRemoved];
self.speechConfig!.setProfanityOptionTo(SPXSpeechConfigProfanityOption_ProfanityRemoved)
speech_config.set_profanity(speechsdk.ProfanityOption.Removed)
spx recognize --file caption.this.mp4 --format any --profanity masked --output vtt file - --output srt file -

Filter kata-kata kasar diterapkan ke hasil Text dan properti MaskedNormalizedForm. Filter kata-kata kasar tidak diterapkan ke hasil LexicalForm dan properti NormalizedForm. Filter juga tidak diterapkan pada hasil tingkat kata.

Langkah berikutnya