Konuşmayı metne dönüştürme nedir?

Bu genel bakışta, konuşmayı metne değiştirme hizmetinin avantajları ve özellikleri hakkında bilgi elde etmeyi öğrenirsiniz. Konuşma tanıma olarak da bilinen konuşmayı metne dönüştüren, ses akışlarının metne gerçek zamanlı transkripsiyonu sağlar. Uygulamalarınız, araçlarınız veya cihazlarınız bu metin üzerinde komut girişi olarak kullanabilir, display ve eyleme geçebilirsiniz. Bu hizmet, Microsoft'un ürün ve ürün kullanımı için kullandığı tanıma Cortana Office desteklemektedir. Çeviri ve metin çevirisi hizmet teklifleriyle sorunsuz bir şekilde çalışır. Kullanılabilir konuşmadan metne dillerin tam listesi için desteklenen dillere bakın.

Konuşmayı metne metine hizmet varsayılan olarak Evrensel dil modelini kullanır. Bu model Microsoft'a ait veriler kullanılarak eğitilmiş ve bulutta dağıtılmıştır. Konuşma ve dikte senaryoları için en uygundur. Benzersiz bir ortamda tanıma ve transkripsiyon için konuşmayı metne çeviri kullanırken özel akustik, dil ve söyleniş modelleri oluşturabilir ve eğitebilirsiniz. Özelleştirme, ortam kirliliğini veya sektöre özgü sözlüğü ele alamada yararlıdır.

Bu belge aşağıdaki makale türlerini içerir:

  • Hızlı başlangıçlar, hizmete istekte bulundurma konusunda size rehberlik etmek için başlangıç yönergeleridir.
  • Nasıl yapılır kılavuzları, hizmeti daha belirli veya özelleştirilmiş yollarla kullanmaya yönelik yönergeler içerir.
  • Kavramlar, hizmet işlevselliğinin ve özelliklerinin ayrıntılı açıklamalarını sağlar.
  • Öğreticiler, hizmeti daha geniş iş çözümlerini bileşen olarak kullanmayı gösteren daha uzun kılavuzlardır.

Not

Bing Konuşma' 15 Ekim 2019'da kaldırıldı. Uygulamalarınız, araçlarınız veya ürünleriniz konuşma Bing kullanıyorsa Konuşma tanıma hizmetine geçişe yardımcı olacak kılavuzlar oluşturduk.

başlarken

Konuşmayı metne göre çalışmaya başlama hızlı başlangıçlarına bakın. Hizmet Konuşma SDK'sı, REST API veKonuşma CLI'sı aracılığıyla kullanılabilir.

Örnek kod

Konuşma SDK'sı için örnek kod, GitHub. Bu örnekler, bir dosyadan veya akıştan ses okuma, sürekli ve başlangıç tanıma ve özel modellerle çalışma gibi yaygın senaryoları içerir.

Özelleştirme

Standart Konuşma hizmeti modeline ek olarak özel modeller oluşturabilirsiniz. Özelleştirme, konuşma stili, sözlük ve arka plan gürültüsü gibi konuşma tanıma engellerini aşmaya yardımcı olur. Bkz. Özel Konuşma. Özelleştirme seçenekleri dile/yerele göre farklılık gösterir. Desteği doğrulamak için desteklenen diller'e bakın.

Toplu iş transkripsiyonu

Toplu transkripsiyon, REST API miktarda sesi döküme alamanızı sağlayan bir dizi farklı işlemdir. Paylaşılan erişim imzası (SAS) URI'si kullanarak ses dosyalarınızı işaret edebilir ve transkripsiyon sonuçlarını zaman uyumsuz bir şekilde alabilirsiniz. Toplu transkripsiyon API'sini kullanma hakkında daha fazla bilgi için nasıl kullanılır? belgesine bakın.

Başvuru belgeleri

Konuşma hizmeti iki SDK sağlar. İlk SDK birincil konuşma SDK 'sına sahiptir ve konuşma hizmetiyle etkileşim kurmak için gereken işlevlerin çoğunu sağlar. İkinci SDK, konuşma cihazları SDK 'sınauygun olarak adlandırılan cihazlara özgüdür. Her iki SDK da birçok dilde kullanılabilir.

Konuşma SDK başvuru belgeleri

Uygun konuşma SDK 'Sı başvuru belgelerini bulmak için aşağıdaki listeyi kullanın:

İpucu

Konuşma hizmeti SDK 'Sı etkin bir şekilde korunur ve güncelleştirilir. Değişiklikleri izlemek için, güncelleştirmeler ve özellik eklemeleri konuşma SDK 'sı sürüm notlarınabaşvurur.

Konuşma cihazları SDK 'Sı başvuru belgeleri

Konuşma CIHAZLARı SDK 'sı, belirli cihazlarda genişletilmiş işlevselliğe sahip olan konuşma SDK 'sının bir üst kümesidir. Konuşma cihazları SDK 'sını indirmek için önce bir geliştirme seti seçmenizgerekir.

REST API başvuruları

Çeşitli konuşma hizmeti REST API 'lerinin başvuruları için aşağıdaki listeye bakın:

Sonraki adımlar