Wat zijn Spraakapparaten?

De Speech-service werkt met een groot aantal apparaten en audiobronnen. U kunt de standaardaudioverwerking gebruiken die beschikbaar is op een apparaat. Anders heeft de Speech SDK een optie voor u om onze geavanceerde audioverwerkingsalgoritmen te gebruiken die zijn ontworpen om goed te werken met de Speech-service. Het biedt nauwkeurige spraakherkenning in veel velden via ruisonderdrukking, echo-annulering, beamforming en dereverberatie.

Audioverwerking

Audioverwerking is verbeteringen toegepast op een stream van audio om de audiokwaliteit te verbeteren. Voorbeelden van veelvoorkomende verbeteringen zijn AGC (Automatic Gain Control), ruisonderdrukking en akoestische echo-annulering (AEC). De Speech SDK integreert Microsoft Audio Stack (MAS) zodat elke toepassing of elk product de mogelijkheden voor audioverwerking kan gebruiken voor invoeraudio.

Aanbeveling voor microfoonmatrix

De Speech SDK werkt het beste met een microfoonmatrix die is ontworpen volgens onze aanbevolen richtlijnen. Zie Aanbevelingen voor microfoonmatrix voor meer informatie.

Kits voor apparaatontwikkeling

De Speech SDK is ontworpen voor gebruik met speciaal gebouwde ontwikkelingskits en verschillende configuraties voor microfoonmatrix. U kunt bijvoorbeeld een van deze Azure Development Kits gebruiken.

  • Azure Percept DK bevat een vooraf geconfigureerde audioprocessor en een lineaire matrix met vier microfoons. U kunt spraakopdrachten, trefwoorden herkennen en veel veldspraak gebruiken met behulp van Azure AI-services.
  • Azure Kinect DK is een ontwikkelkit voor ruimtelijke computing met geavanceerde AI-sensoren die geavanceerde Azure AI Vision- en spraakmodellen bieden. Als alles-in-één klein apparaat met meerdere modi bevat het een dieptesensor, ruimtelijke microfoonmatrix met een videocamera en oriëntatiesensor.

Volgende stappen