Inleiding tot audioclassificatie met PyTorch

Beginner
Data Scientist
Developer
Student
Azure

In deze Learn-module leert u hoe u audioclassificatie uitvoert met PyTorch. U krijgt meer informatie over functies voor audiogegevens en hoe u de geluidssignalen kunt transformeren in een visuele weergave die spectrogrammen wordt genoemd. Vervolgens bouwt u het model met behulp van Computer Vision op de spectrogramafbeeldingen. Dat klopt, u kunt audio omzetten in een afbeeldingsindeling en vervolgens Computer Vision uitvoeren om het gesproken woord te classificeren.

Leerdoelen

In deze module wordt het volgende behandeld:

  • Meer informatie over de basisfuncties van audiogegevens.
  • Meer informatie over het transformeren van geluidssignalen naar een visuele afbeeldingsindeling met behulp van spectrogrammen.
  • Bouw een spraakclassificatiemodel dat geluiden of gesproken woorden kan herkennen met behulp van convolutionele neurale netwerken (CNN's).

Vereisten

  • Basiskennis van Python.
  • Basiskennis over het gebruik van Jupyter Notebooks.
  • Basiskennis van CNN's. De module 'Inleiding tot Computer Vision met PyTorch' in dit leertraject is een goed startpunt.