Inleiding tot audioclassificatie met PyTorch
In deze Learn-module leert u hoe u audioclassificatie uitvoert met PyTorch. U krijgt meer informatie over functies voor audiogegevens en hoe u de geluidssignalen kunt transformeren in een visuele weergave die spectrogrammen wordt genoemd. Vervolgens bouwt u het model met behulp van Computer Vision op de spectrogramafbeeldingen. Dat klopt, u kunt audio omzetten in een afbeeldingsindeling en vervolgens Computer Vision uitvoeren om het gesproken woord te classificeren.
Leerdoelen
In deze module wordt het volgende behandeld:
- Meer informatie over de basisfuncties van audiogegevens.
- Meer informatie over het transformeren van geluidssignalen naar een visuele afbeeldingsindeling met behulp van spectrogrammen.
- Bouw een spraakclassificatiemodel dat geluiden of gesproken woorden kan herkennen met behulp van convolutionele neurale netwerken (CNN's).
Vereisten
- Basiskennis van Python.
- Basiskennis over het gebruik van Jupyter Notebooks.
- Basiskennis van CNN's. De module 'Inleiding tot Computer Vision met PyTorch' in dit leertraject is een goed startpunt.