Inleiding tot audioclassificatie met PyTorch

Module
5 Eenheden

Beginner

Data Scientist

Developer

Student

Azure

In deze Learn-module leert u hoe u audioclassificatie uitvoert met PyTorch. U krijgt meer informatie over functies voor audiogegevens en hoe u de geluidssignalen kunt transformeren in een visuele weergave die spectrogrammen wordt genoemd. Vervolgens bouwt u het model met behulp van Computer Vision op de spectrogramafbeeldingen. Dat klopt, u kunt audio omzetten in een afbeeldingsindeling en vervolgens Computer Vision uitvoeren om het gesproken woord te classificeren.

Leerdoelen

In deze module wordt het volgende behandeld:

Meer informatie over de basisfuncties van audiogegevens.
Meer informatie over het transformeren van geluidssignalen naar een visuele afbeeldingsindeling met behulp van spectrogrammen.
Bouw een spraakclassificatiemodel dat geluiden of gesproken woorden kan herkennen met behulp van convolutionele neurale netwerken (CNN's).

Vereisten

Basiskennis van Python.
Basiskennis over het gebruik van Jupyter Notebooks.
Basiskennis van CNN's. De module 'Inleiding tot Computer Vision met PyTorch' in dit leertraject is een goed startpunt.

Introductie min
Audiogegevens en -concepten begrijpen min
Audiotransformaties en visualisaties min
Het spraakmodel bouwen min
Samenvatting min