Samenvatting

10 minuten

Gefeliciteerd met het bouwen van een audio binair classificatie spraakmodel!

U hebt nu een beter begrip van hoe een analoge audio verandert in digitaal geluid en hoe u spectrogramafbeeldingen van uw golfbestanden maakt. U hebt de gegevensset PyTorch Speech Commands gebruikt, de klassen geparseerd tot yes en nomet en en vervolgens gekeken naar manieren om audiogegevenspatronen te begrijpen en te visualiseren. Van daaruit hebt u de spectrogrammen genomen, afbeeldingen gemaakt en een convolutionele neurale netwerk gebruikt om uw model te bouwen.

U kunt deze kennis uitbreiden door andere gegevenssets en geluiden te bekijken, en ook door de MFCC transformator te bekijken. Vervolgens kunt u uw model bouwen.

Bekijk ook deze andere modules:

Inleiding tot PyTorch
Computer Vision met PyTorch
Natuurlijke taalverwerking met PyTorch

Tip

Als u een hyperlink wilt openen, klikt u met de rechtermuisknop en kiest u Openen in nieuw tabblad of venster. Op die manier kunt u de resource zien en eenvoudig terugkeren naar de module.

Doorgaan

Feedback