Samenvatting
Gefeliciteerd met het bouwen van een audio binair classificatie spraakmodel!
U hebt nu een beter begrip van hoe een analoge audio verandert in digitaal geluid en hoe u spectrogramafbeeldingen van uw golfbestanden maakt. U hebt de gegevensset PyTorch Speech Commands gebruikt, de klassen geparseerd tot yes
en no
met en en vervolgens gekeken naar manieren om audiogegevenspatronen te begrijpen en te visualiseren. Van daaruit hebt u de spectrogrammen genomen, afbeeldingen gemaakt en een convolutionele neurale netwerk gebruikt om uw model te bouwen.
U kunt deze kennis uitbreiden door andere gegevenssets en geluiden te bekijken, en ook door de MFCC
transformator te bekijken. Vervolgens kunt u uw model bouwen.
Bekijk ook deze andere modules:
Tip
Als u een hyperlink wilt openen, klikt u met de rechtermuisknop en kiest u Openen in nieuw tabblad of venster. Op die manier kunt u de resource zien en eenvoudig terugkeren naar de module.