Wprowadzenie do klasyfikacji audio za pomocą narzędzia PyTorch
W tym module Learn dowiesz się, jak przeprowadzić klasyfikację dźwięku za pomocą narzędzia PyTorch. Dowiesz się więcej na temat funkcji danych audio i sposobu przekształcania sygnałów dźwiękowych w wizualną reprezentację o nazwie spectrogramy. Następnie utworzysz model przy użyciu przetwarzania obrazów na obrazach spektrogramu. To prawda, możesz przekształcić dźwięk w format obrazu, a następnie wykonać przetwarzanie obrazów, aby sklasyfikować słowo mówione!
Cele szkolenia
Zawartość tego modułu:
- Poznaj podstawowe funkcje danych audio.
- Dowiedz się, jak przekształcać sygnały dźwiękowe w format obrazu wizualnego przy użyciu spektrogramów.
- Utwórz model klasyfikacji mowy, który może rozpoznawać dźwięki lub słowa mówione przy użyciu splotowych sieci neuronowych (CNN).
Wymagania wstępne
- Podstawowa wiedza na temat języka Python.
- Podstawowa wiedza na temat korzystania z notesów Jupyter Notebook.
- Podstawowa wiedza na temat sieci CNN. Moduł "Wprowadzenie do przetwarzanie obrazów z narzędziem PyTorch" w tej ścieżce szkoleniowej jest dobrym miejscem do rozpoczęcia.