Wprowadzenie do klasyfikacji audio za pomocą narzędzia PyTorch

Moduł
5 Lekcji

Początkujący

Data Scientist

Developer

Student

Azure

W tym module Learn dowiesz się, jak przeprowadzić klasyfikację dźwięku za pomocą narzędzia PyTorch. Dowiesz się więcej na temat funkcji danych audio i sposobu przekształcania sygnałów dźwiękowych w wizualną reprezentację o nazwie spectrogramy. Następnie utworzysz model przy użyciu przetwarzania obrazów na obrazach spektrogramu. To prawda, możesz przekształcić dźwięk w format obrazu, a następnie wykonać przetwarzanie obrazów, aby sklasyfikować słowo mówione!

Cele szkolenia

Zawartość tego modułu:

Poznaj podstawowe funkcje danych audio.
Dowiedz się, jak przekształcać sygnały dźwiękowe w format obrazu wizualnego przy użyciu spektrogramów.
Utwórz model klasyfikacji mowy, który może rozpoznawać dźwięki lub słowa mówione przy użyciu splotowych sieci neuronowych (CNN).

Wymagania wstępne

Podstawowa wiedza na temat języka Python.
Podstawowa wiedza na temat korzystania z notesów Jupyter Notebook.
Podstawowa wiedza na temat sieci CNN. Moduł "Wprowadzenie do przetwarzanie obrazów z narzędziem PyTorch" w tej ścieżce szkoleniowej jest dobrym miejscem do rozpoczęcia.

Wprowadzenie min
Omówienie danych dźwiękowych i pojęć min
Przekształcenia audio i wizualizacje min
Tworzenie modelu mowy min
Podsumowanie min