Wprowadzenie do klasyfikacji audio za pomocą narzędzia PyTorch

Początkujący
Data Scientist
Developer
Student
Azure

W tym module Learn dowiesz się, jak przeprowadzić klasyfikację dźwięku za pomocą narzędzia PyTorch. Dowiesz się więcej na temat funkcji danych audio i sposobu przekształcania sygnałów dźwiękowych w wizualną reprezentację o nazwie spectrogramy. Następnie utworzysz model przy użyciu przetwarzania obrazów na obrazach spektrogramu. To prawda, możesz przekształcić dźwięk w format obrazu, a następnie wykonać przetwarzanie obrazów, aby sklasyfikować słowo mówione!

Cele szkolenia

Zawartość tego modułu:

  • Poznaj podstawowe funkcje danych audio.
  • Dowiedz się, jak przekształcać sygnały dźwiękowe w format obrazu wizualnego przy użyciu spektrogramów.
  • Utwórz model klasyfikacji mowy, który może rozpoznawać dźwięki lub słowa mówione przy użyciu splotowych sieci neuronowych (CNN).

Wymagania wstępne

  • Podstawowa wiedza na temat języka Python.
  • Podstawowa wiedza na temat korzystania z notesów Jupyter Notebook.
  • Podstawowa wiedza na temat sieci CNN. Moduł "Wprowadzenie do przetwarzanie obrazów z narzędziem PyTorch" w tej ścieżce szkoleniowej jest dobrym miejscem do rozpoczęcia.