Samouczek: prognozowanie zapotrzebowania przy użyciu zautomatyzowanego uczenia maszynowego bez kodu w usłudze Azure Machine Edukacja Studio

Dowiedz się, jak utworzyć model prognozowania szeregów czasowych bez konieczności pisania pojedynczego wiersza kodu przy użyciu zautomatyzowanego uczenia maszynowego w usłudze Azure Machine Edukacja Studio. Ten model przewiduje zapotrzebowanie na wynajem usługi udostępniania rowerów.

W tym samouczku nie piszesz żadnego kodu. Do przeprowadzenia trenowania używasz interfejsu studio. Dowiesz się, jak wykonywać następujące zadania:

  • Tworzenie i ładowanie zestawu danych.
  • Konfigurowanie i uruchamianie zautomatyzowanego eksperymentu uczenia maszynowego.
  • Określ ustawienia prognozowania.
  • Zapoznaj się z wynikami eksperymentu.
  • Wdrażanie najlepszego modelu.

Wypróbuj również zautomatyzowane uczenie maszynowe dla tych innych typów modeli:

Wymagania wstępne

Zaloguj się do studia

W tym samouczku utworzysz przebieg eksperymentu zautomatyzowanego uczenia maszynowego w usłudze Azure Machine Edukacja Studio, skonsolidowany interfejs internetowy zawierający narzędzia uczenia maszynowego do wykonywania scenariuszy nauki o danych dla praktyków nauki o danych na wszystkich poziomach umiejętności. Studio nie jest obsługiwane w przeglądarkach programu Internet Explorer.

  1. Zaloguj się do usługi Azure Machine Edukacja Studio.

  2. Wybierz subskrypcję i utworzony obszar roboczy.

  3. Wybierz Rozpocznij.

  4. W okienku po lewej stronie wybierz pozycję Zautomatyzowane uczenie maszynowe w sekcji Autor .

  5. Wybierz pozycję +Nowe zadanie zautomatyzowanego uczenia maszynowego.

Tworzenie i ładowanie zestawu danych

Przed skonfigurowaniem eksperymentu przekaż plik danych do obszaru roboczego w postaci zestawu danych usługi Azure Machine Edukacja. Dzięki temu można mieć pewność, że dane są odpowiednio sformatowane dla eksperymentu.

  1. W formularzu Wybieranie zestawu danych wybierz pozycję Z plików lokalnych z listy rozwijanej +Utwórz zestaw danych .

    1. W formularzu Informacje podstawowe nadaj zestawowi danych nazwę i podaj opcjonalny opis. Typ zestawu danych powinien być domyślny dla tabelarycznego, ponieważ zautomatyzowane uczenie maszynowe w usłudze Azure Machine Edukacja Studio obecnie obsługuje tylko tabelaryczne zestawy danych.

    2. Wybierz pozycję Dalej w lewym dolnym rogu

    3. W formularzu Wyboru magazynu danych i pliku wybierz domyślny magazyn danych, który został automatycznie skonfigurowany podczas tworzenia obszaru roboczego, workspaceblobstore (Azure Blob Storage). Jest to lokalizacja magazynu, w której przekazujesz plik danych.

    4. Wybierz pozycję Przekaż pliki z listy rozwijanej Przekaż .

    5. Wybierz plik bike-no.csv na komputerze lokalnym. Jest to plik pobrany jako warunek wstępny.

    6. Wybierz Dalej

      Po zakończeniu przekazywania formularz Ustawienia i podgląd zostanie wstępnie wypełniony na podstawie typu pliku.

    7. Sprawdź, czy formularz Ustawienia i podgląd został wypełniony w następujący sposób, a następnie wybierz przycisk Dalej.

      Pole opis Wartość dla samouczka
      File format Definiuje układ i typ danych przechowywanych w pliku. Rozdzielane
      Ogranicznik Co najmniej jeden znak określający granicę między oddzielnymi, niezależnymi regionami w postaci zwykłego tekstu lub innych strumieni danych. Comma
      Kodowanie Określa, jakiego bitu do tabeli schematów znaków używać do odczytywania zestawu danych. UTF-8
      Nagłówki kolumn Wskazuje, jak będą traktowane nagłówki zestawu danych, jeśli istnieją. Tylko pierwszy plik ma nagłówki
      Pomiń wiersze Wskazuje, ile wierszy zostanie pominiętych w zestawie danych, jeśli istnieje. Brak
    8. Formularz Schemat umożliwia dalszą konfigurację danych dla tego eksperymentu.

      1. W tym przykładzie wybierz opcję ignorowania zwykłych i zarejestrowanych kolumn. Te kolumny są podziałem kolumny cnt , dlatego nie uwzględniamy ich.

      2. W tym przykładzie pozostaw wartości domyślne właściwości i typ.

      3. Wybierz Dalej.

    9. W formularzu Potwierdź szczegóły sprawdź, czy informacje są zgodne z informacjami wcześniej wypełnionymi w formularzach Podstawowe informacje i Ustawienia i podglądu.

    10. Wybierz pozycję Utwórz , aby ukończyć tworzenie zestawu danych.

    11. Wybierz zestaw danych po wyświetleniu go na liście.

    12. Wybierz Dalej.

Konfigurowanie zadania

Po załadowaniu i skonfigurowaniu danych skonfiguruj docelowy obiekt obliczeniowy zdalny i wybierz kolumnę w danych, które chcesz przewidzieć.

  1. Wypełnij formularz Konfigurowanie zadania w następujący sposób:
    1. Wprowadź nazwę eksperymentu: automl-bikeshare

    2. Wybierz pozycję cnt jako kolumnę docelową, co chcesz przewidzieć. Ta kolumna wskazuje łączną liczbę wypożyczeń udziałów rowerów.

    3. Wybierz klaster obliczeniowy jako typ obliczeniowy.

    4. Wybierz pozycję +Nowy , aby skonfigurować docelowy obiekt obliczeniowy. Zautomatyzowane uczenie maszynowe obsługuje tylko środowisko obliczeniowe usługi Azure Machine Edukacja.

      1. Wypełnij formularz Select virtual machine (Wybieranie maszyny wirtualnej), aby skonfigurować obliczenia.

        Pole opis Wartość dla samouczka
        Warstwa maszyny wirtualnej Wybierz priorytet, jaki powinien mieć eksperyment Dedykowane
        Typ maszyny wirtualnej Wybierz typ maszyny wirtualnej dla obliczeń. Procesor CPU (centralna jednostka przetwarzania)
        Rozmiar maszyny wirtualnej Wybierz rozmiar maszyny wirtualnej dla obliczeń. Lista zalecanych rozmiarów jest udostępniana na podstawie danych i typu eksperymentu. Standard_DS12_V2
      2. Wybierz przycisk Dalej , aby wypełnić formularz Konfigurowanie ustawień.

        Pole opis Wartość dla samouczka
        Nazwa obiektu obliczeniowego Unikatowa nazwa identyfikująca kontekst obliczeniowy. bike-compute
        Minimalna/maksymalna liczba węzłów Aby profilować dane, należy określić co najmniej jeden węzeł. Minimalna liczba węzłów: 1
        Maksymalna liczba węzłów: 6
        Bezczynność sekund przed skalowaniem w dół Czas bezczynności przed automatycznym skalowaniem klastra w dół do minimalnej liczby węzłów. 120 (ustawienie domyślne)
        Ustawienia zaawansowane Ustawienia skonfigurować i autoryzować sieć wirtualną na potrzeby eksperymentu. Brak
      3. Wybierz pozycję Utwórz , aby uzyskać docelowy obiekt obliczeniowy.

        Ukończenie tego procesu może potrwać kilka minut.

      4. Po utworzeniu wybierz nowy docelowy obiekt obliczeniowy z listy rozwijanej.

    5. Wybierz Dalej.

Wybieranie ustawień prognozy

Ukończ konfigurację eksperymentu zautomatyzowanego uczenia maszynowego, określając typ zadania uczenia maszynowego i ustawienia konfiguracji.

  1. W formularzu Typ zadania i ustawienia wybierz pozycję Prognozowanie szeregów czasowych jako typ zadania uczenia maszynowego.

  2. Wybierz datę jako kolumnęGodzina i pozostaw puste identyfikatory szeregów czasowych.

  3. Częstotliwość to częstotliwość zbierania danych historycznych. Zachowaj zaznaczoną opcję Autowykrywanie .

  4. Horyzont prognozy to czas na przyszłość, który chcesz przewidzieć. Usuń zaznaczenie pola Autowykrywanie i wpisz 14.

  5. Wybierz pozycję Wyświetl dodatkowe ustawienia konfiguracji i wypełnij pola w następujący sposób. Te ustawienia umożliwiają lepszą kontrolę nad zadaniem trenowania i określanie ustawień prognozy. W przeciwnym razie wartości domyślne są stosowane na podstawie wyboru eksperymentu i danych.

    Dodatkowe konfiguracje opis Wartość dla samouczka
    Metryka podstawowa Metryka oceny mierzona przez algorytm uczenia maszynowego. Znormalizowany błąd średniokwadratowy z średnią główną
    Wyjaśnienie najlepszego modelu Automatycznie pokazuje możliwość wyjaśnienia najlepszego modelu utworzonego przez zautomatyzowane uczenie maszynowe. Włączanie
    Zablokowane algorytmy Algorytmy, które mają zostać wykluczone z zadania trenowania Skrajne losowe drzewa
    Dodatkowe ustawienia prognozowania Te ustawienia pomagają zwiększyć dokładność modelu.

    Opóźnienie wartości docelowej prognozy: jak daleko chcesz skonstruować opóźnienia zmiennej docelowej
    Docelowe okno stopniowe: określa rozmiar okna kroczącego, w którym są generowane funkcje, takie jak maksymalna, minimalna i suma.


    Opóźnienie wartości docelowej prognozy: Brak
    Docelowy rozmiar okna kroczącego: Brak
    Kryterium wyjścia Jeśli zostaną spełnione kryteria, zadanie trenowania zostanie zatrzymane. Czas zadania szkolenia (godziny): 3
    Próg oceny metryki: Brak
    Współbieżność Maksymalna liczba wykonanych iteracji równoległych na iterację Maksymalna liczba iteracji współbieżnych: 6

    Wybierz pozycję Zapisz.

  6. Wybierz Dalej.

  7. Na formularzu weryfikacji i testowania [opcjonalnie]

    1. Wybierz k-fold krzyżową walidację jako typ walidacji.
    2. Wybierz wartość 5 jako liczbę krzyżowych walidacji.

Uruchom eksperyment

Aby uruchomić eksperyment, wybierz pozycję Zakończ. Zostanie otwarty ekran Szczegóły zadania ze stanem zadania u góry obok numeru zadania. Ten stan jest aktualizowany w miarę postępu eksperymentu. Powiadomienia są również wyświetlane w prawym górnym rogu programu Studio, aby poinformować Cię o stanie eksperymentu.

Ważne

Przygotowanie trwa od 10 do 15 minut , aby przygotować zadanie eksperymentu. Po uruchomieniu kolejne 2–3 minuty dla każdej iteracji trwa 2–3 minuty.

W środowisku produkcyjnym prawdopodobnie odejdziesz trochę, ponieważ ten proces zajmuje trochę czasu. Podczas oczekiwania zalecamy rozpoczęcie eksplorowania przetestowanych algorytmów na karcie Modele w miarę ich ukończenia.

Eksplorowanie modeli

Przejdź do karty Modele , aby zobaczyć przetestowane algorytmy (modele). Domyślnie modele są uporządkowane według wyniku metryki w miarę ich ukończenia. W tym samouczku model, który ocenia najwyższą wartość na podstawie wybranej metryki błędu średniokwadratowego znormalizowanego głównego, znajduje się na początku listy.

Podczas oczekiwania na zakończenie wszystkich modeli eksperymentów wybierz nazwę algorytmu ukończonego modelu, aby zapoznać się ze szczegółami wydajności.

Poniższy przykład umożliwia wybranie modelu z listy modeli utworzonych przez zadanie. Następnie wybierz kartę Przegląd i Metryki , aby wyświetlić właściwości, metryki i wykresy wydajności wybranego modelu.

Run Overview

Wdrażanie modelu

Zautomatyzowane uczenie maszynowe w usłudze Azure Machine Edukacja Studio umożliwia wdrożenie najlepszego modelu jako usługi internetowej w kilku krokach. Wdrożenie to integracja modelu, dzięki czemu może przewidywać nowe dane i identyfikować potencjalne obszary możliwości.

W tym eksperymencie wdrożenie w usłudze internetowej oznacza, że firma zajmująca się udostępnianiem rowerów ma teraz iteracyjne i skalowalne rozwiązanie internetowe do prognozowania zapotrzebowania na wypożyczanie udziałów rowerów.

Po zakończeniu zadania przejdź z powrotem do strony nadrzędnego zadania, wybierając pozycję Zadanie 1 w górnej części ekranu.

W sekcji Podsumowanie najlepszego modelu najlepszy model w kontekście tego eksperymentu jest wybierany na podstawie metryki znormalizowanego błędu średniokwadratowego znormalizowanego elementu głównego.

Wdrożenie tego modelu trwa około 20 minut. Proces wdrażania obejmuje kilka kroków, w tym rejestrowanie modelu, generowanie zasobów i konfigurowanie ich dla usługi internetowej.

  1. Wybierz najlepszy model , aby otworzyć stronę specyficzną dla modelu.

  2. Wybierz przycisk Wdróż znajdujący się w lewym górnym obszarze ekranu.

  3. Wypełnij okienko Wdrażanie modelu w następujący sposób:

    Pole Wartość
    Nazwa wdrożenia bikeshare-deploy
    Opis wdrożenia wdrażanie popytu na udział rowerów
    Typ środowiska obliczeniowego Wybieranie wystąpienia obliczeniowego platformy Azure (ACI)
    Włącz uwierzytelnianie Wyłącz.
    Korzystanie z niestandardowych zasobów wdrażania Wyłącz. Wyłączenie umożliwia automatyczne generowanie domyślnego pliku sterownika (skryptu oceniania) i pliku środowiska.

    W tym przykładzie użyjemy wartości domyślnych podanych w menu Zaawansowane .

  4. Wybierz Wdróż.

    Zielony komunikat o powodzeniu pojawia się w górnej części ekranu Zadanie z informacją, że wdrożenie zostało pomyślnie uruchomione. Postęp wdrażania można znaleźć w okienku podsumowania modelu w obszarze Stan wdrożenia.

Po pomyślnym wdrożeniu masz działającą usługę internetową do generowania przewidywań.

Przejdź do następnych kroków, aby dowiedzieć się więcej na temat korzystania z nowej usługi internetowej i przetestować przewidywania przy użyciu wbudowanej obsługi usługi Azure Machine Edukacja usługi Power BI.

Czyszczenie zasobów

Pliki wdrażania są większe niż pliki danych i eksperymentów, więc kosztują więcej do przechowywania. Usuń tylko pliki wdrażania, aby zminimalizować koszty na koncie lub jeśli chcesz zachować obszar roboczy i pliki eksperymentów. W przeciwnym razie usuń całą grupę zasobów, jeśli nie planujesz używać żadnego z plików.

Usuwanie wystąpienia wdrożenia

Usuń tylko wystąpienie wdrożenia z usługi Azure Machine Edukacja Studio, jeśli chcesz zachować grupę zasobów i obszar roboczy na potrzeby innych samouczków i eksploracji.

  1. Przejdź do usługi Azure Machine Edukacja Studio. Przejdź do obszaru roboczego i po lewej stronie w okienku Zasoby wybierz pozycję Punkty końcowe.

  2. Wybierz wdrożenie, które chcesz usunąć, a następnie wybierz pozycję Usuń.

  3. Wybierz pozycję Kontynuuj.

Usuwanie grupy zasobów

Ważne

Utworzone zasoby mogą być używane jako wymagania wstępne w innych samouczkach usługi Azure Machine Edukacja i artykułach z instrukcjami.

Jeśli nie planujesz korzystać z żadnych utworzonych zasobów, usuń je, aby nie ponosić żadnych opłat:

  1. W witrynie Azure Portal na końcu z lewej strony wybierz pozycję Grupy zasobów.

  2. Z listy wybierz utworzoną grupę zasobów.

  3. Wybierz pozycję Usuń grupę zasobów.

    Screenshot of the selections to delete a resource group in the Azure portal.

  4. Wpisz nazwę grupy zasobów. Następnie wybierz Usuń.

Następne kroki

W tym samouczku użyto zautomatyzowanego uczenia maszynowego w usłudze Azure Machine Edukacja Studio do utworzenia i wdrożenia modelu prognozowania szeregów czasowych, który przewiduje zapotrzebowanie na udostępnianie rowerów.

Zobacz ten artykuł, aby uzyskać instrukcje dotyczące tworzenia obsługiwanego schematu usługi Power BI w celu ułatwienia użycia nowo wdrożonej usługi internetowej:

Uwaga

Ten zestaw danych udziału rowerów został zmodyfikowany na potrzeby tego samouczka. Ten zestaw danych został udostępniony w ramach konkursu Kaggle i był pierwotnie dostępny za pośrednictwem Capital Bikeshare. Można go również znaleźć w usłudze UCI Machine Edukacja Database.

Źródło: Fanaee-T, Hadi i Gama, Joao, Etykietowanie zdarzeń łączące detektory zespołów i wiedzę w tle, Postęp w sztucznej inteligencji (2013): pp. 1-15, Springer Berlin Heidelberg.