Wprowadzanie składnika Dane ręcznie

W tym artykule opisano składnik w projektancie Azure Machine Learning.

Użyj składnika Wprowadź dane ręcznie , aby utworzyć mały zestaw danych, wpisując wartości. Zestaw danych może zawierać wiele kolumn.

Ten składnik może być przydatny w scenariuszach, takich jak:

  • Generowanie małego zestawu wartości do testowania.
  • Tworzenie krótkiej listy etykiet.
  • Wpisywanie listy nazw kolumn do wstawiania w zestawie danych.

Utwórz zestaw danych

  1. Dodaj składnik Enter Data Manually (Wprowadź dane ręcznie ) do potoku. Ten składnik można znaleźć w kategorii Dane wejściowe i wyjściowe w Azure Machine Learning.

  2. W polu DataFormat wybierz jedną z następujących opcji. Te opcje określają sposób analizowania danych, które należy podać. Wymagania dotyczące każdego formatu różnią się znacznie, dlatego zapoznaj się z powiązanymi tematami.

    • ARFF: Format pliku relacji atrybutów używany przez Weka.
    • CSV: format wartości rozdzielanych przecinkami. Aby uzyskać więcej informacji, zobacz Konwertowanie na plik CSV.
    • SVMLight: format używany przez Vowpal Wabbit i inne struktury uczenia maszynowego.
    • TSV: format wartości rozdzielanych tabulatorami.

    Jeśli wybierzesz format i nie podasz danych spełniających specyfikacje formatu, wystąpi błąd czasu wykonywania.

  3. Kliknij wewnątrz pola tekstowego Dane , aby rozpocząć wprowadzanie danych. Następujące formaty wymagają szczególnej uwagi:

    • CSV: Aby utworzyć wiele kolumn, wklej tekst rozdzielony przecinkami lub wpisz wiele kolumn przy użyciu przecinków między polami.

      Jeśli wybierzesz opcję HasHeader , możesz użyć pierwszego wiersza wartości jako nagłówka kolumny.

      Jeśli usuniesz zaznaczenie tej opcji, używane są nazwy kolumn (Col1, Col2 i tak dalej). Nazwy kolumn można dodać lub zmienić później przy użyciu funkcji Edytuj metadane.

    • TSV: aby utworzyć wiele kolumn, wklej tekst rozdzielony tabulatorami lub wpisz wiele kolumn przy użyciu kart między polami.

      Jeśli wybierzesz opcję HasHeader , możesz użyć pierwszego wiersza wartości jako nagłówka kolumny.

      Jeśli usuniesz zaznaczenie tej opcji, używane są nazwy kolumn (Col1, Col2 i tak dalej). Nazwy kolumn można dodać lub zmienić później przy użyciu funkcji Edytuj metadane.

    • ARFF: wklej istniejący plik formatu ARFF. Jeśli wpisać wartości bezpośrednio, pamiętaj, aby dodać opcjonalny nagłówek i wymagane pola atrybutów na początku danych.

      Na przykład następujące wiersze nagłówka i atrybutu można dodać do prostej listy. Nagłówek kolumny to SampleText. Należy pamiętać, że typ ciągu nie jest obsługiwany.

      % Title: SampleText.ARFF  
      % Source: Enter Data component  
      @ATTRIBUTE SampleText NUMERIC  
      @DATA  
      \<type first data row here>  
      
    • SVMLight: wpisz lub wklej wartości przy użyciu formatu SVMLight.

      Na przykład poniższa próbka reprezentuje kilka pierwszych wierszy zestawu danych Blood Donation w formacie SVMLight:

      # features are [Recency], [Frequency], [Monetary], [Time]  
      1 1:2 2:50 3:12500 4:98   
      1 1:0 2:13 3:3250 4:28   
      

      Po uruchomieniu składnika Enter Data Manually te wiersze są konwertowane na zestaw danych kolumn i wartości indeksu w następujący sposób:

      Col1 Col2 Kolumna 3 Kolumna 4 Etykiety
      0.00016 0.004 0.999961 0.00784 1
      0 0.004 0.999955 0.008615 1
  4. Wybierz klawisz Enter po każdym wierszu, aby rozpocząć nowy wiersz.

    Jeśli wybierzesz klawisz Enter wiele razy, aby dodać wiele pustych wierszy końcowych, puste wiersze zostaną usunięte lub przycięte.

    Jeśli tworzysz wiersze z brakującymi wartościami, zawsze możesz je filtrować później.

  5. Połączenie port wyjściowy do innych składników i uruchom potok.

    Aby wyświetlić zestaw danych, kliknij prawym przyciskiem myszy składnik i wybierz pozycję Wizualizuj.

Następne kroki

Zobacz zestaw składników dostępnych do Azure Machine Learning.