Wprowadź składnik Dane ręcznie

W tym artykule opisano składnik w projektancie usługi Azure Machine Learning.

Użyj składnika Enter Data Manually (Wprowadź dane ręcznie ), aby utworzyć mały zestaw danych, wpisując wartości. Zestaw danych może zawierać wiele kolumn.

Ten składnik może być przydatny w scenariuszach, takich jak:

  • Generowanie małego zestawu wartości na potrzeby testowania.
  • Tworzenie krótkiej listy etykiet.
  • Wpisywanie listy nazw kolumn do wstawienia w zestawie danych.

Utwórz zestaw danych

  1. Dodaj składnik Wprowadź dane ręcznie do potoku. Ten składnik można znaleźć w kategorii Dane wejściowe i wyjściowe w usłudze Azure Machine Learning.

  2. W obszarze DataFormat wybierz jedną z następujących opcji. Te opcje określają sposób analizowania danych, które należy podać. Wymagania dotyczące każdego formatu różnią się znacznie, dlatego zapoznaj się z powiązanymi tematami.

    • ARFF: format pliku relacji atrybutów używany przez Weka.
    • CSV: format wartości rozdzielanych przecinkami. Aby uzyskać więcej informacji, zobacz Konwertowanie na plik CSV.
    • SVMLight: format używany przez Vowpal Wabbit i inne struktury uczenia maszynowego.
    • TSV: format wartości rozdzielanych tabulatorami.

    Jeśli wybierzesz format i nie podasz danych spełniających specyfikacje formatu, wystąpi błąd środowiska uruchomieniowego.

  3. Kliknij wewnątrz pola tekstowego Dane, aby rozpocząć wprowadzanie danych. Następujące formaty wymagają szczególnej uwagi:

    • CSV: aby utworzyć wiele kolumn, wklej tekst rozdzielony przecinkami lub wpisz wiele kolumn przy użyciu przecinków między polami.

      Jeśli wybierzesz opcję HasHeader , możesz użyć pierwszego wiersza wartości jako nagłówka kolumny.

      Jeśli usuniesz zaznaczenie tej opcji, będą używane nazwy kolumn (Col1, Col2 i tak dalej). Nazwy kolumn można później dodawać lub zmieniać za pomocą funkcji Edytuj metadane.

    • TSV: Aby utworzyć wiele kolumn, wklej tekst rozdzielony tabulatorami lub wpisz wiele kolumn przy użyciu kart między polami.

      Jeśli wybierzesz opcję HasHeader , możesz użyć pierwszego wiersza wartości jako nagłówka kolumny.

      Jeśli usuniesz zaznaczenie tej opcji, będą używane nazwy kolumn (Col1, Col2 i tak dalej). Nazwy kolumn można później dodawać lub zmieniać za pomocą funkcji Edytuj metadane.

    • ARFF: wklej istniejący plik formatu ARFF. Jeśli bezpośrednio wpisujesz wartości, pamiętaj, aby dodać opcjonalny nagłówek i wymagane pola atrybutów na początku danych.

      Na przykład następujące wiersze nagłówka i atrybutu można dodać do prostej listy. Nagłówek kolumny to SampleText. Pamiętaj, że typ ciągu nie jest obsługiwany.

      % Title: SampleText.ARFF  
      % Source: Enter Data component  
      @ATTRIBUTE SampleText NUMERIC  
      @DATA  
      \<type first data row here>  
      
    • SVMLight: wpisz lub wklej wartości przy użyciu formatu SVMLight.

      Na przykład poniższa próbka reprezentuje kilka pierwszych wierszy zestawu danych Krwiodawstwa w formacie SVMLight:

      # features are [Recency], [Frequency], [Monetary], [Time]  
      1 1:2 2:50 3:12500 4:98   
      1 1:0 2:13 3:3250 4:28   
      

      Po uruchomieniu składnika Wprowadź dane ręcznie te wiersze są konwertowane na zestaw danych kolumn i wartości indeksu w następujący sposób:

      Col1 Col2 Kolumna 3 Kolumna 4 Etykiety
      0.00016 0.004 0.999961 0.00784 1
      0 0.004 0.999955 0.008615 1
  4. Wybierz klawisz Enter po każdym wierszu, aby rozpocząć nowy wiersz.

    Jeśli wybierzesz klawisz Enter wiele razy, aby dodać wiele pustych wierszy końcowych, puste wiersze zostaną usunięte lub przycięte.

    Jeśli tworzysz wiersze z brakującymi wartościami, zawsze możesz je odfiltrować później.

  5. Połącz port wyjściowy z innymi składnikami i uruchom potok.

    Aby wyświetlić zestaw danych, kliknij prawym przyciskiem myszy składnik i wybierz polecenie Visualize (Wizualizacja).

Następne kroki

Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.