Konwertowanie na zestaw danych

W tym artykule opisano sposób użycia składnika Konwertuj na zestaw danych w projektancie usługi Azure Machine Learning w celu przekonwertowania dowolnych danych potoku na format wewnętrzny projektanta.

Konwersja nie jest wymagana w większości przypadków. Usługa Azure Machine Learning niejawnie konwertuje dane na natywny format zestawu danych, gdy każda operacja jest wykonywana na danych.

Zalecamy zapisanie danych w formacie zestawu danych, jeśli przeprowadzono jakąś normalizację lub czyszczenie zestawu danych i chcesz upewnić się, że zmiany są używane w innych potokach.

Uwaga

Przekonwertuj na zestaw danych zmienia tylko format danych. Nie zapisuje nowej kopii danych w obszarze roboczym. Aby zapisać zestaw danych, kliknij dwukrotnie port wyjściowy, wybierz pozycję Zapisz jako zestaw danych i wprowadź nową nazwę.

Jak używać funkcji Konwertuj na zestaw danych

Zalecamy użycie składnika Edytowanie metadanych w celu przygotowania zestawu danych przed użyciem funkcji Konwertuj na zestaw danych. Możesz dodawać lub zmieniać nazwy kolumn, dostosowywać typy danych i wprowadzać inne zmiany zgodnie z potrzebami.

  1. Dodaj składnik Konwertuj na zestaw danych do potoku. Ten składnik można znaleźć w kategorii Przekształcanie danych w projektancie.

  2. Połącz go z dowolnym składnikiem, który generuje zestaw danych.

    Jeśli dane są tabelaryczne, możesz przekonwertować je na zestaw danych. Obejmuje to dane ładowane za pośrednictwem importu danych, danych utworzonych za pomocą funkcji Wprowadź dane ręcznie lub zestawów danych przekształconych za pomocą funkcji Zastosuj przekształcenie.

  3. Na liście rozwijanej Akcja wskaż, czy chcesz wyczyścić dane przed zapisaniem zestawu danych:

    • Brak: użyj danych w następujący sposób.

    • SetMissingValue: ustaw określoną wartość na brakującą wartość w zestawie danych. Domyślny symbol zastępczy to znak zapytania (?), ale możesz użyć opcji Niestandardowe brakującej wartości , aby wprowadzić inną wartość. Jeśli na przykład wprowadzisz wartość Taksówek jako brakującą wartość niestandardową, wszystkie wystąpienia taksówki w zestawie danych zostaną zmienione na brakującą wartość.

    • ReplaceValues: użyj tej opcji, aby określić pojedynczą dokładną wartość do zastąpienia dowolną inną dokładną wartością. Brakujące wartości lub wartości niestandardowe można zastąpić, ustawiając metodę Replace :

      • Brak: wybierz tę opcję, aby zastąpić brakujące wartości w wejściowym zestawie danych. W polu Nowa wartość wprowadź wartość, która zastąpi brakujące wartości.
      • Niestandardowe: wybierz tę opcję, aby zastąpić wartości niestandardowe w wejściowym zestawie danych. W polu Wartość niestandardowa wprowadź wartość, którą chcesz znaleźć. Jeśli na przykład dane zawierają ciąg obs używany jako symbol zastępczy brakujących wartości, wprowadź wartość obs. W polu Nowa wartość wprowadź nową wartość, która zastąpi oryginalny ciąg ciąg.

    Pamiętaj, że operacja ReplaceValues ma zastosowanie tylko do dokładnych dopasowań. Na przykład te ciągi nie będą miały wpływu na: obs., obsolete.

  4. Prześlij potok.

Wyniki

  • Aby zapisać wynikowy zestaw danych z nową nazwą, wybierz ikonę Zarejestruj zestaw danych na karcie Dane wyjściowe w prawym panelu składnika.

Uwagi techniczne

  • Każdy składnik, który przyjmuje zestaw danych jako dane wejściowe, może również pobierać dane w pliku CSV lub pliku TSV. Przed uruchomieniem jakiegokolwiek kodu składnika dane wejściowe są wstępnie przetworzone. Przetwarzanie wstępne jest równoważne uruchamianiu składnika Konwertuj na zestaw danych w danych wejściowych.

  • Nie można przekonwertować z formatu SVMLight na zestaw danych.

  • Podczas określania niestandardowej operacji zamieniania operacja wyszukiwania i zamieniania ma zastosowanie do pełnych wartości. Częściowe dopasowania są niedozwolone. Można na przykład zastąpić wartość 3 znakiem -1 lub 33, ale nie można zastąpić wartości 3 w dwucyfrowej liczbie, takiej jak 35.

  • W przypadku operacji zamiany niestandardowej zamiana w trybie dyskretnym zakończy się niepowodzeniem, jeśli zostanie użyty jako zamiana dowolnego znaku, który nie jest zgodny z bieżącym typem danych kolumny.

Następne kroki

Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.