Konwertowanie na ARFF

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Konwertuje dane wejściowe na format pliku relacji atrybutu używany przez zestaw narzędzi Weka

Kategoria: Konwersje formatu danych

Uwaga

Dotyczy: tylko Machine Learning Studio (klasyczne)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano sposób używania modułu Convert to ARFF w programie Machine Learning Studio (wersja klasyczna) do konwertowania zestawów danych i tworzenia wyników w formacie pliku attribute-relation używanym przez zestaw narzędzi Weka. Ten format jest znany jako ARFF.

Specyfikacja danych ARFF dla firmy Weka obsługuje wiele zadań uczenia maszynowego, w tym przetwarzanie wstępne danych, klasyfikację i wybór funkcji. W tym formacie dane są zorganizowane wedługentytów i ich atrybutów i są zawarte w jednym pliku tekstowym. Szczegóły formatu pliku Weka można znaleźć w sekcji Uwagi techniczne.

Ogólnie rzecz biorąc, konwersja na format pliku Weka jest wymagana tylko wtedy, gdy chcesz używać zarówno programów Machine Learning, jak i Weka i zamierzasz przenosić dane szkoleniowe między nimi.

Aby uzyskać więcej informacji na temat zestawu narzędzi Weka, zobacz artykuł w Wikipedii: Weka (uczenie maszynowe)

Ostrzeżenie

Nie można zastąpić istniejącego pliku ARFF w usłudze Azure Storage.

Jak używać konwersji na ARFF

  1. Dodaj moduł Convert to ARFF (Konwertuj na ARFF) do eksperymentu. Ten moduł można znaleźć w kategorii Konwersje formatu danych w programie Machine Learning Studio (wersja klasyczna).

  2. Połączenie do dowolnego modułu, który wyprowadza zestaw danych.

  3. Uruchom eksperyment lub kliknij moduł Convert to ARFF (Konwertuj na ARFF), a następnie kliknij pozycję Run selected (Uruchom wybraną).

Wyniki

  • Aby utworzyć kopię danych w folderze lokalnym, kliknij dwukrotnie dane wyjściowe konwertuj na ARFF, a następnie wybierz opcję Pobierz.

    Jeśli nie określisz folderu, zostanie zastosowana domyślna nazwa pliku, a plik zostanie zapisany w lokalnej bibliotece Pobrane .

Uwaga

Ten moduł nie obsługuje eksportowania do kodu w języku Python lub R.

Przykłady

Nie ma żadnych przykładów specyficznych dla tego formatu w Azure AI Gallery. Jednak te eksperymenty pokazują inne typy konwersji formatu:

  • Kompresja obrazów oparta na kolorach: eksportuje zestawy danych używane dla każdej części analizy do plików w celu odtwarzania i używania na innych platformach analitycznych.

  • Krzyżowe sprawdzanie poprawności dla przykładu klasyfikacji binarnej: eksportuje wyniki krzyżowej weryfikacji do plików, dzięki czemu wyniki dla wielu modeli można porównać za pomocą narzędzia, takiego jak Excel.

Uwagi techniczne

Ta sekcja zawiera szczegóły implementacji, porady i odpowiedzi na często zadawane pytania.

Przykład formatu ARFF

Ta sekcja zawiera przykładowy wygląd typowego zestawu danych po przekonwertowaniu na arff.

Zazwyczaj plik danych ARFF składa się z dwóch sekcji: nagłówka definiującego źródło danych i schemat oraz sekcji danych, która zawiera rzeczywiste jednostki i ich atrybuty.

Nagłówek ARFF

Nagłówek pliku ARFF definiuje listę atrybutów (w kolumnach) i ich typów danych. Nagłówek może również zawierać wiele wierszy komentarzy opisujących źródło danych lub inne uwagi.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

Porada

Jeśli zestaw danych, który konwertujesz, nie ma nazw kolumn, użyj modułu Edit Metadata (Edytowanie metadanych), aby dodać nazwy kolumn przed użyciem konwersji na ARFF.

Dane ARFF

Sekcja danych składa się z wartości rozdzielanych przecinkami i wygląda bardzo podobnie do pliku CSV bez nagłówków kolumn.

@DATA 5.1,3.5,1.4,0.2,0

Aby uzyskać dodatkowe informacje na temat tego formatu pliku, zobacz stronę Weka Wiki: ARFF (wersja dewelopera).

Bieżąca wersja ARFF

Machine Learning Studio (wersja klasyczna) zapisuje pliki ARFF przy użyciu formatu ARFF 3.0.

Oczekiwane dane wejściowe

Nazwa Typ Opis
Zestaw danych Tabela danych Wejściowy zestaw danych

Dane wyjściowe

Nazwa Typ Opis
Zestaw danych wyników Arff Wyjściowy zestaw danych

Zobacz też

Konwersje formatu danych
Lista modułów A–Z