TextLoaderSaverCatalog.LoadFromTextFile Méthode

Définition

Surcharges

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

Charger un IDataView fichier texte à l’aide de TextLoader. Notez que IDataView« sont paresseux, donc aucun chargement réel ne se produit ici, juste la validation du schéma.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

Charger un IDataView fichier texte à l’aide de TextLoader. Notez que IDataView« sont paresseux, donc aucun chargement réel ne se produit ici, juste la validation du schéma.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

Charger un IDataView fichier texte à l’aide de TextLoader. Notez que IDataView« sont paresseux, donc aucun chargement réel ne se produit ici, juste la validation du schéma.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

Charger un IDataView fichier texte à l’aide de TextLoader. Notez que IDataView« sont paresseux, donc aucun chargement réel ne se produit ici, juste la validation du schéma.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

Charger un IDataView fichier texte à l’aide de TextLoader. Notez que IDataView« sont paresseux, donc aucun chargement réel ne se produit ici, juste la validation du schéma.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options = default);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, Optional options As TextLoader.Options = Nothing) As IDataView

Paramètres

path
String

Spécifie un fichier ou un chemin d’accès des fichiers à partir desquels charger.

options
TextLoader.Options

Définit les paramètres de l’opération de chargement.

Retours

Exemples

using System;
using System.Collections.Generic;
using System.IO;
using Microsoft.ML;

namespace Samples.Dynamic
{
    public static class SaveAndLoadFromText
    {
        public static void Example()
        {
            // Create a new context for ML.NET operations. It can be used for
            // exception tracking and logging, as a catalog of available operations
            // and as the source of randomness. Setting the seed to a fixed number
            // in this example to make outputs deterministic.
            var mlContext = new MLContext(seed: 0);

            // Create a list of training data points.
            var dataPoints = new List<DataPoint>()
            {
                new DataPoint(){ Label = 0, Features = 4},
                new DataPoint(){ Label = 0, Features = 5},
                new DataPoint(){ Label = 0, Features = 6},
                new DataPoint(){ Label = 1, Features = 8},
                new DataPoint(){ Label = 1, Features = 9},
            };

            // Convert the list of data points to an IDataView object, which is
            // consumable by ML.NET API.
            IDataView data = mlContext.Data.LoadFromEnumerable(dataPoints);

            // Create a FileStream object and write the IDataView to it as a text
            // file.
            using (FileStream stream = new FileStream("data.tsv", FileMode.Create))
                mlContext.Data.SaveAsText(data, stream);

            // Create an IDataView object by loading the text file.
            IDataView loadedData = mlContext.Data.LoadFromTextFile("data.tsv");

            // Inspect the data that is loaded from the previously saved text file.
            var loadedDataEnumerable = mlContext.Data
                .CreateEnumerable<DataPoint>(loadedData, reuseRowObject: false);

            foreach (DataPoint row in loadedDataEnumerable)
                Console.WriteLine($"{row.Label}, {row.Features}");

            // Preview of the loaded data.
            // 0, 4
            // 0, 5
            // 0, 6
            // 1, 8
            // 1, 9
        }

        // Example with label and feature values. A data set is a collection of such
        // examples.
        private class DataPoint
        {
            public float Label { get; set; }

            public float Features { get; set; }
        }
    }
}

S’applique à

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

Charger un IDataView fichier texte à l’aide de TextLoader. Notez que IDataView« sont paresseux, donc aucun chargement réel ne se produit ici, juste la validation du schéma.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Column[] columns, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Column[] * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, columns As TextLoader.Column(), Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Paramètres

path
String

Chemin d’accès au ou aux fichiers.

columns
TextLoader.Column[]

Colonnes du schéma.

separatorChar
Char

Caractère utilisé comme séparateur entre les points de données d’une ligne. Par défaut, le caractère de tabulation est utilisé comme séparateur.

hasHeader
Boolean

Indique si le fichier a un en-tête. Quand true, le chargeur ignore la première ligne quand Load(IMultiStreamSource) il est appelé.

allowQuoting
Boolean

Indique si l’entrée peut inclure des valeurs entre guillemets doubles. Ce paramètre est utilisé pour distinguer les caractères de séparation d’une valeur d’entrée des séparateurs réels. Lorsque true, les séparateurs entre guillemets doubles sont traités dans le cadre de la valeur d’entrée. Quand false, tous les séparateurs, même les guillemets de whitin, sont traités comme délimitant une nouvelle colonne. Il est également utilisé pour distinguer les valeurs vides des valeurs manquantes. Lorsque true, la valeur manquante est indiquée par des séparateurs consécutifs et des valeurs vides par « ». Lorsque false, les valeurs vides sont indiquées par des séparateurs consécutifs et des valeurs manquantes par la valeur manquante par défaut pour chaque type documenté dans DataKind.

trimWhitespace
Boolean

Supprimez les espaces blancs de fin des lignes.

allowSparse
Boolean

Indique si l’entrée peut inclure des représentations éparses. Par exemple, une ligne contenant « 5 2:6 4:3 » signifie qu’il y a 5 colonnes et que les seules colonnes non nulles sont les colonnes 2 et 4, qui ont respectivement les valeurs 6 et 3. Les index de colonne sont de base zéro, de sorte que les colonnes 2 et 4 représentent les 3e et 5e colonnes. Une colonne peut également avoir des valeurs denses suivies de valeurs éparses représentées de cette manière. Par exemple, une ligne contenant « 1 2 5 2:6 4:3 » représente deux colonnes denses avec les valeurs 1 et 2, suivie de 5 colonnes partiellement représentées avec les valeurs 0, 0, 6, 0 et 3. Les index des colonnes éparses commencent par 0, même si 0 représente la troisième colonne.

Retours

Vue de données.

S’applique à

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

Charger un IDataView fichier texte à l’aide de TextLoader. Notez que IDataView« sont paresseux, donc aucun chargement réel ne se produit ici, juste la validation du schéma.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, options As TextLoader.Options) As IDataView

Paramètres de type

TInput

Paramètres

path
String

Spécifie un fichier ou un chemin d’accès des fichiers à partir desquels charger.

options
TextLoader.Options

Définit les paramètres de l’opération de chargement. Il n’est pas nécessaire de spécifier un champ Colonnes, car les colonnes seront déduites par cette méthode.

Retours

Vue de données.

S’applique à

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

Charger un IDataView fichier texte à l’aide de TextLoader. Notez que IDataView« sont paresseux, donc aucun chargement réel ne se produit ici, juste la validation du schéma.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Paramètres de type

TInput

Paramètres

path
String

Chemin d’accès au ou aux fichiers.

separatorChar
Char

Caractère de séparateur de colonne. La valeur par défaut est '\t'

hasHeader
Boolean

Indique si le fichier a un en-tête. Quand true, le chargeur ignore la première ligne quand Load(IMultiStreamSource) il est appelé.

allowQuoting
Boolean

Indique si l’entrée peut inclure des valeurs entre guillemets doubles. Ce paramètre est utilisé pour distinguer les caractères de séparation d’une valeur d’entrée des séparateurs réels. Lorsque true, les séparateurs entre guillemets doubles sont traités dans le cadre de la valeur d’entrée. Quand false, tous les séparateurs, même les guillemets de whitin, sont traités comme délimitant une nouvelle colonne. Il est également utilisé pour distinguer les valeurs vides des valeurs manquantes. Lorsque true, la valeur manquante est indiquée par des séparateurs consécutifs et des valeurs vides par « ». Lorsque false, les valeurs vides sont indiquées par des séparateurs consécutifs et des valeurs manquantes par la valeur manquante par défaut pour chaque type documenté dans DataKind.

trimWhitespace
Boolean

Supprimez les espaces blancs de fin des lignes.

allowSparse
Boolean

Indique si l’entrée peut inclure des représentations éparses. Par exemple, une ligne contenant « 5 2:6 4:3 » signifie qu’il y a 5 colonnes et que les seules colonnes non nulles sont les colonnes 2 et 4, qui ont respectivement les valeurs 6 et 3. Les index de colonne sont de base zéro, de sorte que les colonnes 2 et 4 représentent les 3e et 5e colonnes. Une colonne peut également avoir des valeurs denses suivies de valeurs éparses représentées de cette manière. Par exemple, une ligne contenant « 1 2 5 2:6 4:3 » représente deux colonnes denses avec les valeurs 1 et 2, suivie de 5 colonnes partiellement représentées avec les valeurs 0, 0, 6, 0 et 3. Les index des colonnes éparses commencent par 0, même si 0 représente la troisième colonne.

Retours

Vue de données.

S’applique à