Konvertálás TSV-ként

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Az adatbevitelt tabulátorral tagolt formátumra konvertálja

Kategória: Adatformátum-átalakítások

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használható a Convert to TSV (TSV-átalakítás) modul a Machine Learning Studio (klasszikus) modulban az összes Machine Learning Studio(klasszikus) modul által használt belső formátumból bármely adatkészlet tabulátott formátumú fájlká konvertálására.

A tabulátott értékekkel (TSV) elválasztott fájlok számos külső eszközzel kompatibilisek, beleértve a következőket:

  • R és Python

  • Excel és PowerPivot

  • Minden relációs adatbázis

Ha például a kísérlet egy köztes adatkészletet tartalmaz, amely egy másik eszközben való újrahasználatra mentve, vagy kódból szeretne hívást hívni, konvertálja TSV formátumra, majd a jobb gombbal a konvertált adatkészletre kattintva lekérte az adatkészlet eléréséhez szükséges Python-kódot.

A Convert to TSV használata

Ha tabulátorral tagolt formátumú adatkészletet kell letöltenie, használja a Konvertálás TSV-ré modult.

  1. Adja hozzá a Convert to TSV (Konvertálás TSV-ként ) gombra a kísérlethez. Ezt a modult a (klasszikus) Machine Learning Data Format Conversions (Adatformátum-konverziók) kategóriában találja.

  2. Csatlakozás modult egy másik adatkészlethez, vagy egy táblázatos adatkészletet kiküldő modulhoz.

  3. Futtassa a kísérletet, vagy kattintson a jobb gombbal a Convert to TSV (Konvertálás TSV-modulra ) modulra, és válassza a Run selected (Futtatás kiválasztva) lehetőséget.

Results (Eredmények)

Az átalakítás befejezése után megnyithatja az adatkészletet, meghívhatja R- vagy Python-kódból, használhatja egy Jupyter notebookban, vagy mentheti egy helyi fájlba.

Ha le szeretné tölteni az adatkészletet, kattintson duplán a modul kimenetére, és jelezze, hogy szeretné-e megnyitni vagy menteni a datsetet.

  • Ha a Megnyitás lehetőséget választja, az adatkészlet a számítógép által alapértelmezés szerint a megnyitásához használt eszközzel töltődik be. TSV-fájlok. Ez általában nem Microsoft Excel.

  • Ha az Adatkészlet letöltése lehetőséget választja, a rendszer alapértelmezés szerint menti a fájlt a modul nevével és a munkaterület azonosítóját küldő GUID azonosítóval. A Letöltés közben azonban kiválaszthatja a Mentés másként lehetőséget, és módosíthatja a fájl nevét vagy helyét.

Példák

Bár nincsenek erre a formátumra jellemző példák, a következő mintakísérletek vizsgálatával láthat példákat a formátumkonverzió Azure AI Gallery:

  • Bináris besorolási minta keresztellenőrzése: Exportálja a keresztellenőrzés eredményeit vesszővel elválasztott értékformátumba (CSV), hogy több modell eredményeit össze tudja hasonlítani egy olyan eszközzel, mint a Excel.

  • Színalapú képtömörítés kvantálás: Exportálja az elemzés egyes részeihez használt adatkészleteket CSV-fájlokba, így könnyen futtathat hasonló modelleket bármely, a CSV formátumot támogató eszközben.

Technikai megjegyzések

Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.

TSV formátumkövetelmények

A tabulátumokkal elválasztott értékek (TSV) szöveges formátumok, amelyek táblázatos struktúrában tárolják az adatokat. Nagyon hasonlít a CSV formátumhoz, de az elválasztó nem vessző, hanem tabulátor.

A TSV formátum hasznos alternatíva a CSV formátumnak, ha az adatok vesszőket tartalmaznak. A vesszők nagyon gyakoriak a szöveges adatokban, és európai számformátumokban használatosak.

A tabulátorral tagolt formátum egyik problémája, hogy a tabulátorokat gyakran üres területnek tekintik a strukturálatlan szövegekben. A TSV-hez szükséges IANA-szabvány azonban támogatja a TSV-fájlok tiszta és pontos elemzési eljárását azáltal, hogy nem támogatja a mezőkben található lapfüleket.

Vegye figyelembe a TSV-fájlokra vonatkozó alábbi követelményeket a Machine Learning Studióban (klasszikus):

  • A Convert to TSV (Konvertálás TSV-ké ) modul egyetlen fejlécsor kimenetét támogatja, ha az adatkészlet oszlopneveket tartalmaz.

  • A TSV-szolgáltató csak az UTF-8 karakterkódolást támogatja.

  • A TSV-fájlok olvasásakor vagy a TSV-fájlokba való íráskor a teljesítmény lassabb lehet, mint más formátumokkal (például CSV-vel).

Várt bemenetek

Név Típus Description
Adathalmaz Adattábla Bemeneti adatkészlet

Kimenet

Név Típus Description
Eredményadatkészlet GenericTsv Kimeneti adatkészlet

Lásd még

Adatformátum-átalakítások
A-Z modullista