Oefening: een Azure-notebook maken en gegevens importeren

Voltooid

De eerste stap is een nieuw Azure-notebook te maken. Er zijn Azure-notebooks opgenomen in projecten, die primair als doel hebben om gerelateerde notebooks te groeperen. In deze eenheid gaat u een nieuw project maken en er vervolgens een notebook in maken.

  1. Ga in uw browser naar https://notebooks.azure.com

  2. Meld u aan met uw Microsoft-account.

  3. Klik op Mijn projecten in het menu bovenaan de pagina.

  4. Klik op de knop + Nieuw Project bovenaan de pagina Mijn projecten.

  5. Maak een nieuw project met de naam 'ML-notebooks' of iets soortgelijks. U kunt desgewenst het vakje Openbaar deselecteren, maar als u het project openbaar maakt, kunnen de notebooks erin worden gedeeld met anderen via koppelingen, sociale media of e-mail. Als u niet goed weet welke optie u moet kiezen, kunt u een project later nog eenvoudig wijzigen in openbaar of privé.

    Creating a project.

    Een project maken

  6. Klik op + Nieuw en selecteer Notebook in het menu om een notebook aan het project toe te voegen.

    Adding a notebook to the project.

    Een notebook toevoegen aan het project

  7. Geef het notebook een naam, bijvoorbeeld 'Tijdigheid van vluchtaankomsten.ipynb' en selecteer Python 3.6 als de taal. Hiermee maakt u een notebook met een Python 3.6-kernel om Python-code uit te voeren. Een van de krachten van Azure-notebooks is dat u verschillende talen kunt gebruiken door verschillende kernels te kiezen.

    Creating a notebook.

    Een notebook maken

    Als u nieuwsgierig bent, staat de bestandsextensie .ipynb voor 'IPython notebook'. Jupyter-notebooks werden oorspronkelijk IPython-notebooks (Interactive Python) genoemd en ze ondersteunden Python alleen als programmeertaal. De naam Jupyter is een combinatie van Julia Python en R, de belangrijkste programmeertalen die Jupyter ondersteunt.

  8. Klik op het notebook om het te openen voor bewerking.

    Opening the notebook.

    Het notebook openen

U kunt extra projecten en notebooks maken als u met Azure Notebooks werkt. U kunt volledig nieuwe notebooks maken of bestaande notebooks uploaden.

Jupyter-notebooks zijn zeer interactief, en omdat ze uitvoerbare code kunnen bevatten, bieden ze het perfecte platform om gegevens te bewerken en er voorspellende modellen van te maken.

  1. Voer de volgende opdracht uit in de eerste cel van het notebook:

    !curl https://topcs.blob.core.windows.net/public/FlightData.csv -o flightdata.csv
    

    Tip

    curl is een Bash-opdracht. U kunt de Bash-opdrachten uitvoeren in een Jupyter-notebook door een voorvoegsel te gebruiken met een uitroepteken. Met deze opdracht wordt een CSV-bestand uit Azure Blob Storage gedownload en opgeslagen met de naam flightdata.csv.

  2. Klik op de knop Uitvoeren om de opdracht curl uit te voeren.

    Importing a dataset.

    Een gegevensset importeren

  3. Voer in de tweede cel van het notebook de volgende Python-code in om flightdata.csv te laden, er een Pandas DataFrame van te maken en de eerste vijf rijen weer te geven.

    import pandas as pd
    
    df = pd.read_csv('flightdata.csv')
    df.head()
    
  4. Klik op de knop Uitvoeren om de code uit te voeren. Controleer of de uitvoer lijkt op de onderstaande uitvoer.

    Loading the dataset.

    De gegevensset laden

    Het DataFrame dat u hebt gemaakt, bevat informatie over de tijdigheid van aankomsten voor een grote Amerikaanse luchtvaartmaatschappij. Het bevat meer dan 11.000 rijen en 26 kolommen. (In de uitvoer staat '5 rijen' omdat de hoofdfunctie van DataFrame alleen de eerste vijf rijen retourneert.) Elke rij vertegenwoordigt één vlucht en bevat informatie zoals de oorsprong, de bestemming, de geplande vertrektijd en of de vlucht op tijd of laat is aangekomen. We gaan de gegevens later in deze module beter bekijken.

  5. Gebruik de opdracht Bestand ->Opslaan en Controlepunt om het notitieblok op te slaan.

Gebruik de horizontale schuifbalk om naar links en rechts te schuiven en alle kolommen in de gegevensset weer te geven. Hoeveel kolommen bevat de gegevensset? Kunt u op basis van de kolomnamen raden wat voor gegevens elke kolom bevat?