Latihan - Membuat Azure Notebook dan Mengimpor Data

Selesai

Urutan pertama bisnis adalah membuat buku catatan Azure baru. Buku catatan Azure terkandung dalam proyek, yang tujuan utamanya adalah untuk mengelompokkan buku catatan terkait. Pada unit ini, Anda akan membuat proyek baru lalu membuat notebook di dalamnya.

  1. Buka https://notebooks.azure.com di browser Anda

  2. Masuk dengan menggunakan akun Microsoft Anda.

  3. Klik Proyek Saya pada menu di bagian atas halaman.

  4. Klik tombol + Project Baru di bagian atas halaman "Proyek Saya".

  5. Buat proyek baru bernama "ML Notebooks" atau yang serupa. Anda dapat menghapus centang pada kotak "Publik" jika Anda mau, tetapi membuat proyek menjadi publik memungkinkan buku catatan di dalamnya dibagikan dengan orang lain melalui tautan, media sosial, atau email. Jika Anda tidak yakin mana yang harus dipilih, Anda dapat dengan mudah mengubah proyek menjadi publik atau privat nanti.

    Creating a project.

    Membuat proyek

  6. Klik + Baru dan pilih Buku Catatan dari menu untuk menambahkan buku catatan ke proyek.

    Adding a notebook to the project.

    Menambahkan notebook ke proyek

  7. Beri nama buku catatan seperti "On-Time Flight Arrivals.ipynb," dan pilih Python 3.6 untuk bahasa. Ini akan membuat buku catatan dengan kernel Python 3.6 untuk mengeksekusi kode Python. Salah satu kekuatan buku catatan Azure adalah Anda dapat menggunakan bahasa yang berbeda dengan memilih kernel yang berbeda.

    Creating a notebook.

    Pembuatan buku catatan

    Jika Anda penasaran, ekstensi nama file .ipynb adalah singkatan dari "IPython notebook." Notebooks Jupyter awalnya dikenal sebagai notebook IPython (Interactive Python), dan notebook IPython tersebut hanya mendukung Python sebagai bahasa pemrograman. Nama Jupyter adalah kombinasi dari Julia, Python, dan R — bahasa pemrograman inti yang didukung Jupyter.

  8. Klik buku catatan untuk membukanya untuk diedit.

    Opening the notebook.

    Membuka notebook

Anda bisa membuat proyek dan buku catatan tambahan saat Anda bekerja dengan Azure Notebooks. Anda bisa membuat buku catatan dari awal, atau Anda bisa mengunggah buku catatan yang sudah ada.

Buku catatan Jupyter sangat interaktif, dan karena dapat menyertakan kode yang dapat dieksekusi, notebook ini menyediakan platform yang sempurna untuk memanipulasi data dan membangun model prediktif darinya.

  1. Masukkan perintah berikut ini ke dalam sel pertama buku catatan:

    !curl https://topcs.blob.core.windows.net/public/FlightData.csv -o flightdata.csv
    

    Tip

    curl adalah perintah Bash. Anda dapat menjalankan perintah Bash di buku catatan Jupyter dengan mengawalinya dengan tanda seru. Perintah ini mengunduh file CSV dari penyimpanan blob Azure dan menyimpannya menggunakan nama flightdata.csv.

  2. Klik tombol Jalankan untuk menjalankan perintah curl.

    Importing a dataset.

    Mengimpor himpunan data

  3. Di sel kedua buku catatan, masukkan kode Python berikut untuk memuat flightdata.csv, buat Pandas DataFrame darinya, dan tampilkan lima baris pertama.

    import pandas as pd
    
    df = pd.read_csv('flightdata.csv')
    df.head()
    
  4. Klik tombol Jalankan untuk menjalankan kode. Konfirmasikan bahwa output menyerupai output di bawah ini.

    Loading the dataset.

    Memuat himpunan data

    DataFrame yang Anda buat berisi informasi kedatangan tepat waktu untuk maskapai besar AS. Ini memiliki lebih dari 11.000 baris dan 26 kolom. (Output mengatakan "5 baris" karena fungsi kepala DataFrame hanya mengembalikan lima baris pertama.) Setiap baris mewakili satu penerbangan dan berisi informasi seperti asal, tujuan, waktu keberangkatan terjadwal, dan apakah penerbangan tiba tepat waktu atau terlambat. Kita akan melihat data lebih dekat nanti dalam modul ini.

  5. Gunakan perintah File ->Simpan dan Titik Pemeriksaan untuk menyimpan buku catatan.

Gunakan bilah gulir horizontal untuk menggulir ke kiri dan kanan dan menampilkan semua kolom dalam himpunan data. Berapa banyak kolom yang dimuat himpunan data? Bisakah Anda menebak apa yang diwakili setiap kolom dari nama kolom?