Latihan - Unggah Data dan Buat Scatterplot

Selesai

Notebooks Jupyter terdiri dari sel. Setiap sel diberi salah satu dari tiga jenis:

  • Markdown untuk memasukkan teks dalam format markdown
  • Kode untuk memasukkan kode yang berjalan secara interaktif
  • NBConvert mentah untuk memasukkan data sebaris

Kode yang dimasukkan ke dalam sel kode dijalankan oleh kernel, yang menyediakan lingkungan terisolasi agar notebook dapat dijalankan. Kernel IPython populer mendukung kode yang ditulis dalam Python, tetapi lusinan kernel lain tersedia untuk mendukung bahasa lain. Azure Notebooks mendukung Python, R, dan F# di luar kotak. Mereka juga mendukung penginstalan banyak paket dan perpustakaan yang umum digunakan dalam penelitian.

Editor notebook memperlihatkan sel kosong saat ini. Dalam latihan ini, Anda akan menambahkan konten ke sel tersebut dan menambahkan sel lain untuk mengimpor paket Python seperti NumPy, memuat sepasang file data NASA yang berisi data iklim, dan membuat plot sebar dari data.

  1. Di sel pertama, atur jenis sel ke Markdown dan masukkan "Analisis Perubahan Iklim Azure Notebook" ke dalam sel itu sendiri:

    Defining a markdown cell.

    Menentukan sel markdown

  2. Klik tombol + di toolbar untuk menambahkan sel baru. Pastikan jenis sel adalah Kode, lalu masukkan kode Python berikut ke dalam sel:

    import matplotlib.pyplot as plt
    import numpy as np
    from sklearn.linear_model import LinearRegression
    import seaborn as sns; sns.set()
    

    Adding a code cell.

    Menambahkan sel kode

  3. Sekarang klik tombol Jalankan untuk menjalankan sel kode dan impor paket yang ditentukan dalam pernyataan import. Abaikan peringatan apa pun yang ditampilkan saat lingkungan disiapkan untuk pertama kalinya.

    Anda dapat menghapus peringatan dengan memilih sel kode dan menjalankannya lagi.

    Running a code cell.

    Menjalankan sel kode

  4. Klik File di menu di bagian atas halaman, dan pilih Unggah dari menu drop-down. Kemudian unggah file bernama 5-year-mean-1951-1980.csv dan 5-year-mean-1882-2014.csv.

    Uploading data to the notebook.

    Mengunggah data ke notebook

  5. Pilih /proyek sebagai Folder Tujuan Anda untuk memastikan file Anda tetap ada. Klik Mulai Upload untuk mengunggah file, dan OK setelah berhasil diunggah.

    Selecting destination folder for data.

    Memilih folder tujuan untuk data

  6. Tempatkan kursor di sel kosong di bagian bawah buku catatan. Masukkan "Impor data" sebagai teks dan ubah jenis sel menjadi Markdown.

  7. Tambahkan sel Kode dan tempelkan kode berikut.

    yearsBase, meanBase = np.loadtxt('5-year-mean-1951-1980.csv', delimiter=',', usecols=(0, 1), unpack=True)
    years, mean = np.loadtxt('5-year-mean-1882-2014.csv', delimiter=',', usecols=(0, 1), unpack=True)
    
  8. Klik tombol Jalankan untuk menjalankan sel dan gunakan fungsi NumPy loadtxt untuk memuat data yang Anda unggah. Data sekarang berada dalam memori dan dapat digunakan oleh aplikasi.

    Loading the data.

    Memuat data

  9. Tempatkan kursor di sel kosong di bagian bawah buku catatan. Ubah jenis sel menjadi Markdown dan masukkan "Buat plot sebar" sebagai teks.

  10. Tambahkan sel Kode dan tempelkan kode berikut, yang menggunakan Matplotlib untuk membuat plot sebar.

    plt.scatter(yearsBase, meanBase)
    plt.title('scatter plot of mean temp difference vs year')
    plt.xlabel('years', fontsize=12)
    plt.ylabel('mean temp difference', fontsize=12)
    plt.show()
    
  11. Klik Jalankan untuk menjalankan sel dan membuat plot sebar.

    Scatter plot produced by Matplotlib.

    Plot sebar yang diproduksi oleh Matplotlib

Himpunan data yang Anda muat menggunakan rata-rata 30 tahun antara 1951 dan 1980 untuk menghitung suhu dasar untuk periode tersebut, lalu menggunakan suhu rata-rata 5 tahun untuk menghitung selisih antara rata-rata 5 tahun dan rata-rata 30 tahun untuk setiap tahunnya. Plot sebar menunjukkan perbedaan suhu tahunan.