Latihan - Unggah Data dan Buat Scatterplot
Notebooks Jupyter terdiri dari sel. Setiap sel diberi salah satu dari tiga jenis:
- Markdown untuk memasukkan teks dalam format markdown
- Kode untuk memasukkan kode yang berjalan secara interaktif
- NBConvert mentah untuk memasukkan data sebaris
Kode yang dimasukkan ke dalam sel kode dijalankan oleh kernel, yang menyediakan lingkungan terisolasi agar notebook dapat dijalankan. Kernel IPython populer mendukung kode yang ditulis dalam Python, tetapi lusinan kernel lain tersedia untuk mendukung bahasa lain. Azure Notebooks mendukung Python, R, dan F# di luar kotak. Mereka juga mendukung penginstalan banyak paket dan perpustakaan yang umum digunakan dalam penelitian.
Editor notebook memperlihatkan sel kosong saat ini. Dalam latihan ini, Anda akan menambahkan konten ke sel tersebut dan menambahkan sel lain untuk mengimpor paket Python seperti NumPy, memuat sepasang file data NASA yang berisi data iklim, dan membuat plot sebar dari data.
Di sel pertama, atur jenis sel ke Markdown dan masukkan "Analisis Perubahan Iklim Azure Notebook" ke dalam sel itu sendiri:
Menentukan sel markdown
Klik tombol + di toolbar untuk menambahkan sel baru. Pastikan jenis sel adalah Kode, lalu masukkan kode Python berikut ke dalam sel:
import matplotlib.pyplot as plt import numpy as np from sklearn.linear_model import LinearRegression import seaborn as sns; sns.set()
Menambahkan sel kode
Sekarang klik tombol Jalankan untuk menjalankan sel kode dan impor paket yang ditentukan dalam pernyataan
import
. Abaikan peringatan apa pun yang ditampilkan saat lingkungan disiapkan untuk pertama kalinya.Anda dapat menghapus peringatan dengan memilih sel kode dan menjalankannya lagi.
Menjalankan sel kode
Klik File di menu di bagian atas halaman, dan pilih Unggah dari menu drop-down. Kemudian unggah file bernama 5-year-mean-1951-1980.csv dan 5-year-mean-1882-2014.csv.
Mengunggah data ke notebook
Pilih /proyek sebagai Folder Tujuan Anda untuk memastikan file Anda tetap ada. Klik Mulai Upload untuk mengunggah file, dan OK setelah berhasil diunggah.
Memilih folder tujuan untuk data
Tempatkan kursor di sel kosong di bagian bawah buku catatan. Masukkan "Impor data" sebagai teks dan ubah jenis sel menjadi Markdown.
Tambahkan sel Kode dan tempelkan kode berikut.
yearsBase, meanBase = np.loadtxt('5-year-mean-1951-1980.csv', delimiter=',', usecols=(0, 1), unpack=True) years, mean = np.loadtxt('5-year-mean-1882-2014.csv', delimiter=',', usecols=(0, 1), unpack=True)
Klik tombol Jalankan untuk menjalankan sel dan gunakan fungsi NumPy
loadtxt
untuk memuat data yang Anda unggah. Data sekarang berada dalam memori dan dapat digunakan oleh aplikasi.Memuat data
Tempatkan kursor di sel kosong di bagian bawah buku catatan. Ubah jenis sel menjadi Markdown dan masukkan "Buat plot sebar" sebagai teks.
Tambahkan sel Kode dan tempelkan kode berikut, yang menggunakan Matplotlib untuk membuat plot sebar.
plt.scatter(yearsBase, meanBase) plt.title('scatter plot of mean temp difference vs year') plt.xlabel('years', fontsize=12) plt.ylabel('mean temp difference', fontsize=12) plt.show()
Klik Jalankan untuk menjalankan sel dan membuat plot sebar.
Plot sebar yang diproduksi oleh Matplotlib
Himpunan data yang Anda muat menggunakan rata-rata 30 tahun antara 1951 dan 1980 untuk menghitung suhu dasar untuk periode tersebut, lalu menggunakan suhu rata-rata 5 tahun untuk menghitung selisih antara rata-rata 5 tahun dan rata-rata 30 tahun untuk setiap tahunnya. Plot sebar menunjukkan perbedaan suhu tahunan.