Latihan - Lakukan Regresi Linier dengan Numpy

Selesai

Plot sebar menawarkan cara yang berguna untuk memvisualisasikan data, tetapi misalkan Anda ingin melapisi plot sebar dengan garis tren yang menunjukkan bagaimana data tren dari waktu ke waktu. Salah satu cara untuk menghitung garis tren tersebut adalah regresi linier. Dalam latihan ini, Anda akan menggunakan NumPy untuk melakukan regresi linier dan Matplotlib untuk menggambar garis tren dari data.

  1. Tempatkan kursor di sel kosong di bagian bawah buku catatan. Ubah jenis sel menjadi Markdown dan masukkan "Lakukan regresi linier dengan scikit-learn" sebagai teks.

  2. Tambahkan sel Kode dan tempelkan kode berikut. Luangkan waktu sejenak untuk membaca komentar (baris yang dimulai dengan tanda # ) untuk memahami apa yang dilakukan kode.

    # Creates a linear regression from the data points
    m,b = np.polyfit(yearsBase, meanBase, 1)
    
    # This is a simple y = mx + b line function
    def f(x):
        return m*x + b
    
    # This generates the same scatter plot as before, but adds a line plot using the function above
    plt.scatter(yearsBase, meanBase)
    plt.plot(yearsBase, f(yearsBase))
    plt.title('scatter plot of mean temp difference vs year')
    plt.xlabel('years', fontsize=12)
    plt.ylabel('mean temp difference', fontsize=12)
    plt.show()
    
    # Prints text to the screen showing the computed values of m and b
    print(' y = {0} * x + {1}'.format(m, b))
    plt.show()
    
  3. Sekarang jalankan sel untuk menampilkan plot sebar dengan garis regresi.

    Scatter plot with regression line.

    Menyebarkan plot dengan garis regresi

Dari garis regresi, Anda dapat melihat bahwa perbedaan antara suhu rata-rata 30 tahun dan suhu rata-rata 5 tahun meningkat dari waktu ke waktu. Sebagian besar pekerjaan komputasi yang diperlukan untuk menghasilkan garis regresi dilakukan oleh fungsi NumPy polyfit, yang menghitung nilai m dan b dalam persamaan y = mx + b.